質問

私には非常に基本的な質問があります。通常の確率プロットの基礎は何ですか?つまり、確率は何を表していますか?標準的な正規分布をテストしています。じぶんの normplot (MATLABで)は、値が直線で多かれ少なかれであるが、0.5の確率がゼロ以外の値に対応していることを明らかにしました。

私の質問は、これをどのように解釈するのですか?これは、私のデータが正常に分布しているが、ゼロ以外の平均(つまり標準的な正常ではない)を持っていることを意味しますか、それともこの確率は他の何かのみを反映していますか?私はGoogleを試してみましたが、あるリンクは、確率はZテーブルの累積確率であると言いましたが、それをどうするかはわかりません。

また、Matlabでは、値がプログラム(赤い点線)によって描かれたラインに適合している限り、値は正規分布から来るということですか?私のグラフの1つでは、点線は非常に急勾配ですが、値は収まります。これは、この行の外側にある1つまたは2つの値がただの外れ値であることを意味しますか?

私は統計が非常に初めてなので、助けてください!

ありがとう!

役に立ちましたか?

解決

私の質問は、これをどのように解釈するのですか?これは、私のデータが正常に分布しているが、ゼロ以外の平均(つまり標準的な正常ではない)を持っていることを意味しますか、それともこの確率は他の何かのみを反映していますか?

あなたは正しいです。 normplotを実行し、適合行に非常に近いデータを取得すると、データには 累積分布関数 それは正規分布に非常に近いです。 0.5 CDFポイントは、適合正規分布の平均値に対応します。 (あなたの場合は約0.002のように見えます)

直線が得られる理由は、y軸が非線形であり、完全なガウス累積分布が線にマッピングされるように「歪んでいる」ように作られているためです。 エラー関数.

端を見て、フィットした線よりも急勾配の勾配がある場合、それはあなたの分布が正規分布よりも短い尾を持っていることを意味します。つまり、平均からの過度の変動を防ぐ物理的な制約のために、外れ値が少ないことを意味します。

他のヒント

正規分布は密度関数です。単一の値の確率は0になります。これは、無限の数の値(連続関数)の間に合計確率(= 1)が分布しているためです。

(正規分布の)グラフにあるのは、値(x軸)の周りに確率(y軸)がどのように分布するかです。したがって、グラフから取得できるのは、2ポイントから任意のポイントまで、または任意のポイントから +finteまでの間隔の確率です。この確率は、ポイント1からポイント2に定義された(正規分布の)関数を統合して得られます。

ただし、Zテーブルがあるため、この積分を行う必要はありません。 Zテーブルは、xが-infiniteとxの間にある確率を与えます(xをzに関連付ける方程式を適用します)

私はここにMatlabを持っていませんが、あなたが言及した直線は累積分布関数であると思います。 -infiniteからxの値まで(またはzテーブルで取得)

私の英語が悪い場合は申し訳ありません。私は助けになったことを願っています。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top