ランダム変数の確率質量関数の決定
-
28-09-2019 - |
質問
離散ランダム変数xとx(n)に関連するデータがある場合、matlabでどのように確率質量関数pmf(x)を決定できますか?
解決
これを少なくとも8つの異なる方法で行うことができます(それらのいくつかは他のソリューションですでに言及されていました)。
離散ランダム変数からサンプルがあるとします。
X = randi([-9 9], [100 1]);
これらの同等のソリューションを考慮してください(考えられる値の範囲について何も想定していないことに注意してください。
[V,~,labels] = grp2idx(X);
mx = max(V);
%# TABULATE (internally uses HIST)
t = tabulate(V);
pmf1 = t(:, 3) ./ 100;
%# HIST (internally uses HISTC)
pmf2 = hist(V, mx)' ./ numel(V); %#'
%# HISTC
pmf3 = histc(V, 1:mx) ./ numel(V);
%# ACCUMARRAY
pmf4 = accumarray(V, 1) ./ numel(V);
%# SORT/FIND/DIFF
pmf5 = diff( find( [diff([0;sort(V)]) ; 1] ) ) ./ numel(V);
%# SORT/UNIQUE/DIFF
[~,idx] = unique( sort(V) );
pmf6 = diff([0;idx]) ./ numel(V);
%# ARRAYFUN
pmf7 = arrayfun(@(x) sum(V==x), 1:mx)' ./ numel(V); %#'
%# BSXFUN
pmf8 = sum( bsxfun(@eq, V, 1:mx) )' ./ numel(V); %#'
GRP2IDXは、のエントリに対応する1からのインデックスを取得するために使用されたことに注意してください pmf
(マッピングはによって与えられます labels
)。上記の結果は次のとおりです。
>> [labels pmf]
ans =
-9 0.03
-8 0.07
-7 0.04
-6 0.07
-5 0.03
-4 0.06
-3 0.05
-2 0.05
-1 0.06
0 0.05
1 0.04
2 0.07
3 0.03
4 0.09
5 0.08
6 0.02
7 0.03
8 0.08
9 0.05
他のヒント
MATLABからの次の抜粋 ドキュメンテーション ヒストグラムをプロットする方法を示します。離散確率関数の場合、 頻度分布 ヒストグラムと同一である可能性があります。
x = -4:0.1:4;
y = randn(10000,1);
n = hist(y,x);
pmf = n/sum(n);
plot(pmf,'o');
すべてのビン内のすべての要素の合計を計算します。すべてのビンを合計で分割して、PDFを取得します。すべての要素を追加して、PDFをテストします。結果は1つでなければなりません。
私が自分の声明で正しいことを願っています。それはそれから長い時間です...
この機能はどうですか?
function Y = pmf(X)
A=tabulate(X)
A(:,3)=A(:,3)/100
Y=A(:,3)'
これはあなたの意見では正しいですか?
別の配列を保存する必要がないように、機能ハンドルだけを作成してみてください。
pmf = @(x) arrayfun(@(y) nnz(DATA==y)/length(DATA),x);
さらに別のオプションを追加するには(必要なことを行うために利用できる機能が多数あるため)、関数を使用してPMFを簡単に計算できます。 アキュムレイ 離散値が0を超える整数の場合:
pmf = accumarray(X(:),1)./numel(X);
これが例です:
>> X = [1 1 1 1 2 2 2 3 3 4]; %# A sample distribution of values
>> pmf = accumarray(X(:),1)./numel(X) %# Compute the probability mass function
pmf =
0.4000 %# 1 occurs 40% of the time
0.3000 %# 2 occurs 30% of the time
0.2000 %# 3 occurs 20% of the time
0.1000 %# 4 occurs 10% of the time
私が正しく理解していた場合、あなたがする必要があることは、PDFを推定することですが、それは連続的ではなく離散値です。
x(n)の異なる値の発生を計算し、nで除算します。私が言っていることを説明するために、例を挙げてください。 10の観測があると仮定します。
X = [1 1 2 3 1 9 12 3 1 2]
その後、あなたのPMFは次のようになります:
pmf(X) = [0.4 0.2 0.2 0 0 0 0 0 0.1 0 0 0.1]
編集: これは原則として、 @Zellusも指摘しているように、周波数ヒストグラムです