中心極限定理とは何ですか?

中心極限定理とは何ですか?
Anonim

回答:

中心極限定理は、ある母集団に関連するある測定値の平均の推定値(あるサンプルから推定される)がサンプルのサイズが大きくなるにつれて向上するという直感的な考え方を厳密にします。

説明:

100本の木がある森を想像してみてください。

今では(非現実的に)メートルで測定した場合、それらの4分の1が高さ2、それらの4分の1が高さ4、それらの4分の1が高さが2であると想像してください。 5の高さ

フォレスト内のすべての木の高さを測定し、その情報を使用して適切に選択されたビンサイズ(例:1.5〜2.5、2.5〜3.5、3.5〜4.5、および5.5〜6.5)でヒストグラムを作成するとします。境界が属するビンですが、ここでは関係ありません。

ヒストグラムを使用して木の確率分布を推定できます。明らかに、それは普通のものではないでしょう。実際、エンドポイントが適切に選択されていれば、すべてのビンに指定された高さの1つに対応する同数のツリーが存在するため、均一なものになります。

今度は森に入って、たった2本の木の高さを測定することを想像してください。これら2本の木の平均の高さを計算し、それを書き留めます。サイズ2のサンプルの平均値の集合が得られるように、この操作を数回繰り返します。平均値の推定値のヒストグラムをプロットするとしたら、それは一様ではなくなります。代わりに、フォレスト内のすべての木の全体的な平均の高さ(この場合は、サイズ2のサンプルに基づく平均の推定)の方が多くなるでしょう。

#(2 + 3 + 4 + 5)/4 = 3.5# メートル)。

もっとあるだろう 平均の推定 近くに 真の人口の意味 (この非現実的な例では知られていますが)平均からかけ離れていない場合、この新しいヒストグラムの形状は正規分布に近くなります(平均付近にピークがあります)。

今度は、森の中に入って、3本の木の高さを測定し、それぞれの場合の平均値を計算して、それをメモしておくこと以外は練習を繰り返すことを想像してください。作成するヒストグラムでは、広がりが少なく、1つのサンプルから3つの木が選択され、すべてのエンドグループのいずれかから得られる可能性が非常に高くなります。背が高いか非常に短い---高さの選択と3本の木を選ぶよりも少ないです。平均サイズの推定値(3つの測定値に基づく各平均値)を含むヒストグラムの形状は、正規分布のそれに近くなり、対応する標準偏差(親母集団ではなく平均値の推定値)は次のようになります。小さいです。

4、5、6など、これを平均値あたりの木数で繰り返すと、構築するヒストグラムは、(平均値が大きいほど、標本サイズが大きくなるにつれて)正規分布のようになります。 の分布平均の推定 真の平均値に近づくほど、平均値の推定値の標準偏差は次第に狭くなります。

すべての木が測定される(退化した)場合(すべての場合で平均値を書き留めておく)について練習を繰り返すと、ヒストグラムはいずれかのビンの平均値だけを推定します。その「ヒストグラム」(から推定される確率分布)の標準偏差がゼロになるように、変動なしで(真の平均に対応するもの)。

そのため、中心極限定理は、ある母集団の平均のある推定値の平均が(親母集団の分布の標準偏差ではなく)真の平均値とその推定値の標準偏差に漸近的に近づくことに注意してください。サンプルサイズが大きくなるにつれて徐々に小さくなります。