Pythonで学ぶあたらしい統計学の教科書のまとめやコードを実行してみた際のメモです.
1. 統計学
統計学の目的
記述統計の目的:手持ちのデータを整理・要約する.
推測統計の目的:まだ手に入れていない未知のデータを推測する.
標本と母集団
標本:手持ちのデータのこと
母集団:まだ手に入れていない未知のデータを含んだ全てのデータ.
標本という一部のデータのみを用いて,母集団という全体について議論することが推測統計学の目的.
2. 標本が得られるプロセス
確率変数:確率的な法則に従って変化する値.
サンプリング(標本抽出):母集団から標本を得ること.
実現値:確率変数における具体的な値のこと.
単純ランダムサンプリング(ランダムサンプリング):母集団の一つ一つの要素が無作為に選ばれる選び方のこと.
サンプルサイズ:標本の大きさ(手持ちのデータの個数).大きい,小さいで表現する.
全数調査:母集団全体を調べる調査のこと.
標本調査:母集団の一部のみを調べる調査のこと.
3. 標本が得られるプロセスの抽象化
確率は probability の頭文字を取って P と表記する.あるデータが得られる確率 P(データ) と表記する.
確率分布:確率変数とそれに付与された確率との対応を表したもの.単に分布と略されることもある.
あるデータが,ある確率分布と対応している時,確率分布に従うと呼称する.
母集団分布:母集団が従う確率分布のこと.
ある母集団から単純ランダムサンプリングにより標本を一つ得る行為を,母集団分布に従う確率変数を一つ取得することとみなす.
無限母集団:無限の大きさを持つ母集団のこと.
母集団のイメージかつきにくくても,母集団分布さえ分かれば,未知のデータの推測が可能となる.
Pythonで学ぶあたらしい統計学の教科書に関する過去の投稿は以下です.
I 統計学の基礎
1. 統計学,2. 標本が得られるプロセス,3. 標本が得られるプロセスの抽象化
0 件のコメント :
コメントを投稿