◇データサイエンティストはデータから有効な情報をいかに巧みに引き出せるかが腕の見せ所です。そこには、与えられたデータに対して、統計学の手法や情報処理技術を活用することが必要とされますが、まずは利用できるデータをどのように的確に収集できるかが第1歩となります。
◇データは日常の不断の活動の結果として膨大に生み出されていますが、行政における政策の企画・立案や企業経営・投資の意思決定で広く活用されている最も重要なデータは統計データです。
◇本書は、統計データに焦点を当てて、統計データがどのように作成されているかについて、その理論と実際を解説しており、他に類書がないと言っても過言ではありません。
◇編集 総務省統計研究研修所
◇内容 第1章 標本と母集団
・標本データの意味
・相対度数から確率へ
・標本と母集団の代表値
・不確実性の表現(確率変数)
・確率分布 ―分布を知るメリット―
第2章 データの性質と代表値
・正規分布の意味 ―誤差の分布―
・正規分布の実例 ―体格や年齢ごとの人数・割合―
・多峰分布の区分 ―持ち家と借家を区別する―
・標準正規分布 ―大きさの違う分布を比較する―
・中心極限定理 ―どのような分布でも標本平均は正規分布―
第3章 データの分布と相関
・一様分布 ―乱数の値―
・二項分布 ―コインの表の出現率―
・ポアソン分布 ―到着間隔別人数―
・指数分布 ―レジでの顧客の行列―
・t分布 ―小標本で使う分布―
第4章 データの見方
・標本誤差と非標本誤差
・標本抽出
・標本データから母集団の特徴を探る
・母集団の値を含む区間を推定する
・標本の大きさの決め方
第5章 行政運営のための公的統計
・母集団の作り方
・標本抽出の実務
・調査の実際
・データの整理
・結果の推定
◇A5判 250ページ