資料

データ解析に関するスライド資料や解説文を雑然と置いています。また、著名な文献へのリンクも貼っています。

データサイエンス・リテラシー教材

※数学・統計学・プロラミング等の予備知識がほぼ不要な資料です(多少は必要な場合あり)。

・「データサイエンス入門 ~プロ野球で学ぶデータ解析~」

 プロ野球(主として、中日ドラゴンズやマスコットのドアラ)に関するデータを題材に、データ利活用の入門的な話を概説。

 スライド:Dragons.pdf

・「データ分析と可視化」

 様々なグラフ・チャートを紹介。また、プログラミング未経験者向けに、双方向性のあるグラフをPythonのPlotlyパッケージを使用して作成する方法も紹介。

 スライド:DataVL.pdf
 付属ファイルの説明:README.TXT
 付属ファイル:DataVL1.txt DataVL1.ipynb  example.xlsx example.csv  DataVL2.txt DataVL2.ipynb  DataVL.xlsx

スライド資料(PDFファイル)

※大学の理系低年次レベルの数学の予備知識を仮定した資料です。

単回帰分析

重回帰分析

主成分分析(2次元版)

主成分分析(一般の次元)

因子分析

解説文(PDFファイル)

※大学の理系低年次レベルの数学の予備知識を仮定した資料です。

回帰分析 ~線形代数の視点から~

単回帰モデルの確率論的取り扱い

主成分分析と行列の特異値分解

イチロー選手(統計的検定)

※高校生レベルの数学の予備知識を仮定した資料です。

高校数学で理解する感染症の数理

著名な文献(リンク)

・R. A. Fisher, "The use of multiple measurements in taxonomic problems", Annals of Eugenics, Vol. 7, No. 2, 179–188, 1936.

 アヤメのデータの分析。Edgar Andersonが計測したデータを、統計学者のRonald Fisherが解析して有名になったため、「フィッシャーのアヤメ」として知られている。

・Student, "The Probable Error of a Mean", Biometrika, Vol. 6, No. 1, 1–25, 1908.

 いわゆる「スチューデントのt分布」についての論文。Guinness Brewery(ギネスビール)のWilliam Sealy GossetがStudentというペンネームで執筆。

・J. Durbin,  "The Fitting of Time-Series Models", Institute of Statistics mimeo series No. 244, 1959.

 時系列解析で最も基本的なモデルである自己回帰モデルを扱った論文。パラメータ推定のための、いわゆるLevinson–Durbinのアルゴリズムについて書かれている。

▲このページのトップへ