データサイエンス講義 1章「はじめに:データサイエンスとは」
自分の備忘録も兼ねて、そしてブログ継続に向けて。
対象の本。
- 作者: Rachel Schutt,Cathy O'Neil,瀬戸山雅人,石井弓美子,河内崇,河内真理子,古畠敦,木下哲也,竹田正和,佐藤正士,望月啓充
- 出版社/メーカー: オライリージャパン
- 発売日: 2014/10/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
1.3 なぜいまなのか
なぜ今、データサイエンスが注目を浴びてるのか。
データ収集が容易となり、データ関連製品(e.g. Amazonの推薦システム、Facebookの友達推薦)の構成要素となったため。
メモリやネットワーク技術の向上により、「データ化」が容易となることで、身の回りの様々な場面にて、データ収集が可能となったことが背景。
「データ化」:生活のあらゆる場面を取り出し、データに変換するプロセス(by Kenneth Neil Cukier, Viktor Mayer-Schoenberger)
1.4 現状(および多少の歴史)
データサイエンスは、統計学の単なる名前の付け替えであるという一説も。(Cosma Shalizi)
New "data scientist" is but old "statistician" writ large
1.4.1 データサイエンスの仕事
データサイエンティストに求められるスキルは以下。
・計算機科学、統計、通信、データ可視化の専門家であること
・特定分野での豊富な専門知識をもつ
⇒1人でこんなスキルを持っている人はなかなかいないので、チームを組むことがほとんど。
ちなみに、色々なページで必要なスキルについて紹介有。
①ビジネススキル、②ITスキル、③統計解析スキルが必要とのこと。
データサイエンティストに必要なスキル | IT業界職種研究 | IT転職 エージェント リーベル
こちらでは、①ビジネススキル、②DBスキル、③モデリングとのこと。
特別インタビュー 『データサイエンティストに必要なスキルとお客様の接点とは』 | ビッグデータ時代のソリューション探しとスキルアップのためのサイト
こちらは「データサイエンティスト養成読本」について。
『データサイエンティスト養成読本』はゼロからデータサイエンティストを目指す人なら絶対に読むべき一冊 - 銀座で働くData Scientistのブログ
1.7 データサイエンティストとは本当は何か
1.7.2 産業界
チーフデータサイエンティストは、データに関する事柄を全て決定。
(e.g.) データ収集の方法、データの利用方法、データから成果の導き方
また、①データから意味を抽出し、解釈する方法を知っている人であること、②統計や機械学習のツールや手法に精通していること。