EPG's BLOG

某金融会社の社内SE。気になったことをちょいちょい書いていきます

データサイエンス講義 1章「はじめに:データサイエンスとは」

自分の備忘録も兼ねて、そしてブログ継続に向けて。

 

対象の本。

 

データサイエンス講義

データサイエンス講義

 

 

 

1.3 なぜいまなのか

なぜ今、データサイエンスが注目を浴びてるのか。

データ収集が容易となり、データ関連製品(e.g. Amazonの推薦システム、Facebookの友達推薦)の構成要素となったため。

メモリやネットワーク技術の向上により、「データ化」が容易となることで、身の回りの様々な場面にて、データ収集が可能となったことが背景。

「データ化」:生活のあらゆる場面を取り出し、データに変換するプロセス(by Kenneth Neil Cukier, Viktor Mayer-Schoenberger)

 

1.4 現状(および多少の歴史)

データサイエンスは、統計学の単なる名前の付け替えであるという一説も。(Cosma Shalizi)

New "data scientist" is but old "statistician" writ large

 

1.4.1 データサイエンスの仕事

データサイエンティストに求められるスキルは以下。

・計算機科学、統計、通信、データ可視化の専門家であること

・特定分野での豊富な専門知識をもつ

⇒1人でこんなスキルを持っている人はなかなかいないので、チームを組むことがほとんど。

 

ちなみに、色々なページで必要なスキルについて紹介有。

 

①ビジネススキル、②ITスキル、③統計解析スキルが必要とのこと。

データサイエンティストに必要なスキル | IT業界職種研究 | IT転職 エージェント リーベル

 

こちらでは、①ビジネススキル、②DBスキル、③モデリングとのこと。

特別インタビュー 『データサイエンティストに必要なスキルとお客様の接点とは』 | ビッグデータ時代のソリューション探しとスキルアップのためのサイト

 

こちらは「データサイエンティスト養成読本」について。

『データサイエンティスト養成読本』はゼロからデータサイエンティストを目指す人なら絶対に読むべき一冊 - 銀座で働くData Scientistのブログ

 

1.7 データサイエンティストとは本当は何か

1.7.2 産業界

チーフデータサイエンティストは、データに関する事柄を全て決定。

(e.g.) データ収集の方法、データの利用方法、データから成果の導き方

また、①データから意味を抽出し、解釈する方法を知っている人であること、②統計や機械学習ツールや手法に精通していること。