こんにちは、学長です!
データサイエンスについて学びたいと思っているけども何から学んでいいのかわからない。
数字を見るのも苦手だし、全然理解できない、データサイエンスを学んだもののさっぱりわからない。と戸惑っている人のための超入門ページです。
- データを読むってどういうこと?
- データサイエンスってどんなことをやるの?
- データサイエンスの必須スキルってなに?
本サイトに興味を持っていただきありがとうございます。私は普段は医療データの分析の仕事をしています。
元々、薬学や心理学などを学び、その後に人間の感情から分析を行うインサイトと呼ばれる隠れた心理を分析する手法を習得しました。そして、現在は人間は何を求めているのか分析・報告するようなデータサイエンティストと呼ばれる職業についています。
データを読むってどういうこと?
本サイトのメインテーマは「データの読み方」です。
「データを読む」と言うことは数字そのものを読むだけではありません。数字の持つ特徴を理解して数字に隠されている事柄をいかに読むかが大切になります。ずーっと数字を見ていると、どこか情緒を感じながらあれこれってなんだろうといった違和感に気づくことがあります。
つまり、データが何を表現しているか読み解く作業がデータを読むと言う仕事です。
皆さんが働いている職場にはたくさんのビッグデータと呼ばれるものが眠っています。病院や診療所、薬局のデータの中にはありとあらゆるデータが眠っているということです。
データサイエンスって難しい?
データサイエンティストはなんだかすごく難しそうと思いますよね?
実は、高度で難しい統計学や最近流行の機械学習をPCを駆使してことがデータサイエンスだと勘違いしている人もたくさんいらっしゃいますが、それは大きな間違いです。データサイエンスとはAIのようなものだと説明されることがありますが、それだけを示す言葉ではありません。言葉そのままを分解すると紐解いていきます。データ+サイエンスなのでデータと科学が合わさったものなのです。
データは数値の集まりだと考えて下さい。もう一方のサイエンスはというと、その語源は知識と言う意味があります。したがって、データサイエンスとは数値の集まりについて知識を用いて扱う学問なのです。データを使って何かを知るといった程度の実は凄く広い意味を持つものなんですね。
データサイエンス=AIではあまりに意味が不明です。そもそもAIというものも本質的には人によってイメージが異なるのに大変危険です。
データサイエンスを学んだものの数学が苦手で挫折した経験を持っている方はこの抽象的な意味にとらわれすぎたのだと私は考えています。
データサイエンスの必須スキルとは?
ここから、データサイエンティストの必須スキルについてお話します。一つにロジカルシンキングなどの論理力思考力が必要です。その物事の本質を見極めるための観察力がとても重要になります。こうした学問の体系がデータサイエンスであり、思考力たものごとの本質を全体からみれるような経験を積んだ人がデータサイエンティストと呼ばれています。
本サイトを通じてデータサイエンティストは普段どのようにしてデータを読んでいるのか一緒に学んでいきましょう。データの読み方を通じてデータへの理解やデータの扱い方、データをそう分析するするのか。その着眼点が少しでも身に付いて、明日からデータをもっと深くまで勉強してみたいと思うことがこのサイトの目的です。
これまで、データサイエンティストに大切な必須のスキルをお伝えしました。ここからは、もっとも大切な物事の捉え方をお伝えします。データの読み方に関して最も大切な捉え方は、「データを疑ってかかる」ことです。人間をじーっくりと見て行動判断を疑うことです。
どうしてそんなことが必要なの?って思うかもしれません。
なぜならば、人間は誰しも思考の偏りを持っているからです。
無自覚に偏りがある?
誰しも自分が正しいと多少なりとも思い込んでいます。その認識が極めて強いほど思考の偏りが大きくなってしまいます。客観的な事実より自分が信じたい内容を信じようとしてしまいます。会社にとって、自分にとって、都合の良い数字しか目を向けなくなります。攻撃性をもつことすらあります。恐ろしいのは本人はもはや無自覚で自覚が全くないことです。
自分自身は昨日と特に変わらないで事実を直視して、合理的で理性的な判断を下していると思っています。会社の中でも凝り固まった人はこうなってしまいます。ヨーロッパの賢人たちはこれを「認知バイアス」と名づけました。
認知バイアスに騙されないらめには相手にこう問いて下さい。「その話は本当ですか?」そんな質問が必要です。
私は常に物事をフラットに見ましょうとお伝えしています。簡単に言うと適切に物事を読み取り、適切に分析し、適切に表現することが大切です。インプットとアウトプットのどれかが欠けてはいけません。
まとめるとデータサイエンティストに必要な力は「洞察力」・「思考力」・「論理力」を普段から働かせることです。
まとめ
データサイエンティストは普段どんな仕事をしているのか?ということですが、端的に言うと分析をしているだけです。
その分析は大きく分けて3つあることをお話しました。
➀「課題発見」➁「課題解決」➂「結果検証」です。
- 課題発見 : 変化を数字で表現してこれが理由じゃないかと言う仮説を立てる分析
- 課題解決 : 発見した課題に対してどうすれば良いかを考える分析
- 課題分析 : 物事を分解してなぜを考えること
以上のことを踏まえて初級編から開始していきましょう。