· 

データ解析の精度を低下させる“罠”に要注意!

中小企業診断士 栗田 一正

 

 長らく「データを読むこと」の虜(とりこ)になっている私。きっかけは、ウェブサイトのアクセス解析ツールであるGoogleアナリティクスとの出会いでした。新聞記者や雑誌変種者時代、自分が担当した記事がどれくらいの人に読まれているかわからずにモヤモヤしていた私にとって、ユーザー数や読了率(最後まで読んでくれた人の割合)を知れるのは画期的でした。厳しい現実を突きつけられることもしばしばですが、そうした失敗を成功に糧にできるのも、データ解析の醍醐味だと感じています。

 

データは“事実の集まり”

 データは、“過去に起きた事実の集まり”です。昨日来店したお客さんの数、1カ月間のウェブサイトからの問い合わせ数、テレビ視聴率などは、いずれも既に起きた事実を数字で表したものです。そうした定量データだけでなく、「店主の雰囲気がいい」「日曜日は行列ができる」といったレビュー(口コミ)なども立派なデータ(定性データ)です。

 

 この事実の集合が、物事の本質をあぶり出します。私のバイブルである名著『ファクトフルネス』(ハンス・ロスリング、オーラ・ロスリング、アンナ・ロスリング・ロンランド著、日経BP社発行)では、多くの本質をデータから導き出しています。例えば、

「世界中の1歳児の中で、なんらかの病気に対して予防接種を受けている子供はどのくらいいるでしょう? A.20% B.50% C.80%」

の3択問題を出し、予想だにしなかった真実(C.80%)を示しました。データ(=事実)を読む力は、本質の見極めに大いに役立ちます。

 

データを正しく読むために

 前述のとおり、データは有用である一方、いとも簡単に読み誤る“罠”も多く潜んでいます。データを誤って読むとデータ解析の精度が極端に落ちるため、本質を見抜くことなど到底できません。ここからはデータを読み違えないために意識すべきことを紹介します。

 

(1)バイアスを排除する

バイアスは「偏った見方」を意味します。「バイアスがかかっている」と聞くことがあると思いますが、これは偏った思考や観点で物事を見ていることをいいます。これでは本質は見極められません。

 

バイアスの種類はさまざまです。そのうちデータ解析の精度を阻害するものとして、以下が挙げられます。

 

・確証バイアス

自分の主張の裏付けとなるデータだけをかき集めることです。例えば、自分が考えた企画を会議で通すために、プレゼン資料に自分の考えを支える良いデータだけを載せることが該当するでしょう。これでは課題やリスクの検討が疎かになり、本質を見失う要因になります。

ちなみに、巷でさまざまな企業がアンケート結果を発表していますが、明らかに自社サービスの訴求目的と思われるものが散見されます。確証バイアスに留意し、そうしたデータに踊らされたないことも大切です。

 

・サンプリングバイアス

「サンプリング」とは調査のための抜き取り(抽出)のことで、データの抜き取り方が不適切な場合をサンプリングバイアスをいいます。例えば、住みたい街ランキングの調査をする際、特定の都市の周辺ばかりでアンケートを取ることはサンプリングバイアスに該当します。

 

(2)ダーティーデータに徹底削除する

ダーティーデータとは「汚れたデータ(dirty data)」です。重複データ、古いデータ、誤ったデータなどを指します。たとえば、お客様アンケートで「東京都」と入力すべきところを「京都」と入力してしまうことがあるかもしれません。東京都と京都では大きな違いです。それに気づかずデータ解析をしても、有意義な解析結果は望めないのは想像に難くないでしょう。データ解析する際は、汚れを取り除いたクリーンなデータで実施するのが基本です。

 

(3)コンテキストに留意する

コンテキストとは「文脈」「前後関係」を意味します。データを読むときはこのコンテキストへの留意が必要です。たとえば、ウェブサイトのコンバージョン率(ウェブサイトの目的達成を示す数値)。「コンバージョン率1%」の数字だけをみると、悪くないと思うかもしれません。ところが、先月が「5%」だったらどうでしょう。目の前の数値だけで判断するのは適切ではありません。データは「点」ではなく「線」で読むことが重要です。

 

まとめ

適切なデータ解析を阻害する要因は少なくありません。目の前のデータを鵜呑みにせず、データに踊らされず、データの裏側まで読み解く。そうした意識を持って、データと向き合うことが、物事の本質や真実にたどり着くポイントです。

 

以上