統計学の専門家によるビジネス書が異例のヒットを続けている。25万部を突破したその本のタイトルはズバリ、『統計学が最強の学問である』。ビッグデータ時代を迎えた今、企業経営にとって必要な統計学的センスとは何か。著者の西内啓氏に聞いた。
- プロフィール
- にしうち・ひろむ●1981年生まれ。東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在はデータに基づいて社会にイノベーションを起こすためのさまざまなプロジェクトにおいて調査、分析、システム開発および戦略立案をコンサルティングする。著書に『サラリーマンの悩みのほとんどにはすでに学問的な「答え」が出ている』(マイナビ新書)、『世界一やさしくわかる医療統計』(秀和システム)など。
西内 啓 氏
──この本を書いたきっかけは。
西内 統計を実際に社会で使うためには、「何を解析するか」という社会科学的な視点が実は重要です。たとえば私が研究していた公衆衛生学の分野では、統計を通じて「タバコが体に悪い」「野菜の摂取は健康に良い」などの事柄をある程度明らかにすることはできますが、その先どのように人々の行動の変化を促すかという課題については、心理学や経済学、マーケティング・マネジメント論など社会や人間についての知恵が必要です。これまではそうした社会科学の知恵をできるだけ分かりやすく伝える目的で書いたものがほとんどで、統計学そのものについて論じる一般向けの本は書いたことがありませんでしたが、たまたま編集者の方から、「持っているなかで一番強いカードを直球でいきましょう」と勧められたのがこの本を書く一つ目のきっかけになりました。
──それ以外にも?
西内 最近話題の「ビッグデータ」に関するニュースを見ていて、「面白い」と感じるものが少ないことに気付いたからです。統計学の専門家として、ビッグデータの先にあるもの、それでできることとできないことは何となく分かっていますが、そうした基盤となる教養が日本であまり共有されていないのでは、と感じたのかもしれません。統計学を知っていれば別に「ビッグ」なデータでなくとも分かることはあるし、実はそっちの方が強力なツールになり得る、という話を伝えたいと思ったのが、執筆のもう一つの大きな理由になりました。
──確かに「ビッグデータ」は少々話題先行のような気もします。
西内 大企業にも「ビッグデータの処理に乗り遅れないためにハードやソフトに投資し、ちょっとしたコンサルにも相談し、部署を新設してまで頑張ってみたけれど、結局何をしていいのかわからなかった」という部門責任者の方が結構いらっしゃいます。そうした方々から、「この人に頼めばいいんだ」とコンサルティングの依頼を受けることも多くなりました。
単なる「集計」ではダメ
──そもそもなぜ統計学は最強なのですか。
西内 これまでさまざまな分野でその正否に関して「論」が交わされてきたと思いますが、日本には「論より証拠」という素晴らしいことわざがあります。現代の社会科学において最も重視される証拠は統計学によって確立されます。これはソフトバンクの人事部長として活躍されていた小宮謙一さんがおっしゃっていたのですが、たとえば新卒採用で行われる適性検査「SPI」も統計学的にデータを分析してみると面白いことが分かります。SPIで高得点をとった人は賢い、賢い人は仕事もできるだろう、という論にもとづいて学生を採用するのは確かに合理的ですが、実際に入社時のSPIの得点の高低と、入社後に挙げた実績を比べてみると、あまり関連性がないという結果が出たそうです。このように今では、最終的な判断や自説の実証に統計学を活用するのが一般的になりつつあります。しかもこれは心理学者であろうが経済学者であろうが、ありとあらゆる分野にあてはまります。そうした現状を端的に表す言葉として、「最強の学問」という言葉を使いました。
──著書の冒頭で説明されていたあみだくじの例には、なるほどと思わされました。
西内 コインでいえば、10枚投げて全部表になる確率、あるいは全部裏になる確率よりも、5枚ずつのほうが確率は高いですよね。それと同じようにあみだくじも基本的には右に行くか左に行くか半々の確率で進むのを繰り返すわけですから、横の線をどのように書き加えようと、最終的には選んだ線の真下にたどり着くケースが一番多くなります。ですので、当たりの場所が前もって自分だけ分かっていて、ほかの人に自由に横棒を加えてもらうようなあみだくじのやり方の場合、当たりの真上の線を選択すれば他のプレーヤーより優位に立つことができるのです(『戦略経営者』2013年7月号73頁・図表1参照)。世の中には、公共工事の入札で「同条件なら最後はあみだくじで決める」としている地方自治体もあると聞いていますが、この知識の有無で結果は違ってくるかもしれません。
──中小企業の経営者も基本的な統計の知識は必要ですね。
西内 そうですね。しかし日本の経営者や従業員にとって、基本的なレベルでの統計学はすでにおなじみのものです。たとえば世界中のビジネススクールで「Kaizen」として必ず教えられているトヨタのカイゼン。これは工場のラインで働いている作業員一人ひとりが生産量や不良品率のデータなどを詳細に集計して定期的に持ち寄り、「どの工程が生産性向上を妨げているか」「不良品が発生する原因は何か」を話し合って解決するというやり方ですが、これは何もトヨタに限ってのことだけではなく、小さな町工場を含む日本のありとあらゆる生産現場で実践されている取り組みです。しかしこれを単なる集計で終えるのではなく、次の一歩に踏み出すことが今求められているのです。
──「集計」だけに終わらせない、とは?
西内 カイゼンの例でいえば、不良品率の低下など何かしらの現状を改善していきたい、と考えたときに、うまくいった状況といかなかった状況の2つのグループに分け、その2つのグループのデータにどのような違いがあるのか、というところを分析することで統計学の強みが出てくるということです。たとえば営業活動でうまくいった状況といかなかった状況を分けて分析した場合、大企業ではなく中小企業へ集中的に足を運んでいる営業スタッフの方が1回あたりの成約率・額をあげているという結果が出るとします。その結果から、営業先の選定や人脈づくりについての戦略的な施策を部門全体として打つことができるようになるでしょう。
サンプル調査の有効性
──本書はビッグデータの流行に対する一種のアンチテーゼでもありますが、その点についてどのようにお考えですか。
西内 データを集める、と言葉では簡単に言えますが、実際に行うのはすごく大変なことです。ほんの一昔前までは紙に記入してすべて手作業で集計する必要がありました。しかし今ではちょっとウェブサイトにアクセスして情報を集めたり、ネット上でのアンケートを利用したり、センサーのデータを蓄積したりすれば、無限とは言わないまでも極めて大量のデータを瞬時に操作することができます。これをいわゆるビッグデータと呼んでいて、スマホなどに付いているGPS機能が身近な例といえるでしょう。GPS機能を使うと5分おきに自分がどこにいたか、という大量のデータを蓄積することができますが、大事なポイントは、そこからいったい経営者が何を見いだそうとしているのかということ。仮に従業員の位置が分かったとしても、そこから得られる情報は各自の移動距離や移動時間とその総計で、実はそれ以上のことは見いだせません。経営者としての目指すべきゴールは利益をあげることですから、それらの大量のデータのうち何が利益とつながっていそうか、という社長の視点がとても重要になってくるのです。もっとも、GPSデータを分析した結果、ずっと動きまわる従業員よりも、時間帯をねらってちょくちょく休んでいる従業員のほうが成約率が高いという結論が導かれる可能性もありますが(笑)。
──そもそもデータは「ビッグ」でなくても十分な力を発揮すると主張されています。
西内 サンプル調査の有効性についてですね。たとえば日本人の人口約1億人のうち1万人を調査して、6,000人がある傾向を持っているということが分かったとします。このように対象の一部分を選んだ場合、「選んだ6,000人がたまたま偏った考え方を持っていた可能性もあるのでは」という疑問を述べる人が必ずいます。しかし調査の対象をちゃんとランダムに選んでいる限り、その1万人だけが偏っているという確率は極めて低く、せいぜい0.1%程度のずれにすぎません(『戦略経営者』2013年7月号74頁・図表2参照)。その0.1%にものすごく事業上のリスクがあるという企業以外は、ランダムに抽出したデータによるサンプル調査での解析のほうが利便性も高いですし、コストも安く済むのです。ビッグデータを処理するための最新型高速サーバーへの投資はまだまだ高額ですからね。
──ランダムに選んだデータをマーケティングに活用するひとつの事例が、著書の中でも触れられていた「A/Bテスト」です。
西内 たとえばDMを送るときにどういうデザインがいいか、ということはやってみないと分からないことです。そこで凝ったデザインと良質な紙を使った高級感あふれるDMが果たして本当に効果があるのか、ということを小規模に試してみるのです。たとえば1万通送る予定だとしたら、「新しい高級DM」「従来通りのDM」を100通ずつ、ランダムに選んだ顧客に送り、その結果をデータにとります。そうすれば、新しいDMが売り上げや問い合わせの増加につながるのか、その一方でまったく意味がないのか、ということを確認することができるでしょう。デザインや機能などAパターンとBパターンを両方試してみて比較するこうしたテストのことをA/Bテストと呼んでいます。ちなみにこのようなデータの取り方を専門的にはランダム化比較実験といいます。
──それまでやっていたことに意味がなかったということも明らかになると。
西内 はい。たとえば私がデータ分析をお手伝いしたある小売企業では、プレゼントキャンペーンを案内するDMを送っていました。当然、キャンペーン開催による集客力の向上をねらっていたのですが、実際プレゼントありとプレゼントなしの2パターンのDMを出して比較してみると、その差はまったくないことが分かったのです。送られた側に「あのお店からのDMが来たな」と意識させられるかどうかという効果が重要で、プレゼントが欲しくて注文した顧客はそもそも少なかったという結果になりました。もう少し言えば、その事例では、DMを送って反応がいい人と悪い人の違いが誤差の範囲を超えて確実に明らかになる解析結果が出ました。そうした分析ができたことで、その条件に従ってDMを送り分けたことで、コストを削減しつつ売り上げをアップさせることに成功したのです。
──統計分析を前提にしたトライ&エラーが有効ということですね。
西内 はい。しかもこれは意思決定まで時間がかかる大企業よりも中小企業により適しているといえますね。たとえば米国のジョーアンファブリック社という手芸用品をネット通販している会社は、サイト上で複数のプロモーション案をランダムに試した結果、「ミシンを2台買ったら1割引き」というキャンペーンをヒットさせ、顧客1人あたりの売上高を3倍にすることに成功しました。
──統計的思考を積極的に取り入れることが必要になります。
西内 好むと好まざるを得ず、競合相手や取引先は少しずつデータを武器にしてくるでしょう。たとえば倉庫業を営んでいる企業を例にとると、「在庫リスクを減らすためにはどうしたらいいか」ということをクライアント側がすでに実行に移し始めています。そのままでは売り上げが減るだけですが、うまくデータを活用すればそんなピンチをチャンスに変えていくこともできるかもしれません。中小企業の経営者の方には、いち早く統計学を取り入れて、少しでも競争に優位な立場になってくれればと思います。
(インタビュー・構成/本誌・植松啓介)