ビッグデータから経営戦略を変えるデータ分析のスペシャリスト
WEBサイトのアクセスログや、SNSの書き込み、ポイントカードの使用履歴――世の中に流通するデータは増え続けている。その膨大なデータはビッグデータと呼ばれ、いまや多くの企業にとって経営戦略上「ビッグデータの収集・分析」は欠かせない要素になりつつある。そのデータを収集・分析する専門家として注目が高まっているのがデータサイエンティストだ。その業務内容や求められる能力などについて、 iAnalysis代表・最高解析責任者 倉橋一成氏に話を聞いた。《理系ナビ13夏号 掲載記事》
「ビッグデータ」に注目が集まっています。すでにビッグデータを活用することでビジネスを優位に進めることに成功した企業も出始めており、ビッグデータの分析に本腰を入れる企業が、ここ1年ほどで急増しています。
一方、データ分析の専門家であるデータサイエンティストの数は圧倒的に足りていません。もともと、メーカーや製薬会社にはデータ分析の専門家は少数ながらいましたが、品質管理のための分析が主な目的。それが「ビジネスや経営戦略にデータ分析を活用する」という新たな目的が出てきましたし、ありとあらゆる業種の企業がデータ分析に力を入れ始めています。 データサイエンティストを外部から採用したり、社内で育てたりする動きが出てきていますが、企業のニーズにとても追いついていません。当面、データサイエンティストへの需要は高まる一方でしょう。
私がデータサイエンティストとして携わったプロジェクトの中で、自動車販売店を全国展開するディーラーから依頼を受け、売上を左右する要因を見つけ出したことがあります。
データを分析して売上に影響する要因を見つけ出し、さまざまな要因を組み込んでKPI(重要業績評価指標)を算出する数式を作りました。KPIが示す内容は都度変わってきますが、このケースではKPIが1ポイント増減すると販売店の売上が100万円増減するといった類の指標になるように設計しました。 このKPIは、自動車ディーラーの各店舗向けに発行されるレポートに掲載されるようになりました。「あなたの店舗のKPIはこうだから、ここの要因を改善すると売上が伸びるはずだ」と認知してもらうことで、各店舗による改善努力を促せたという手応えを得られました。
ほかには、WEB広告を配信するシステム開発会社を手伝ったこともあります。WEBサイトを閲覧するユーザーの性別や年代、趣味などの属性を推測して、最適な広告を配信しようと試みるシステムです。ユーザー属性を推測する精度が高くなれば、よりユーザーにとって有用な広告を配信できるようになりますから、広告の価値が上がります。
このプロジェクトでは、性別を予測するモデルを改善しました。従来はWEBサイトの閲覧履歴だけから推測していましたが、検索エンジンに入力するワードが性別と強い相関があることを突き止めました。閲覧履歴と検索履歴を組み合わせるようにしたことで、正解率が60%程度だった性別の予測モデルを正解率95%ほどにまで改善できたのです。
データサイエンティストに求められるのは、データの分析だけではありません。「業績を改善するためにデータを活用する」という方針は定まっていても、具体的にどんなデータをどう分析すれば企業の業績にプラスに働くのか、見通しが立っていない企業も多いのです。
従って、データサイエンティストはまず企業の事業を理解し、「このようなデータを収集して分析すれば企業活動を改善できる」とコンサルティングするところから入ることもあります。分析の目処が立ったところで、分析に必要なデータをどのような形で取り出してほしいとシステム担当者に依頼するための設計書を作成します。そしてデータを分析して何らかの法則性を見出したら、それを予測モデルに落とし込みます。プロジェクトの状況については企業の担当者に都度報告し、PDCA(Plan・Do・Check・Action)を回して一つずつ課題をクリアしながらゴールを目指していきます。
業務を遂行する上で、必要な能力は大きく三つあります。「ビジネス視点」、「ITエンジニアリング」、「(統計学的)学問知識」です。
まず、「データ分析をどうビジネスに活用するか」という見通しを立てるところから入ることが多いため、「ビジネス視点」は不可欠です。例えば自動車ディーラーの販売店のことに詳しければ、売上を伸ばす要因について推測しやすくなりますから、データ分析をする上で勘所をつかみやすくなります。
そして「ITエンジニアリング」。企業が持っているデータを、分析しやすいように抽出・成形するスキルです。企業が顧客データを保存しているデータベースに詳しくないと「こういった形ではデータを引き出せるが、ああいう形では引き出せない」といった判断が付きません。それから取り出したデータを、Excelのような表計算ソフトや統計解析ソフト「R」などを使って処理するスキルも必要になります。 最後に、そうして準備したデータを数理・統計的な「学問知識」を活かして予測モデルを構築するなど、統計の専門家としての力が求められます。
これら三つの能力については、どれかひとつに自分の専門性を置きつつ、残り二つは最低限のスキルさえ備えておけば十分です。どれも100%備えていないといけない、といったことはありません。
ただ、能力以上に大切なのは「データから何かを読み取りたい。隠された事実を発見したい」という想いです。統計を学んでおくと有利になりますが、学生時代の専攻は問いません。
できれば学生時代に、データを使って何らかの考察をする経験を積んでおいてほしいですね。「仮説を考えてデータから検証した」といった経験が大事です。データは研究論文のものや、WEBで公開されている様々なデータでも大丈夫です。
そういった経験があると短時間で業務に慣れられますし、そういった考察が得意な人に、ぜひデータサイエンティストになってほしいものです。
■協力:倉橋 一成(くらはし・いっせい)アイアナリシス合同会社代表・最高解析責任者
理系ナビ会員になると各種セミナーをはじめとした会員限定サービスをすべて無料で利用できます。