2017年7月6日木曜日

20170706データサイエンティスト

早稲田大学データサイエンス研究所のシンポジウム:「データサイエンスの新展開」に参加





<オープニング>
ビジネスにおける意思決定にデータサイエンスは重要な役割を果たす。
ガートナーのパイプサイクルでは「機械学習」などは期待が過剰に先行している段階。これから幻滅期に入って期待は下がるが、そこから再び上がるタイミングが普及するとき。
ガートナー2016年8月25日プレスリリースより

今回はシンポジウムだが、成果報告会も予定している。

「基本に立ち戻る「実験計画法と回帰分析」」(早稲田大学 永田氏)
  • 入力x、出力yがあった時、データモデリングはデータから回帰分析してブラックボックスの中身を推定する。アルゴリズムモデリングはディシジョンツリーやニューラルネットなど使って中身にはこだわらない。昔は前者が圧倒的に多かったが、最近は後者が増えてきている。
  • 回帰分析は予測には役に立つが、要因分析や制御には向かない。未知の観測されていない変数が存在しうる以上、観測できた事象からの判断になってしまう。
  • 実験計画法で説明変数が無相関になるように組み合わせて実験することで、効率的に最適組み合わせに到達できる。
  • フィッシャーの3原則(局所管理・ランダム・反復)によく注意して計画すべし。


「ビッグデータの競争優位」(アクセンチュア 石川氏)
  • データ爆発と呼ばれるくらい情報量が増えてきている。シェークスピアの時代に一生かけて得た情報量を今の時代は1週間で手に入る。
  • 消費者は「情報疲れ」「企業間の品質差の極少化」「モノ所有の価値意識低下」によって購買に無関心になりつつある。消費者の6割は商品自体に興味を持たず、他社商品との比較もしないで購買している。新興国では3~4割だか先進国になると無関心の割合が高まる。
  • 利用して良かったらお金を払うというモデルの場合、年齢差関係なく5割以上の人が追加支払いに同意している。モノではなくて成果を売るビジネスが成長しつつあると見ている。
  • モノとサービスを組み合わせて成果を売るビジネスになる場合、顧客理解を深く行わなくてはならない。モノを売るだけの場合は、モノと人をマッチングさせれば良かったが、情報を理解することが鍵になっている。
  • ミシュラン:タイヤのモノ売りから、使った分だけ支払う形にした。運送業の顧客に対し、タイヤのデータを解析しながら人件費や燃費改善のアドバイスを提供した。クライアントの運用コストを最適化した結果、ミシュランの利益率も上がった。
  • GE;航空機のエンジン販売から、遠隔保守へ、そして使った分だけ支払うという形に変えた。顧客企業の燃料費を1%削減するだけで大きな金額になる(Power of 1%)を実現している。時間に焦って最初飛ばして、その後は減速するといった飛行では燃費が悪くなるが、それを最適化して提案できる。
  • バルセロナの劇場:観客の顔をモニタリングし、1回笑う毎に課金して最大24ユーロという取り組みもなされている。どこで何人がどれだけ笑ったかのデータも取れている。
  • ノバルティス:GILENYAなど患者のコミュニティで薬と向き合い、カウンセリングを提供するパーソナライズサービスを提供している。
  • amazonalexaはリッチな対話ログデータから個人行動パターンを把握し、潜在的な課題を抽出し、心情を把握している。
  • イノベーター理論のように、キャズムを超えてマジョリティに普及するのではなく、頭で一気に普及するくらいスピードが高まっている。
  • 日本企業はデジタル化の重要性については55%が強く同意している一方で、今後12ヶ月でライバルが市場を一変させるような製品を出すと想定している企業は16%しかない(海外平均は62%)スピード感はこれで良いのか・・・


<大事なこと>
  1. デマンド起点:消費の無関心化が進んでいる顧客の求めている価値を理解してフォーカスすべきポイントを見つける。
  2. エコシステム:多面的に求められている時代。自前にこだわらず、外部とアライアンスを組んでスピーディに成果を出す。
  3. 経営の高速化:サービスの陳腐化のスピードは早い。出遅れは致命的。フィードバックを得ながら高速に進化する。



2020とその先の社会に貢献する情報技術~NTT R&Dの取り組みを事例に」(NTT サービスイノベーション総合研究所 川添氏)
  • corevoNTTAIサービスの名称「ワトソンほど有名ではないですが・・・」
  • ロボット:ネットワークに繋がったロボットの制御をNTTは長年取り組んできた。実はロボット+ディスプレイなど複数の種類を同時に統合的に制御するのは難しい。それを実現するR-env連舞を開発した。
  • セキュリティ:ゲノム情報のようなプライバシーの高い情報も暗号化したまま分析することを可能にした。ログ分析エンジンでは連続したデータの流れを読み、マルウェアに感染した端末からのトラフィックを検出できる。
  • リアルタイムブッグデータ分析:故障をいかに素早く検知するかは、正常を理解して外れ値を探すスピードになる。テキストログと数値ログを合わせて解析する。
  • 移動軌跡分析・目的地予測:移動中にどこを目指しているのかを予測できる。
  • SAP+京福バスの事例:運転手のhitoeというウェアラブル端末シャツを着てもらい、生体情報・車両情報・環境情報からバスの運転を安全に最適化した。
  • 福岡市の事例:外国人観光客向けに無料wi-fiのアプリを使って行動を把握したところ、「深夜に中洲にイタリアンを食べに行く台湾からの旅行客が多い」などの情報を得ることができた。
  • 羽田国際線ターミナルの事例:混雑状況や人の流れを検出し、空いているゲートをモニタに移して誘導する実験を行なっている。
  • Kirari!:感動を共有・伝播するために、感動するポイントだけを送り届けるコンセプトで作られた。スポーツ選手だけを切り抜いて映像を転送したりできる。ニコニコ超会議では初音ミクと中村獅童の共演を実現した。ボカロクラスタと歌舞伎クラスタのコラボを実現させ、マッチングアワードも頂いた。(ニコ動のコメントには「日本最大級の電話屋さんありがとう」と流れてた)



「約6000万人の購買データを利用したデータベース・マーケティング」(CCCマーケティング 田代氏)
  • レンタルのツタヤの裏ではデータを着実に集めていた。購買する雑誌は買い手のライフスタイルをダイレクトに反映しているため、本の店舗展開をしっかり行なっている。
  • レンタルの会員証は13年前で2000万を超えていた。今でも年間で400万人増えている。重複なし年1回は活動している人で6000万人を超えている。これだけのリアルなデータがあるのが強み。
  • 当然、カードに消費者が記入した情報だけで全てが分かるわけではない。既婚か未婚かは直接には分からないが、購買データから分析してデータを埋めることができる。
  • このようにして消費者の特性を267項目に分けて、ライフスタイルを分析して商品やサービスとのマッチングを行なっている。(267項目のグラフパターンをDNAと呼んでいる)これによって、安室奈美恵ファンが好む商品やAKBファンが好む商品などをリストアップできる。
  • 消費者物価指数は全てを丸め込んでしまっているが、ツタヤのポイントから算出すれば細分化して調査可能な上に実購買に基づく集計ができ、市場予測アナリストに利用いただいている。
  • テレビ視聴でポイントが貯まる仕組みを取り入れた結果、テレビをどの時間帯に見ているか、ライブか録画かのデータも取れるようになった。これによって、ターゲット顧客に対してどの時間帯・曜日のCM枠が最適化をより細かく提案できるようになった。もはやF1層などと言っている時代ではない。
  • お茶の事例:マス広告を売って発売日の翌日に詳細データを解析して、購買した消費者にデジタル広告をピンポイントで届けるプロジェクトを行った。事前に仮説を立ててクラスターを予測しておいた。どのクラスタが継続購買を始めたかで売り上げが左右される。
  • Facebookの事例:ネット販売の企業はネット上の行動しかデータを持っていない。ここにツタヤのリアルのデータを組み合わせることで、よりユーザーの嗜好にマッチした提案ができるようになった。
  • 消費者を細かく分析できているので「スーパーマーケットに来たことがない人向け」に絞ってクーポンを発行することもできる。従来は地域にばら撒くなどであったので大きな値引きもできなかったが、優良な対象に絞り込むことで太っ腹なクーポンを提供でき、来店者を増やすことができた。
  • 共催したイベントではカードを持っている来場者の行動を分析することで、ブースの評判なども細かく提供することができた。



パネル討論:「ビッグデータ・データサイエンスの今後と期待すること」
(司会)早稲田大学商学学術院 教授 守口氏

  • 石川氏:データを活用する目的は何か?価値をどこに置くかを定義して置くことが大事。Amazon型のように無駄を省きたいなら、大量のデータを保有して効率よく処理する必要がある。Nike+のように体験を価値化したいなら消費者に深く入り込むデータが必要になる。
  • 川添氏:データサイエンティストは足りないが、セキュリティの分野でも人は足りない。セキュリティの場合は初級・中級・上級と分けて、ある程度できる人(裾野)を増やしながら上を増やして行くやり方を取っている。
  • 田代氏:新卒にゼロベースで教育しなくてはならないが、そもそもデータを活用している側も裏にある原理や真実をしっかり理解しないまま、テクニックが上手な集計屋さんが増えている。きちんと統計を理解している人にビジネスを教えていきたい。
  • 石川氏:仮説検証は大事だが、仮設の場合に「あったらいいのにな(Will)」のレベルの仮設まで広げて考えることが重要。できることの中から仮説を考えていても枠が狭い。
  • 永田氏:A/Bテストが流行っているが、実行するなら最終段階。最初の段階は把握していない要因が多すぎるので、使うべきフェーズを間違えないこと
  • 石川氏:データを活用するときはどうマネタイズするかが重要。1つはコスト削減につなげるやり方で、こちらは分かりやすいし進みやすい。2つ目は新たな収益を生む儲け方のデザインを行うこと。こちらは発想がついてこなくてなかなかできない。トータルとして儲かる事業・圧倒的な成長を実現する事業をデザインしていかなくてはならない。

0 件のコメント:

コメントを投稿