Going Digital 社会、市場のデジタル化を日本企業変革のチャンスにする

サービス、データを持つ企業との連携が
社会ニーズに沿った成果の創出につながる

1

国内の大学には、基礎研究だけでなく、幅広い産業分野に応用可能な技術のシーズが数多くあり、企業とのコラボレーションによって、さらなる進展と社会実装が期待されるものも少なくない。ビッグデータの時代といわれる以前から、情報検索やデータマイニング、ユーザーインターフェースの研究に取り組んできた早稲田大学理工学術院の山名早人教授に、これまでの研究成果、DMM.comとの共同研究の進捗について伺った。

SNS上の情報を解析し70%の精度でユーザーの属性を判別

――ビッグデータ時代の前から、データ解析・検索、ユーザーインターフェースの研究に取り組んでこられました。

山名 早人氏(やまな・はやと)
早稲田大学 理工学術院 教授

1993年、早稲田大学理工学研究科電気(通信)工学専攻博士(後期)課程修了。1989年、早稲田大学情報科学研究教育センター助手。1993~2000年、通産省工業技術院電子技術総合研究所。1999年、成蹊大学大学院非常勤講師。2000年、早稲田大学理工学部助教授。2004年、国立情報学研究所客員助教授。2005年より現職。ビッグデータ、情報検索、データマイニング、Webマイニング、ペンベーズドコンピューティングなどの研究に従事。

 ビッグデータ以前から検索エンジンは存在していましたが、最初に取り組んだのが検索エンジンの信頼性の評価です。2005年ぐらいから10年かけて取り組んできたのですが、そのときに、自分でデータを持っていないと評価できないということで、高速にデータを集めてくるクローラーというシステムを構築しました。毎秒4000URLを集めることが可能で、論文上では世界一速い数値となっています。

 SNSの情報を解析して、プロフィールを公開していなくても、ユーザーがだれなのかを推定することも可能です。自分が名乗らなくても、プロフィールを公開している友人とのやりとりから、だれかを推定するもので、10万人のツイートを集めて、約70%の割合で著者や属性を判別することに成功しました。別のIDでツイートしたとしても、データを集め分析することで、既存のIDと同一のユーザーであることを推定することもできます。

 漢字暗記支援システムというのも開発しました。システム上で出された問題に答えると、その漢字をどれぐらい覚えているか、記憶度を数値で判定するものです。簡単にいうと、よく覚えている漢字は、強く、しっかりとした勢いで書けますが、考えながら書くと、ストロークといわれる画と画との間が空いてしまう傾向にあります。これを機械学習で解析します。さらに多くのデータを集めれば、短時間で効率的な学習を可能にするアプリケーションも開発できそうです。

 もう1つは、国家プロジェクトとして進めている、ビッグデータ統合利用のためのセキュアなコンテンツ共有・流通基盤の構築です。さまざまなデータをクラウドに格納して解析する時代になっていますが、このときにセキュリティをどう確保するかは大きな問題です。通信経路はデータを暗号化してやりとりすることが考えられますが、本プロジェクトでは、暗号化されたままデータを解析する技術を開発しています。もともとIBMのアルマデン研究所が開発した技術ですが、通常の計算に比べて10の10乗倍の時間がかかり、現実的には使えないものでした。我々は理論面とコンピューターアーキテクチャーの両面からのアプローチで、10の3乗倍、1000倍の高速化を目指して研究を進めています。

――2018年4月には、理工学術院にDMM.comとの共同研究室「早稲田・DMM AIラボ」を開設しました。こちらではどのような取り組みが進められているのですか。

 我々を含め情報系の研究者4人が関わっていますが、我々の研究室では、おもにレコメンドについて取り組んでいます。DMMはオンラインでさまざまなサービスを提供しており、そのなかで、レコメンド機能は非常に重要な位置づけとなっています。各サービスの利用者を自社サイト内に囲い込むには、レコメンド機能の進化が不可欠ということで、既存の機能とは異なる仕組みを開発し、実用化できると判断されたら実際に使ってもらう予定です。

次のページ  最大公約数とは違うレコメンドの仕組みとは?»
1
Technology 関連記事
Going Digital インタビュー」の最新記事 » Backnumber
世界のエグゼクティブが注目する話題の新シリーズEI Emotional Intelligence  知識から感情的知性の時代へ 待望の日本版創刊
定期購読
論文オンラインサービス
  • facebook
  • Twitter
  • RSS