山本 泰生
研究概要
「データ駆動による知識発見」を目指し、仮説推論,データマイニング,ストリームデータ処理に関する基礎研究を進めています。近年のAIの発展を支えるビッグデータですが、利活用されるデータ量は全体に比べて実はほんの一握りです。このような有効活用されず眠ったままの膨大なデータから、これまでに気づかれていない発見や洞察を得るための情報処理技術を開発しています。
データマイニング
大量のデータに隠されたデータ中の規則・パターン・知識を抽出する情報処理技術を「データマイニング(Data Mining; データ発掘)」と呼びます.ある店舗の商品購入履歴からどの商品とどの商品が一緒によく売れられているかを調べたり、株価相場から銘柄の変動を予測したり、気象データからモデルを構築したりする技術です。ビッグデータ時代を迎える今日ますます重要性を増しています。
ストリームデータ
観測系から生成され続ける無限長のデータ系列のことを「ストリームデータ (Stream Data)」と呼びます。「流しそうめん」のようなデータですが、クラウドサービスやIoT の発展に伴い、気象、小売、製造、インフラ、観光、医療、スポーツ等の分野で、様々なストリームデータが生み出されています。このデータの特徴は、時間経過とともに蓄積されるデータ総量が急速に増加する点にあります。全データを保持し続けることは原理的に困難であり、データを「捨てる」ことが避けられません。ストリームデータ処理では、データを「上手に捨てる」ことが重要なポイントとなります。
システムバイオロジー
遺伝子、シグナル伝達、代謝など、個々に取り扱われてきた系を一つの大きな生体システムとして再構築する生物学を「システムバイオロジー (Systems Biology)」と呼びます。還元論的アプローチをとる分子生物学とは対照的なアプローチで注目されており、AI と IoT の技術展開と相まった進展が期待されています。Darpa「Big mechanism」プロジェクトをはじめ近年、国内外において研究が活発化しています。