研究テーマ・グループ Research Themes and Groups
利活用に関する研究グループ「メディア分析チーム」
チームリーダー:宮尾 祐介(東京大学 大学院情報理工学系研究科・教授)
研究テーマ:紛争データ抽出技術の研究開発
私たちのチームは、ニュース記事等のテキストデータからサプライチェーンに影響を与える可能性のある情報を抽出する研究に取り組んでいます。特に注目しているのは、記事に記載された紛争に関する情報の検出と、その紛争の深刻度およびサプライチェーンへの影響を自動的に評価する仕組みの開発です。この取り組みでは、急速に進化している大規模言語モデル(LLM)を活用するとともに、従来の機械学習手法を効果的に組み合わせ、精度と効率を両立させた情報抽出システムの実現を目指しています。これにより、実務での分析支援と意思決定の加速を図り、さらに紛争に限らず、将来的には自然災害や経済的ショックなど、サプライチェーンに影響を及ぼすさまざまなイベントの自動検知・分析にも応用できることが期待されます。
また、さらに発展的な研究として、世界中で発生するイベントの原因や影響を大規模言語モデルを用いて把握する技術に取り組んでいます。例えば、北米で大寒波が発生してナイロンの需給に問題が生じた場合、日本のサプライチェーンにどのような影響が及ぶかを分析することができます。大規模言語モデルは過去のテキストデータを学習していますが、まだ起きていない新たなイベントについては十分に学習していないため、未知のイベントに関する原因や影響の説明を正確に行うためには、実世界に基づく推論が不可欠です。このような説明においては、事実と異なる内容が含まれる「ハルシネーション」を避けることも重要な課題です。しかし、この分野はまだ先行研究が少なく、現在の大規模言語モデルの能力についての十分な評価も行われていません。そのため、私たちは現在、大規模言語モデルが未知のイベントに対して原因や影響の説明をどの程度正確に生成できるかを評価するためのデータセットを構築しています。また、このデータセットを用いて、大規模言語モデルの学習やチューニングを行い、原因や影響を説明するシステムの開発を進めています。