校章などサムネイル
実施地域アイコン

実施地域

愛知県

取組内容アイコン

取組内容

研究

実施体制アイコン

実施体制

学部・学科

連携状況アイコン

連携状況

地方自治体・国

豊田工業大学

科学技術文書からの深い意味構造情報の深層学習による抽出

2020年6月26日

取組概要

自然言語処理の分野における情報抽出を対象として、文献中に記述された用語間の関係情報やイベント情報などの意味内容を構造化・汎化して取り出す深層学習手法の研究を行っている。その中で、構造探索を基盤として、何もタグ付けされていない文から直接意味構造を取り出すend-to-endの深層学習手法を世界で初めて実現している。また、深層学習手法を基盤として、自然言語処理分野の成果である構文解析から得た情報や大量の文献から学習した情報、辞書情報をもとに獲得した情報など、他の言語情報を情報抽出に有効に利用する方法についても研究を行っている。さらに、言語外の情報として、文献に付随する著者や学会などの属性情報や分野データベースに記載されている分野特有のデータや関係情報などから得た情報を抽出に取り入れ、利用する拡張についても研究を行っている。特に、薬学を対象とした研究では、薬物の化学式から深層学習を用いてその表現を学習し、情報抽出に取り入れる方法について研究を行っている。

成果

本研究の成果となる情報抽出システムは、用語抽出・関係抽出・イベント抽出などを対象とした、複数の共通評価データにおいて、発表当時、世界最高の精度を達成している。特に、提案している関係抽出の手法は、情報抽出もしくはその周辺の分野において、基盤手法もしくは比較対象の手法として広く用いられている。さらに、薬学文献を対象とした情報抽出においては、言語外の化学式の情報を利用することで、従来手法に比べて精度の向上を達成している。本研究成果の応用としては、生命医学分野において、開発した情報抽出技術を利用して大量の生命医学文献から意味構造を抽出し、その意味構造を利用して文献の検索を行う意味的文献検索システムを実現し、公開している。従来のキーワードベースの検索に比べて、より構造を考慮した検索を可能としている。

物質工学を始めとした、現在、対象としていない専門分野の文書への情報抽出の応用が期待され、データの整備が進められている。また、抽出した情報の分野データベースとの統合、大規模文書データから抽出した情報に基づいたより柔軟かつ高精度な検索、大規模な知識からの推論による新たな研究対象の創出など、大規模文書から抽出した情報の様々な活用方法についても研究を進める予定である。

※この取組は、提言・事例集『私立大学理工系分野の研究基盤の強化と向上-科学技術イノベーションの推進に向けて-』で紹介した研究事例です。
詳細等は関連リンクをご覧ください。

関連リンク

https://www.shidairen.or.jp/topics_details/id=2822