TermLink:言語横断論文推薦のための専門用語処理
(第2回 データサイエンス・アドベンチャー杯 言語部門 優秀賞)
チーム名:T-linkage(国立情報学研究所)
我々は、言語を横断して関連論文を推薦するための専門用語データベースの構築と、それに基づく用語翻訳・用語リンキング機能の実現・評価に取組んでいる。アドベンチャー杯への参加を通して、どのような言語リソースが性能改善に有効であるかを分析した。評価用データを作成して、自然言語文から専門用語を抽出する「用語抽出」、機械翻訳手法を用いた「用語翻訳」、用語候補をコーパスや知識データベースの語に対応付ける「用語リンキング」の性能への影響を調べたところ、いずれも改善に取り組む価値があることがわかった。その要となる言語リソースは、論文著者キーワードおよび和英抄録、推薦対象となる論文のテキストである。これについて今回、JSTアドベンチャー杯のデータを試すことはできなかったが、機会があればチャレンジしたい。
Update: Mar 27, 2015