【エントリー部門】
アイディア部門
【応募者属性】
社会人
【応募者名】
横井一仁
【エントリー作品の権利指定】
クリエイティブ・コモンズ・ライセンス
【エントリー作品のURL】
アイデア部門のため、なし
【利用しているオープンデータ】
音声テキスト化API、構文解析APIから生成したRDFデータを利用しているため、オープンデータの活用なし(ただし、発展アイデアとして、DBpediaやWordnetのデータを用いて、英会話の語彙力向上に役立つ付加情報の提示などの拡張ができると考える)
【利用しているパートナーリソース】
E2D3(データの可視化の部分で記述)
【関連する応募作品】
「人工知能APIとRDFデータ分析を活用した英会話学習支援アプリケーションの実装」
http://idea.linkdata.org/idea/idea1s2232i
※本アイデアの実装方法の例は、上記のページにて解説した。
【エントリー作品の詳細説明】
・背景と課題
多くの日本人は、英文法などの英語の基礎知識は持っているが、英語は日本語と語順が異なるため、英会話となると会話中にリアルタイムに頭の中で英文を作り話すことが難しい傾向がある。そのため、受動態、現在完了、文型など基本的な文法知識を押さえているにも関わらず、英会話では定型の文法パターンの英語しか話せず、上手く論理的な会話ができない時がある。例えば、英語圏の方へ自己紹介する時に「I'm 名前、I'm a 職業、I'm happy to meet you. I'm...」と「I'm形のパターン」のみ話してしまい、会話が弾まない経験をすることも多い。これを克服するために、英会話スクールやスカイプ英会話を活用している方もいる。しかし、英会話能力の弱点や向上ポイントを明確化するのは講師の能力に依存してしまう。そのため、英語学習者が自律的に、かつ定量的に英会話で運用できていない文法パターンを明らかにし、弱点ポイントの改善のサイクルを回すことは困難である。
・解決策
英会話のトレーニングをしている話者の音声データを、人工知能APIで解析し、SPARQLクエリを用いたRDFデータの分析により、話された各文法パターン(受動態、現在完了形、文型など)の出現頻度をグラフで表示する。本手法により、使いこなせている文法パターン、文法知識は持っているが英会話で活用できていない文法パターンを可視化し、英会話能力を向上させるために必要な学習ポイントを明らかにできる。
・活用する人工知能API
本アイデアでは、クラウドベンダが提供している様な人工知能API(音声テキスト化APIと、テキストの構文解析API)を活用する。音声テキスト化APIは、HTTP経由で音声データをアップロードすると、その音声データに含まれるテキストを返すAPIである。本アイデアでは、英会話スクールやスカイプ英会話で録音した音声データを、本音声テキスト化APIへ送付し、自分が発話した英文のテキストデータを取得する。
次に活用するAPIは構文解析APIである。本APIは英文のテキストデータをHTTP経由で送付すると、その英文の構文解析結果を返すAPIである。例えば「I am Ichiro. I play baseball.」というテキストデータを分析すると、一文目は主語が「I」、動詞が「am」、補語「English speaker」という構文であることが分かる。また2文目は、主語が「I」、動詞が「play」、目的語が「baseball」であると解析される。構文解析APIから得た構文解析結果のデータはツリー構造のため、RDF形式のデータとして表現できる。単語や品詞の並びの単純なパターンマッチングと比較すると、構文解析は特に副詞や形容詞、冠詞などが入った文において、文法パターンを精度高く判定できる。
・RDFデータとSPARQLクエリ
話者が話した構文解析データをRDFデータとして、RDFストアに格納する。RDFデータのフォーマットは、各文がSubject、単語がObjectに当たり、Predicateにより単語の構文を表現する(具体例はスライド2ページ目を参照)。文法パターンの検索には、SPARQLクエリを用いる。Where句にて、対象の文法パターンと合致する単語の構文を指定する。これにより、受動態や現在完了形、文型などの文法パターンの条件を記述できる。Select句では、count()を用いることで対象の文法パターンが話者の話した英文に何件存在しているかを算出する。
・文法パターンの可視化
話者が英会話で使用する文法パターンの傾向は、各文法パターンの出現頻度の棒グラフで表示する。棒グラフの表示には、データの可視化で実績のあるE2D3を活用できる。この結果は、他の英語学習者間で共有することで、自分が平均より勝る点、劣る点を定量的に判断でき、目標とする英語運用能力にどの様に近づくか学習計画の立案にも活用できる。
・アピールポイント
本アイデアの出力グラフは、個々の発話内容ではなく、SPARQLクエリで定義した文法パターンの傾向のみを表示するため、人工知能技術の誤認識の影響を受けにくい。ノイズに強いアイデアのため、実現性が非常に高い。またRDFの形で構文解析結果を格納しておくことで、新たに分析したい文法パターンが生じた時に、SPARQLクエリの条件のみを変えるのみで対応できるため、将来の拡張に対応しやすいという特徴がある。
現在、日本では英語学習のニーズがあるが、定量的な学習の効果を測定する手段が少なく、学習の改善サイクルを回すことが難しい。スカイプ英会話企業や英会話スクールが、本アイデアの手法を採用することで、英語学習者は効率良く学習できるようになると期待できる。
Update: Jan 15, 2017
(Kazuhito Yokoi)