(第2回 データサイエンス・アドベンチャー杯 一般部門最優秀賞)
チーム名:アズマー(東北大学)
データから学生のよりよい企業選択のヒントを得る。雑誌、特に総合誌の頻出単語から「電子業界・エネルギー業界」が、世間の注目が高い業界と把握。新聞データからは、記事につけられた分野を企業ごとに付与し、クラスター分析により企業をグルーピングした。雑誌から得られた業界と思われる2クラスタを選択したところ、電子クラスタは10企業、エネルギークラスタは8企業だった。次に文献データから当企業が機関名の論文を抽出し、その分野を企業ごとに集計する。分野出現頻度を円グラフにすることで、各企業の強み分野がわかった。今回は、より雑誌トレンドに合う企業として「KDDI、三菱電機、日本電気、富士通」「東京電力、関西電力」に絞り、さらに各企業の有価証券報告書から年収や従業員数比較を行い、よりよい企業を選択した。最後に名寄せデータと論文年次推移から機関所属の変遷をたどることで、キャリアアップイメージをつかむことができた。