Creativity Sharing and
Entrepreneurial Support


(第2回 データサイエンス・アドベンチャー杯 入賞) チーム名:若鶏の醤油揚げ(京都大学工学部情報学科数理コース)  JSTの論文データを関係性のネットワークとして考え、分野と論文を枝でつないだ2部グラフから分野に関するネットワークを作成した。組織に関するネットワークも同様に作成した。シソーラス関係語に関しては語番号により関係語を結びネットワークを作成した。 次に、それぞれのネットワークについて次数分布やコミュニティー検出による分析を行いネットワークの持つ特徴を調べた。次数分布からはスケールフリー性があるか、次数が大きな点はどのようなものかを調べた。コミュニティー検出ではコミュニティーが意味ネットワークを持つかを調べた。 分野に関しては、年代別のネットワークを作成し、興味が持たれている分野の変遷も調べた。
1

value

1


(第2回 データサイエンス・アドベンチャー杯 SAS Institute Japan賞) チーム名:TEAM K K(慶應義塾大学大学院健康マネジメント研究科) 本発表では、医学分野の特定の分野に絞って論文内容・研究者の双方から検討を行うこととした。分野としては、厚労省「患者調査」において、「皮膚及び皮下組織の疾患」での入院率が大きく上昇している等、特徴的であることを踏まえ「皮膚科学」の論文を対象に検討を行った。 まず、内容を明らかにするため、和文標題をテキストマイニングし、頻出語の時系列推移を追った。結果、「褥瘡」が2005年に急増しており、診療報酬の影響が伺えた。 次に、研究者像を明らかにするため、論文数の年次推移を元に成長混合分布モデルを用いて著者を分類した。皮膚科の研究者は5つのパターンに分かれ、そのうち発表論文数も論文数増加率もそれほど大きくない研究者、すなわち駆出しの研究者集団において、「褥瘡」に関する論文の割合が多いという結果となった。医療政策には駆出しの研究者の方が敏感に反応すると考えられる。政策を研究、社会へ反映させて行くためにはこのような研究者のへの支援が必要と考える。
1

value

1


(第2回 データサイエンス・アドベンチャー杯 一般部門最優秀賞) チーム名:アズマー(東北大学) データから学生のよりよい企業選択のヒントを得る。雑誌、特に総合誌の頻出単語から「電子業界・エネルギー業界」が、世間の注目が高い業界と把握。新聞データからは、記事につけられた分野を企業ごとに付与し、クラスター分析により企業をグルーピングした。雑誌から得られた業界と思われる2クラスタを選択したところ、電子クラスタは10企業、エネルギークラスタは8企業だった。次に文献データから当企業が機関名の論文を抽出し、その分野を企業ごとに集計する。分野出現頻度を円グラフにすることで、各企業の強み分野がわかった。今回は、より雑誌トレンドに合う企業として「KDDI、三菱電機、日本電気、富士通」「東京電力、関西電力」に絞り、さらに各企業の有価証券報告書から年収や従業員数比較を行い、よりよい企業を選択した。最後に名寄せデータと論文年次推移から機関所属の変遷をたどることで、キャリアアップイメージをつかむことができた。
1

value

1


(第2回 データサイエンス・アドベンチャー杯 ジー・サーチ賞) チーム名:Teranolab 本分析では、研究文献データベースならびに科研費データを利用して、研究分野の変遷と研究者の研究動向を分析する。この特長は、複雑ネットワークの方法論を適用して、主要な研究分野で第一人者や貢献者とされる研究者がどのように育ち、研究費を獲得しているかを調査したことにある。学術分野のデータに基づいて、研究者ネットワークと研究費との関係について10年間にわたる動向の変化の分析を行った。また、多くの研究費を獲得している研究者が、研究費を獲得するまでの過程について、パターン分析を行った。その結果、そのような研究者の成長過程には、特徴があることが明らかになった。
1

value

1


(第2回 データサイエンス・アドベンチャー杯 言語部門 最優秀賞) チーム名:キュープラス(九州大学附属図書館等) 一般の人が新しい科学技術を知るのは、ニュースなどの二次情報や、ニュースへのコメントなどの三次情報からが多い。一次情報の科学論文を一般の人が見ることはまれである。科学技術情報と検索の発達にも関らず、一般社会と専門家の乖離は大きく、若い人の理系離れも問題となっている。本チームのシステムは、一次情報である文献概要から、一般の人や報道関係者が、知りたいテーマに関連して、「だれが、どこで、どんな」研究活動を行っているかを、ひと目で表すマップを生成する。専門家でも、複合領域や未知の分野の調査では、このような領域マップを苦労して作らなければならい。本システムでは、文献に現れるキーワード、専門用語、領域分類、研究者名、研究機関名、出版年などを属性付きの単語として、関連マップを表示する。それぞれの単語は属性に応じて異なる色で表示さるので、単語の関連は容易に推測でき、潜在的な概念マップ(Conceptual Map)といえる。
1

value

1