【エントリー作品の詳細説明】
小倉百人一首LODは、全国各地の図書館に所蔵している古典籍の画像データと翻刻データなど、小倉百人一首に関連する情報を提供するデータセットである。LODチャレンジ2017においてデータセット部門最優秀賞を受賞し、以後、IIIF(International Image Interoperability Framework)対応、英語翻訳資料のデータ追加、「みんなで翻刻」プロジェクトとの連携、朗読の音声データの追加を実施し、改善を重ねている。2020年時点でのデータモデルは「小倉百人一首LODのデータモデル設計と構築」(『情報の科学と技術』2021年71巻8号 p.376-381)にまとめた。
今年度LODチャレンジ2022では、教科書に掲載された小倉百人一首のデータ作成を行った。対象として1991年(検定年)以降の小学校国語の教科書を調査し、28冊に掲載された208件の和歌をLOD化した。
【新規作成データ】
・教科書に掲載された小倉百人一首: http://linkdata.org/work/rdf1s9615i
【データモデル】
教科書に掲載された個々の和歌をリソースとし、かるたのマスタデータ(小倉百人一首かるたデータ http://linkdata.org/work/rdf1s6834i)の和歌、および、教科書LODの掲載教科書、学習指導要領LODの学習指導要領コードのリソースとリンクした。
和歌が掲載されている教科書のリソースについては、教科書LODへのリンクとし、dcterms:isPartOfでリンクした。
和歌から学習指導要領コードへのリンクを形成することとし、学習指導要領LODの学習指導要領コード細目のリソースへとリンクした。当初は独自定義の語彙を使用していたが、今後、小倉百人一首に限らず、各種の資料から学習指導要領コードへのリンクを形成したい場合が増えてくることを鑑み、学習指導要領LODの研究グループで語彙の定義を検討してもらった。その結果、cs:cosItemが定義されたので、これを採用している。
上記のようにリソース間のリンクを行えば、教科書の情報や学習指導要領の情報は原理的にはリンク先のデータを、直接、取得すればよい。しかし、小倉百人一首LODの中で分析のために必要なデータはリテラルとしてデータを作成するとともに、次に述べる方法で、別ファイルを用意し、教科書LODと学習指導要領LODの情報を簡単に取得できるようにした。
[語彙 ver.6.1]
karuta:text 和歌の本文テキスト
dc:creator 歌人
bibo:number 歌番号
dcterms:isPartOf 教科書LODへのリンク
dc:source 教科書のタイトル
dc:publisher 教科書の出版社
textbook:authorizedYear 教科書の検定年
jpcoar:volume 教科書の掲載巻号
jpcoar:pageStart 教科書の掲載ページ(開始)
jpcoar:pageEnd 教科書の掲載ページ(終了)
dcterms:source 教科書のCiNiiBooksへのリンク
dc:subject 教科書の学校種と科目
cs:cosItem 学習指導要領コードへのリンク ※
schema:startDate 該当する学習指導要領の施行年
dcterms:reference かるたデータへのリンク
※ver.6.0では[学習指導要領コードへのリンク]はkaruta:csCodeとしていたが改訂した。
【既存オープンデータの活用】
今回の作品においては、既存のLODである「教科書LOD」と「学習指導要領LOD」へのリンクを形成したことが特徴である。
教科書LODは、1992年施行の学習指導要領以降の検定教科書を対象として、書誌事項、単元情報、編集趣意書情報および教科等の関連情報をLOD化したものである。2017.1に公開され、約12万トリプルが提供されている。
https://w3id.org/jp-textbook/
作成者:Japanese Textbook LOD Project(江草由佳、高久雅生)
学習指導要領LODは、文部科学省が公開している学習指導要領と教育要領の内容・コードおよび関連する情報を LOD化したものである。2021.12に公開され、約90万トリプルが提供されている。
https://w3id.org/jp-cos/
作成者:データプラス研究会(阿児雄之、有山裕美子、江草由佳、榎本聡、大井将生、高久雅生)
[関連するデータの抽出]
小倉百人一首LODは、LinkData.orgのプラットフォーム上で提供する。LinkData.orgでは、EXCELファイルからRDFを生成するために、入れ子のRDFが書けないという制約がある。そのため、教科書LODと学習指導要領LODから取得できる情報について、別のファイルで提供する必要がある。
教科書LODも学習指導要領LODもオープンデータファイルを提供しているが、リンク先のリソースの数は教科書28件、学習指導要領コード9件に過ぎないので、全件を取得することは効率が悪い。そこで、主要な項目を抜き出したTurtleファイルを用意し、データロードを簡単にできるようにした。なお、このデータ作成にあたっては、LODチャレンジ2018のPoorman’s Linked Data Toolkitの手法を用いた。
教科書LODの関連データ:http://karutalod.web.fc2.com/files/textbooklod4ogura.ttl
学習指導要領LODの関連データ:http://karutalod.web.fc2.com/files/cslod4ogura.ttl
【作成したデータの分析結果】
本作品は、対象とする1991年(検定年)以降の小学校国語の教科書を網羅的に調査できたため、作成したデータの分析を行うことができた。出版社の変遷や、掲載学年の変遷、掲載回数の多い和歌などが明らかにできた。
出版社については、1990年代は2社であったのが、徐々に増加してきており、特に「伝統的な言語文化と国語の特質に関する事項」が加わった2011年4月施行の学習指導要領の影響が大きいことが推定される。掲載学年についても、6年生での掲載から徐々に学年が下がってきており、現行の学習指導要領では、4年生の「易しい文語調の短歌や俳句を音読したり暗唱したりするなどして,言葉の響きやリズムに親しむこと」の教材として定着している。掲載回数の最も多い和歌は「天の原ふりさけ見れば春日なるみかさの山に出でし月かも」であった。一般には小倉百人一首は恋の歌が多く含まれる和歌集であることが特徴とされているが、教科書に掲載された百人一首の掲載回数上位の和歌には恋の歌が入っていない。
なお、今回データ化したのは、小学校国語に限っているが、今後、他の学校種や他の教科の調査に広げれば、さらに傾向を分析することも可能である。
【関連する成果】
本作品の概要については、Code4Lib Japan Conference2022で口頭報告を行った。
Update: Oct 8, 2022
(Nanako Takahashi)