Creativity Sharing and
Entrepreneurial Support

教科書の中の小倉百人一首LOD

License : CC0
教科書に掲載された小倉百人一首を抽出し、LODのデータセットを作成した。小倉百人一首LODのかるたデータへのリンクを行うとともに、教科書LODと学習指導要領LODにもリンクを形成している。今回の調査対象とした1991年(検定年)以降の小学校国語の教科書には208件の和歌が採録されており、本データセットを作成することにより、それらの採録傾向も明らかになった。
Update: Oct 8, 2022

Text detail
【エントリー作品の詳細説明】 小倉百人一首LODは、全国各地の図書館に所蔵している古典籍の画像データと翻刻データなど、小倉百人一首に関連する情報を提供するデータセットである。LODチャレンジ2017においてデータセット部門最優秀賞を受賞し、以後、IIIF(International Image Interoperability Framework)対応、英語翻訳資料のデータ追加、「みんなで翻刻」プロジェクトとの連携、朗読の音声データの追加を実施し、改善を重ねている。2020年時点でのデータモデルは「小倉百人一首LODのデータモデル設計と構築」(『情報の科学と技術』2021年71巻8号 p.376-381)にまとめた。 今年度LODチャレンジ2022では、教科書に掲載された小倉百人一首のデータ作成を行った。対象として1991年(検定年)以降の小学校国語の教科書を調査し、28冊に掲載された208件の和歌をLOD化した。 【新規作成データ】 ・教科書に掲載された小倉百人一首: http://linkdata.org/work/rdf1s9615i 【データモデル】 教科書に掲載された個々の和歌をリソースとし、かるたのマスタデータ(小倉百人一首かるたデータ http://linkdata.org/work/rdf1s6834i)の和歌、および、教科書LODの掲載教科書、学習指導要領LODの学習指導要領コードのリソースとリンクした。 和歌が掲載されている教科書のリソースについては、教科書LODへのリンクとし、dcterms:isPartOfでリンクした。 和歌から学習指導要領コードへのリンクを形成することとし、学習指導要領LODの学習指導要領コード細目のリソースへとリンクした。当初は独自定義の語彙を使用していたが、今後、小倉百人一首に限らず、各種の資料から学習指導要領コードへのリンクを形成したい場合が増えてくることを鑑み、学習指導要領LODの研究グループで語彙の定義を検討してもらった。その結果、cs:cosItemが定義されたので、これを採用している。 上記のようにリソース間のリンクを行えば、教科書の情報や学習指導要領の情報は原理的にはリンク先のデータを、直接、取得すればよい。しかし、小倉百人一首LODの中で分析のために必要なデータはリテラルとしてデータを作成するとともに、次に述べる方法で、別ファイルを用意し、教科書LODと学習指導要領LODの情報を簡単に取得できるようにした。 [語彙 ver.6.1]   karuta:text 和歌の本文テキスト   dc:creator 歌人   bibo:number 歌番号   dcterms:isPartOf 教科書LODへのリンク   dc:source 教科書のタイトル   dc:publisher 教科書の出版社   textbook:authorizedYear 教科書の検定年   jpcoar:volume 教科書の掲載巻号   jpcoar:pageStart 教科書の掲載ページ(開始)   jpcoar:pageEnd 教科書の掲載ページ(終了)   dcterms:source 教科書のCiNiiBooksへのリンク   dc:subject 教科書の学校種と科目   cs:cosItem 学習指導要領コードへのリンク ※   schema:startDate 該当する学習指導要領の施行年   dcterms:reference かるたデータへのリンク   ※ver.6.0では[学習指導要領コードへのリンク]はkaruta:csCodeとしていたが改訂した。 【既存オープンデータの活用】 今回の作品においては、既存のLODである「教科書LOD」と「学習指導要領LOD」へのリンクを形成したことが特徴である。 教科書LODは、1992年施行の学習指導要領以降の検定教科書を対象として、書誌事項、単元情報、編集趣意書情報および教科等の関連情報をLOD化したものである。2017.1に公開され、約12万トリプルが提供されている。 https://w3id.org/jp-textbook/ 作成者:Japanese Textbook LOD Project(江草由佳、高久雅生) 学習指導要領LODは、文部科学省が公開している学習指導要領と教育要領の内容・コードおよび関連する情報を LOD化したものである。2021.12に公開され、約90万トリプルが提供されている。 https://w3id.org/jp-cos/ 作成者:データプラス研究会(阿児雄之、有山裕美子、江草由佳、榎本聡、大井将生、高久雅生) [関連するデータの抽出] 小倉百人一首LODは、LinkData.orgのプラットフォーム上で提供する。LinkData.orgでは、EXCELファイルからRDFを生成するために、入れ子のRDFが書けないという制約がある。そのため、教科書LODと学習指導要領LODから取得できる情報について、別のファイルで提供する必要がある。 教科書LODも学習指導要領LODもオープンデータファイルを提供しているが、リンク先のリソースの数は教科書28件、学習指導要領コード9件に過ぎないので、全件を取得することは効率が悪い。そこで、主要な項目を抜き出したTurtleファイルを用意し、データロードを簡単にできるようにした。なお、このデータ作成にあたっては、LODチャレンジ2018のPoorman’s Linked Data Toolkitの手法を用いた。 教科書LODの関連データ:http://karutalod.web.fc2.com/files/textbooklod4ogura.ttl 学習指導要領LODの関連データ:http://karutalod.web.fc2.com/files/cslod4ogura.ttl 【作成したデータの分析結果】 本作品は、対象とする1991年(検定年)以降の小学校国語の教科書を網羅的に調査できたため、作成したデータの分析を行うことができた。出版社の変遷や、掲載学年の変遷、掲載回数の多い和歌などが明らかにできた。 出版社については、1990年代は2社であったのが、徐々に増加してきており、特に「伝統的な言語文化と国語の特質に関する事項」が加わった2011年4月施行の学習指導要領の影響が大きいことが推定される。掲載学年についても、6年生での掲載から徐々に学年が下がってきており、現行の学習指導要領では、4年生の「易しい文語調の短歌や俳句を音読したり暗唱したりするなどして,言葉の響きやリズムに親しむこと」の教材として定着している。掲載回数の最も多い和歌は「天の原ふりさけ見れば春日なるみかさの山に出でし月かも」であった。一般には小倉百人一首は恋の歌が多く含まれる和歌集であることが特徴とされているが、教科書に掲載された百人一首の掲載回数上位の和歌には恋の歌が入っていない。  なお、今回データ化したのは、小学校国語に限っているが、今後、他の学校種や他の教科の調査に広げれば、さらに傾向を分析することも可能である。 【関連する成果】  本作品の概要については、Code4Lib Japan Conference2022で口頭報告を行った。
Update: Oct 8, 2022 (Nanako Takahashi)
Image detail
【作成したデータのグラフサンプル】 天の原ふりさけ見れば春日なる三笠の山に出でし月かも(東京書籍 2019年)
Update: Oct 7, 2022 (Nanako Takahashi)
Data detail
【エントリー作品】
Update: Sep 23, 2022 (Nanako Takahashi)
Data detail
【関連するデータ】
Update: Sep 23, 2022 (Nanako Takahashi)
Web page detail
【関連するデータ】 教科書LODの関連データがダウンロードできます。
Update: Sep 23, 2022 (Nanako Takahashi)
Web page detail
【関連するデータ】 学習指導要領LODの関連データがダウンロードできます。
Update: Sep 23, 2022 (Nanako Takahashi)
Web page detail
【利用しているオープンデータ】 教科書LOD
教科書LOD https://jp-textbook.github.io/
教科書LOD 教科書LODプロジェクトでは、初等教育、中等教育で使われている学習指導要領と現行使用教科書の出版情報、単元情報、編修趣意書情報などを Linked Open Data (LOD) として公開します。
Update: Sep 23, 2022 (Nanako Takahashi)
Web page detail
【利用しているオープンデータ】 学習指導要領LOD
学習指導要領LOD https://w3id.org/jp-cos/
学習指導要領LOD 学習指導要領LODは、文部科学省が公開している学習指導要領と教育要領の内容・コードおよび関連する情報をLinked Open Data (LOD) として公開します。LOD化の対象は、現在公開されている全ての学校種別の新旧学習指導要領と教育要領(一部改正を含む)コード表の最新版です。 出典: 文部科学省「学習指導要領コードのコード表(全体版)について」
Update: Sep 23, 2022 (Nanako Takahashi)
Idea detail
【参考にしたウェブサイト】 Poorman’s Linked Data Toolkit
Update: Sep 23, 2022 (Nanako Takahashi)
Web page detail
【関連するウェブサイト】 小倉百人一首LODの詳細を記述したウェブサイトです
小倉百人一首LOD http://karutalod.web.fc2.com/ogura.html
小倉百人一首LOD 小倉百人一首のLOD(Linked Open Data)のためのウェブサイトです。 小倉百人一首LOD 小倉百人一首のLOD化を進めています。
Update: Sep 23, 2022 (Nanako Takahashi)
Web page detail
【関連するウェブサイト】 かるたの語彙の名前空間をGitHubに置いています
GitHub - tnanako/karutalod https://github.com/tnanako/karutalod
Contribute to tnanako/karutalod development by creating an account on GitHub.
Update: Sep 23, 2022 (Nanako Takahashi)
Paper detail
小倉百人一首LODのデータモデル設計と構築
高橋 菜奈子
情報の科学と技術, 71(8), 376-381. (2021)
Update: Sep 23, 2022 (Nanako Takahashi)
Slide detail
【口頭発表スライド】 Code4Lib Japan Conference2022( 2022.9.3 オンライン) 高橋菜奈子「教科書に掲載された小倉百人一首のLODモデル設計」 https://wiki.code4lib.jp/wiki/C4ljp2022/program

Grant Information

Suggested fund information for realizing the idea.

Comments