【エントリー作品の詳細説明】
小倉百人一首LODは、かるたゲームのためのデータを整理し、あわせて、全国各地の図書館に所蔵している古典籍の画像にリンクを形成し、翻刻データとともに提供するデータセットである。各地でバラバラに公開されているオープンデータ画像をつなぐ取り組みを行った。LODチャレンジ2017において、データセット部門最優秀賞を受賞している。翌年のLODチャレンジ2018ではIIIF(International Image Interoperability Framework)を使って、画像のリンクの改善を行い、かるたの該当箇所のみにリンクできるようになった。LODチャレンジ2019では英語翻訳資料のデータの追加を行った。
今年度LODチャレンジ2020では、「みんなで翻刻」プロジェクトと連携し、古典籍の翻刻データ作成をクラウドソーシングで行った。
「みんなで翻刻」(https://honkoku.org/)は、 国立歴史民俗博物館、東京大学地震研究所、京都大学古地震研究会を中心に開発・運営されている。2017年1月の開始当初は、東京大学地震研究所が所蔵する地震関連の史料を、ウェブサイト上で多くの参加者を得ることによって、翻刻していくプロジェクトであった。2019年7月のリニューアルによって、翻刻の対象が大きく広がり、現在はさまざまな史料所蔵機関が公開している史料画像を対象にして翻刻することができるようになった。IIIF (International Image Interoperability Framework)に対応した画像は簡単にみんなで翻刻のプラットフォームへの取り込みが可能である。IIIFは近年、デジタルアーカイブの画像公開技術として、国際的に普及しつつあり、日本でも図書館所蔵のデジタルアーカイブの標準となりつつある。今回の連携においては、IIIFで提供されている小倉百人一首のオープンデータ画像を「みんなで翻刻」のサイトに掲載し、翻刻完了したテキストデータをもとに小倉百人一首LODのデータを作成することとした。
[連携の詳細]
みんなで翻刻には、IIIF対応している国立国会図書館、国文学研究資料館、京都大学附属図書館の資料を掲載した。そのうち、4点について、翻刻されたテキストデータをダウンロードした。これらをLOD作成用のEXCELに取り込み、LinkData.orgでRDFに変換し、公開した。なお、「みんなで翻刻」での入力ルールでは、「見たままを翻刻し、原文の姿をできるかぎり残す」ことになっている。ちらし書きのように順序が混乱してしまう箇所については、小倉百人一首LODのデータを作成するときに修正して、意味が通じるように順序を入れ替えた。フリガナが( )で記述されている個所はそのままとしている。
【新規作成データ】
・ 錦百人一首あつま織(国立国会図書館所蔵) http://linkdata.org/work/rdf1s8472i
・百人一首絵抄(国立国会図書館所蔵) http://linkdata.org/work/rdf1s8473i
・壽賀多百人一首小倉錦(国文学研究資料館所蔵)http://linkdata.org/work/rdf1s8474i
・中院通知和歌書法(京都大学附属図書館所蔵) http://linkdata.org/work/rdf1s8475i
【修正データ】
・小倉百人一首かるたデータ http://linkdata.org/work/rdf1s6834i
※各和歌から「みんなで翻刻」との連携で作成した資料へのリンクを追加した。
・小倉百人一首オープンデータ画像リスト http://linkdata.org/work/rdf1s6836i
※「みんなで翻刻」との連携で作成した資料4点を追加した。
[語彙の改訂]
小倉百人一首LODのデータモデルは、従来から設計したものを踏襲し、古典籍の和歌データに、翻刻されたテキストデータを取り込んだ。
語彙の主なポイントは以下の4点である。
(1)和歌の本文のテキストは、昨年のLODチャレンジではdc:descriptionを提案したが、異論が多かったことから再考した。独自定義とし、karuta:textとしている。これにより、語彙をVer.4に改訂した。
(2)和歌の注釈があるものについてはkaruta:anotatesに取り込んだ。翻訳資料では利用していたが、「みんなで翻刻」のおかげで解説文も翻刻されたため、古典籍でもこの語彙を利用することができた。
(3) 独自定義で、karuta:referenceを定義して、「みんなで翻刻」サイトへのリンクを形成した。「みんなで翻刻」の原文の姿をできるかぎり残すという良さはリンクすることによって活かされる形とした。
(4)画像については、IIIFのimage APIを利用して、従前どおりschema:imagにかるたの当該箇所へのリンクを形成している。
小倉百人一首LODの語彙の全体像は、http://karutalod.web.fc2.com/ogura.html に掲載しているので参照してほしい。
[独自性・影響力・つながる可能性]
クラウドソーシングによる翻刻とLODのデータ作成を結び付けたところに、本取り組みの独自性がある。小倉百人一首には、遊びとしての知名度・人気があり、かつ和歌研究にも膨大な資料的な蓄積があるため、インパクトが高い素材である。「みんなで翻刻」でも、データ掲載後、複数の翻刻者の参加によって、短期間で「翻刻完了」となった。小倉百人一首LODのデータ作成が容易になるだけでなく、「みんなで翻刻」の参加者にとっても、自らの入力したデータの利活用が目に見える形になるところが利点である。
[創造性・開放性・機械可読性]
小倉百人一首LODは、各地の図書館でオープンなライセンスを付与して公開され始めた古典籍の画像データを、RDF形式に整え、リンクすることで、新しい発想でのデータの活用が可能になることを示そうとしたものである。リンクしている古典籍画像も、CC0、CCBY、CCBY-SA相当の利用条件で提供されているものに限っているため、本作品全体のオープン性は確保されている。作成したデータはCCBYで提供する。
[持続可能性・有用性]
「みんなで翻刻」との連携が可能となったことにより、古典籍画像の翻刻の労力が分散され、データ拡充が容易になった。
今後、できるだけ数多くのデータを収集すれば研究用途としての価値が出てくることを期待している。
Update: Sep 7, 2020
(Nanako Takahashi)