Creativity Sharing and
Entrepreneurial Support

みんなで翻刻de小倉百人一首LOD

License : CC0
小倉百人一首LODの翻刻データの拡充のため、「みんなで翻刻」プロジェクトとの連携を行った。各地の図書館で所蔵している古典籍を「みんなで翻刻」のサイトに登録し、クラウドソーシングによって翻刻されたテキストをLODにして、小倉百人一首LODのデータセットを作成した。
Update: Sep 19, 2020

Text detail
【エントリー作品の詳細説明】 小倉百人一首LODは、かるたゲームのためのデータを整理し、あわせて、全国各地の図書館に所蔵している古典籍の画像にリンクを形成し、翻刻データとともに提供するデータセットである。各地でバラバラに公開されているオープンデータ画像をつなぐ取り組みを行った。LODチャレンジ2017において、データセット部門最優秀賞を受賞している。翌年のLODチャレンジ2018ではIIIF(International Image Interoperability Framework)を使って、画像のリンクの改善を行い、かるたの該当箇所のみにリンクできるようになった。LODチャレンジ2019では英語翻訳資料のデータの追加を行った。 今年度LODチャレンジ2020では、「みんなで翻刻」プロジェクトと連携し、古典籍の翻刻データ作成をクラウドソーシングで行った。 「みんなで翻刻」(https://honkoku.org/)は、 国立歴史民俗博物館、東京大学地震研究所、京都大学古地震研究会を中心に開発・運営されている。2017年1月の開始当初は、東京大学地震研究所が所蔵する地震関連の史料を、ウェブサイト上で多くの参加者を得ることによって、翻刻していくプロジェクトであった。2019年7月のリニューアルによって、翻刻の対象が大きく広がり、現在はさまざまな史料所蔵機関が公開している史料画像を対象にして翻刻することができるようになった。IIIF (International Image Interoperability Framework)に対応した画像は簡単にみんなで翻刻のプラットフォームへの取り込みが可能である。IIIFは近年、デジタルアーカイブの画像公開技術として、国際的に普及しつつあり、日本でも図書館所蔵のデジタルアーカイブの標準となりつつある。今回の連携においては、IIIFで提供されている小倉百人一首のオープンデータ画像を「みんなで翻刻」のサイトに掲載し、翻刻完了したテキストデータをもとに小倉百人一首LODのデータを作成することとした。 [連携の詳細] みんなで翻刻には、IIIF対応している国立国会図書館、国文学研究資料館、京都大学附属図書館の資料を掲載した。そのうち、4点について、翻刻されたテキストデータをダウンロードした。これらをLOD作成用のEXCELに取り込み、LinkData.orgでRDFに変換し、公開した。なお、「みんなで翻刻」での入力ルールでは、「見たままを翻刻し、原文の姿をできるかぎり残す」ことになっている。ちらし書きのように順序が混乱してしまう箇所については、小倉百人一首LODのデータを作成するときに修正して、意味が通じるように順序を入れ替えた。フリガナが( )で記述されている個所はそのままとしている。 【新規作成データ】  ・ 錦百人一首あつま織(国立国会図書館所蔵) http://linkdata.org/work/rdf1s8472i  ・百人一首絵抄(国立国会図書館所蔵) http://linkdata.org/work/rdf1s8473i  ・壽賀多百人一首小倉錦(国文学研究資料館所蔵)http://linkdata.org/work/rdf1s8474i  ・中院通知和歌書法(京都大学附属図書館所蔵) http://linkdata.org/work/rdf1s8475i 【修正データ】  ・小倉百人一首かるたデータ http://linkdata.org/work/rdf1s6834i     ※各和歌から「みんなで翻刻」との連携で作成した資料へのリンクを追加した。      ・小倉百人一首オープンデータ画像リスト http://linkdata.org/work/rdf1s6836i     ※「みんなで翻刻」との連携で作成した資料4点を追加した。 [語彙の改訂] 小倉百人一首LODのデータモデルは、従来から設計したものを踏襲し、古典籍の和歌データに、翻刻されたテキストデータを取り込んだ。 語彙の主なポイントは以下の4点である。 (1)和歌の本文のテキストは、昨年のLODチャレンジではdc:descriptionを提案したが、異論が多かったことから再考した。独自定義とし、karuta:textとしている。これにより、語彙をVer.4に改訂した。 (2)和歌の注釈があるものについてはkaruta:anotatesに取り込んだ。翻訳資料では利用していたが、「みんなで翻刻」のおかげで解説文も翻刻されたため、古典籍でもこの語彙を利用することができた。 (3) 独自定義で、karuta:referenceを定義して、「みんなで翻刻」サイトへのリンクを形成した。「みんなで翻刻」の原文の姿をできるかぎり残すという良さはリンクすることによって活かされる形とした。 (4)画像については、IIIFのimage APIを利用して、従前どおりschema:imagにかるたの当該箇所へのリンクを形成している。 小倉百人一首LODの語彙の全体像は、http://karutalod.web.fc2.com/ogura.html に掲載しているので参照してほしい。 [独自性・影響力・つながる可能性] クラウドソーシングによる翻刻とLODのデータ作成を結び付けたところに、本取り組みの独自性がある。小倉百人一首には、遊びとしての知名度・人気があり、かつ和歌研究にも膨大な資料的な蓄積があるため、インパクトが高い素材である。「みんなで翻刻」でも、データ掲載後、複数の翻刻者の参加によって、短期間で「翻刻完了」となった。小倉百人一首LODのデータ作成が容易になるだけでなく、「みんなで翻刻」の参加者にとっても、自らの入力したデータの利活用が目に見える形になるところが利点である。 [創造性・開放性・機械可読性] 小倉百人一首LODは、各地の図書館でオープンなライセンスを付与して公開され始めた古典籍の画像データを、RDF形式に整え、リンクすることで、新しい発想でのデータの活用が可能になることを示そうとしたものである。リンクしている古典籍画像も、CC0、CCBY、CCBY-SA相当の利用条件で提供されているものに限っているため、本作品全体のオープン性は確保されている。作成したデータはCCBYで提供する。 [持続可能性・有用性] 「みんなで翻刻」との連携が可能となったことにより、古典籍画像の翻刻の労力が分散され、データ拡充が容易になった。 今後、できるだけ数多くのデータを収集すれば研究用途としての価値が出てくることを期待している。
Update: Sep 7, 2020 (Nanako Takahashi)
Image detail
みんなで翻刻と小倉百人一首の連携イメージ
Update: Sep 19, 2020 (Nanako Takahashi)
Data detail
【エントリー作品】
Update: Sep 6, 2020 (Nanako Takahashi)
Data detail
【エントリー作品】
Update: Sep 6, 2020 (Nanako Takahashi)
Data detail
【エントリー作品】
Update: Sep 6, 2020 (Nanako Takahashi)
Data detail
【エントリー作品】
Update: Sep 6, 2020 (Nanako Takahashi)
Data detail
【エントリー作品】
Update: Sep 6, 2020 (Nanako Takahashi)
Data detail
【エントリー作品】
Update: Sep 6, 2020 (Nanako Takahashi)
Web page detail
【関連するウェブサイト】 「みんなで翻刻」のウェブサイトです。最新はこちらのURLです→ https://honkoku.org/
みんなで翻刻 - MINNA DE HONKOKU http://honkoku.org/
「みんなで翻刻」は、多数の人々が協力して史料の翻刻に参加することで、歴史資料の解読を一挙に推し進めようというプロジェクトです。このプロジェクトは、2017年に歴史地震の研究グループである京都大学古地震研究会によって、地震史料の翻刻プロジェクトとして始まりました。すでに「みんなで翻刻」では、5000人の人々により600万文字もの史料が翻刻されています。
Update: Sep 19, 2020 (Nanako Takahashi)
Web page detail
【関連するウェブサイト】 小倉百人一首LODの詳細を記述したウェブサイトです。
小倉百人一首LOD http://karutalod.web.fc2.com/ogura.html
小倉百人一首のLOD(Linked Open Data)のためのウェブサイトです。 小倉百人一首LOD 小倉百人一首のLOD化を進めています。
Update: Sep 6, 2020 (Nanako Takahashi)
Web page detail
【利用しているオープンデータ】 国立国会図書館デジタルコレクションに収録されたオープンデータのデジタル画像を利用している。
国立国会図書館デジタルコレクション https://dl.ndl.go.jp/
言語(Language): 日本語 English トップへ このデータベースについて ヘルプ すべて 図書 雑誌 古典籍資料(貴重書等) 博士論文 官報 憲政資料 日本占領関係資料 プランゲ文庫 録音・映像関係資料 歴史的音源 地図 特殊デジタルコレクション 他機関デジタル化資料 電子書籍・電子雑誌 詳細検索 インターネット公開 図書館送信資料 国立国会図書館内限定 公開範囲について JavascriptをONにしてください。 一覧 図書 雑誌 古典籍 博士論文 官報 憲政資料 日本占領 関係資料 プランゲ文庫 録音・映像 関係資料 電子書籍・ 電子雑誌 歴史的音源 手稿譜 脚本 科学映像 地図 特殊デジタルコレクション 他機関デジタル化資料 内務省検閲発禁図書 令和2年度国立国会図書館デジタルコレクション 利用者アンケート 国立国会図書館デジタルコレクションをより良いサービスとするため....
Update: Sep 6, 2020 (Nanako Takahashi)
Web page detail
【利用しているオープンデータ】 国文学研究資料館新日本古典籍総合データベースに収録されたオープンデータのデジタル画像を利用している。
新日本古典籍総合データベース http://kotenseki.nijl.ac.jp/
このデータベースは、当館「日本古典籍総合目録データベース」を継承し、複数の機関が所蔵する古典籍の情報を一度に検索できるシステムとなります。古典籍に関する画像を含んだデータベースとしては、これまでに無い規模のものを目指していきます。
Update: Sep 19, 2020 (Nanako Takahashi)
Web page detail
【利用しているオープンデータ】 京都大学貴重資料デジタルアーカイブに収録されたオープンデータのデジタル画像を利用している。
京都大学貴重資料デジタルアーカイブ http://rmda.kulib.kyoto-u.ac.jp/
京都大学貴重資料デジタルアーカイブ Move to http://rmda.kulib.kyoto-u.ac.jp/
Update: Sep 6, 2020 (Nanako Takahashi)

Grant Information

Suggested fund information for realizing the idea.

Comments