日本の判例データ
License
:
最高裁判所サイトで検索可能な判例データ約6.6万件に対して、当事者や裁判官、参照法令、キーワードを抽出してRDF化したものである。これにより、様々な観点で判例の検索や分析を可能とした。
最高裁判所サイトの判決文はPDFファイルとして提供されている。判決言渡日、事件名、事件番号、裁判所名、判決などのメタデータは、検索結果のテーブルから抽出できるが、その他の情報を得るにはPDFのテキスト化が必要であった。PDFからテキスト情報を取り出し、レイアウト解析をして、行番号等の不要な情報の除去、段落や箇条書きなどの認識を行い、HTML化を行った。さらに、テキストを解析し、裁判当事者、裁判官などの情報、参照している法令条項、キーワードを抽出した。裁判、判決、判例文に概念を分けてオントロジーを設計し、eLawsや法令LODの法令情報にもアクセスしやすいようにURIを設計し、抽出した情報をRDF化した。
Update: Oct 14, 2024