Creativity Sharing and
Entrepreneurial Support

観光語彙基盤を用いた新宮町LODの作成と意味検索システムの開発

License : CC0
我々は,福岡県糟屋郡新宮町の潜在的な地域資源をデータ化して体系的に整理し,新宮町の観光業振興に資するために福岡工業大学の学生と新宮町役場の職員を主メンバーとする「たのしんぐうプロジェクト」を結成した.本プロジェクトでは,Linked Open Data (LOD) の概念に基づいて地域データを整理し,一般公開用に観光情報ポータルサイト「たのしんぐう」を設立した.また,地域データの二次利用を図るために地域データをLODとして整理し,LODの公開と新宮町SPARQL Endpointの提供を行っている.新宮町LODを作成するにあたり,各種地域リソースの体系化と一貫性の確保のために新しい観光語彙基盤を整備した.観光語彙基盤は,情報処理推進機構(IPA)が整備を進めている共通語彙基盤とは異り観光リソースを専門にしており,また,各リソースのリンク化および他のLODとの調和を図っている.例えば,共通語彙基盤で定義されているキーワードのデータ型はxsd:string型であるが,観光語彙基盤ではxsd:anyURI型で定義している.これにより,DBpediaやI-Scoverなどで定義されているキーワード相当の述語とデータ型が一致するため,横断的にLODをリンクできるようになり,結果的に各リソースの体系化が図られる.また,LODは,各リソースの一貫性を確保して体系的に整理することでオントロジーとしての活用法が期待できる.本プロジェクトでは,新宮町LODを用いた意味検索システム「しんぐうコンシェル」の研究開発を進めている.「しんぐうコンシェル」は,入力された質問文を形態素解析して観光語彙基盤の述語を基に意味解析を行い,SPARQLクエリを生成して新宮町SPARQL Endpointで参照し,その処理結果をHTMLデータに変換している.我々は,各種リソースが体系的に整理されたオープンなLinked RDFデータ(LOD)が,これからの音声エージェントサービスを支えるデータインフラになると考えており,これからも観光語彙基盤の整備や新宮町LODの作成,「しんぐうコンシェル」の研究開発を進めていきたい.
Update: Jan 16, 2017

Web page detail
観光語彙基盤 http://www.tourism.property/
Tripleデータのための述語セットである語彙は、オープンデータの二次利用や知識処理の効率化を図るための重要な要素であり、LODを作成する際は共通の語彙を可能な限り用いることが推奨されます。このサイトでは、観光分野のデータを対象とした語彙を提供しています。
Update: Jan 15, 2017 (Toshitaka Maki)
Web page detail
SPARQL | たのしんぐう https://www.tanoshingu.org/SPARQL/
本サイトでは、新宮町のLinked Open Data (LOD) を用いたSPARQL Endpointを公開しています。新宮町は、国指定史跡や特別天然記念物などの地域資源があり、また、人口増加率が日本トップクラスの町です。
Update: Jan 15, 2017 (Toshitaka Maki)
Text detail
【エントリー部門】アプリケーション部門 【応募者属性】学生 【応募者名】槇 俊孝,髙橋和生,松前洋祐,坂井大輝,山下拓弥,橋本雅史,浦田清寛,永家鉄也,山口明宏,若原俊彦(福岡工業大学) 【エントリー作品の権利指定】CC BY 【エントリー作品のURL】 (1) http://www.tourism.property/ (2) https://www.tanoshingu.org/sparql/ (3) https://www.tanoshingu.org/しんぐうコンシェル/ 【利用しているオープンデータ】(1) 新宮町LOD,https://www.tanoshingu.org/sparql/#download (2) DBpedia Japanese,http://ja.dbpedia.org/ 【利用しているパートナーリソース】 DBpedia Japanese,http://ja.dbpedia.org/ 【エントリー作品の詳細説明】我々は,福岡県糟屋郡新宮町の潜在的な地域資源をデータ化して体系的に整理し,新宮町の観光業振興に資するために福岡工業大学の学生と新宮町役場の職員を主メンバーとする「たのしんぐうプロジェクト」を結成した.本プロジェクトでは,Linked Open Data (LOD) の概念に基づいて地域データを整理し,一般公開用に観光情報ポータルサイト「たのしんぐう」を設立した.また,地域データの二次利用を図るために地域データをLODとして整理し,LODの公開と新宮町SPARQL Endpointの提供を行っている.新宮町LODを作成するにあたり,各種地域リソースの体系化と一貫性の確保のために新しい観光語彙基盤を整備した.観光語彙基盤は,情報処理推進機構(IPA)が整備を進めている共通語彙基盤とは異り観光リソースを専門にしており,また,各リソースのリンク化および他のLODとの調和を図っている.例えば,共通語彙基盤で定義されているキーワードのデータ型はxsd:string型であるが,観光語彙基盤ではxsd:anyURI型で定義している.これにより,DBpediaやI-Scoverなどで定義されているキーワード相当の述語とデータ型が一致するため,横断的にLODをリンクできるようになり,結果的に各リソースの体系化が図られる.また,LODは,各リソースの一貫性を確保して体系的に整理することでオントロジーとしての活用法が期待できる.本プロジェクトでは,新宮町LODを用いた意味検索システム「しんぐうコンシェル」の研究開発を進めている.「しんぐうコンシェル」は,入力された質問文を形態素解析して観光語彙基盤の述語を基に意味解析を行い,SPARQLクエリを生成して新宮町SPARQL Endpointで参照し,その処理結果をHTMLデータに変換している.我々は,各種リソースが体系的に整理されたオープンなLinked RDFデータ(LOD)が,これからの音声エージェントサービスを支えるデータインフラになると考えており,これからも観光語彙基盤の整備や新宮町LODの作成,「しんぐうコンシェル」の研究開発を進めていきたい.
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
福岡県糟屋郡新宮町の観光情報ポータルサイト「たのしんぐう」のトップページ.
Update: Jan 15, 2017 (Toshitaka Maki)
Image detail
新宮町の離島である相島にある唯一の食堂「丸山食堂」の紹介記事. 各記事のURLは,LODを作成する上で主語として用いられる.
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
新宮町LODのグラフ構造. ■ノード数(リソース数):1,381件 ■エッジ数(triple 件数):4,444件 ■可視化ソフト:Cytoscape 3.4.0 ■レイアウト:グラフ画像の上部はクラスタ係数が比較的に低く,下部はクラスタ係数が比較的に高い.グラフ画像に見られる円形のノード群は,クラスタ係数が同値のものを表している.
Update: Jan 15, 2017 (Toshitaka Maki)
Image detail
新宮町LODのグラフ構造の例1. xsd:anyURI型で定義されたノード(リソース)は,入リンクと出リンクを持っており,各リソースが互いに意味的に参照できる.
Update: Jan 15, 2017 (Toshitaka Maki)
Image detail
新宮町LODのグラフ構造の例2. xsd:string型で定義されたノード(リソース)は,入リンクのみを持っており,xsd:string型のリソースが互いに参照されることはない.このため,各リソースのリンク化を図って体系化するために可能な限りxsd:anyURI型のリソースを定義することが望ましい.また,xsd:string型は,ラベルや概要などの特定の事物を説明するために用いられることが望ましい.
Update: Jan 15, 2017 (Toshitaka Maki)
Image detail
新宮町LODの平均クラスタ係数の分布. ■横軸:隣接数 ■縦軸:各隣接数に対する平均クラスタ係数 ■グラフ全体の平均クラスタ係数:0.096 クラスタ係数は,隣接ノードが互いに隣接ノードになっている割合を表したものであり,クラスタ係数が高いほどLODにおける各リソースが密にリンクされていることを表している.クラスタ係数は,可能な限りxsd:anyURI型でリソースを定義し,各リソースが三角関係になるようにすることで向上する.
Update: Jan 15, 2017 (Toshitaka Maki)
Image detail
「たのしんぐう」に実装した新宮町のSPARQL Endpoint.
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
SPARQL検索による出力結果の例1. ■ 例:丸山食堂の周辺にある神社を知りたい. ■ クエリの記述例: --------------------------------------------------------- prefix tour:<http://www.tourism.property/#> select distinct ?spot where { { select ?latitudeA ?longitudeA where { ?s tour:緯度 ?latitudeA; tour:経度 ?longitudeA; tour:名称 "丸山食堂"@ja. } } ?s tour:緯度 ?latitudeB; tour:経度 ?longitudeB; tour:キーワード <http://ja.dbpedia.org/resource/神社>; tour:名称 ?spot. filter((?latitudeA - 0.009) <= ?latitudeB && ?latitudeB <= (?latitudeA + 0.009)) filter((?longitudeA - 0.009) <= ?longitudeB && ?longitudeB <= (?longitudeA + 0.009)) filter(lang(?spot) = "ja") } ---------------------------------------------------------
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
SPARQL検索による出力結果の例2. ■ 例:沖田中央公園のポイント(要点)を知りたい. ■ クエリの記述例: --------------------------------------------------------- prefix tour:<http://www.tourism.property/#> select distinct ?headline ?abstract where { { select distinct ?point where { ?s tour:要点 ?point; tour:名称 "沖田中央公園"@ja. } } ?point tour:名称 ?headline; tour:概要 ?abstract. } ---------------------------------------------------------
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
新宮町LODを用いた質問応答システム「しんぐうコンシェル」のインタフェース. ■ 動作原理:質問文を形態素解析して観光語彙基盤の述語を基に意味解析を行い,SPARQLクエリを生成して新宮町SPARQL Endpointで参照し,その処理結果をHTMLデータに変換する. ■ Version:0.1.12
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
しんぐうコンシェルの利用例1. ■ 入力文:高妻神社の特徴と行き方を教えてください。
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
しんぐうコンシェルの利用例2. ■ 入力文:沖田中央公園の住所と緯度経度
Update: Jan 16, 2017 (Toshitaka Maki)
Image detail
しんぐうコンシェルの利用例3. ■ 入力文:丸山食堂の近くにある神社は?
Update: Jan 16, 2017 (Toshitaka Maki)

Grant Information

Suggested fund information for realizing the idea.

Related Pages

観光語彙基盤は、観光領域の事物を記述するためのプロパティを提供するデータセットです。以下の名前空間で観光語彙基盤を提供しています。 http://www.tourism.property/# 述語変換器は、任意のLinked Dataを観光語彙基盤に準拠したプロパティに変換します。 http://lod.ce.fit.ac.jp/converter/ ■観光語彙基盤の主な特徴 - 観光領域のLinked Dataを体系的に記述できます。 - URI型の目的語を参照する述語が中心に定義されています。 - 述語のマッピング機能を有しています。 - 述語を考慮したグラフデータを作成できます。 ■述語変換器の主な特徴 - 述語変換器は、任意のLinked Dataを観光語彙基盤に準拠したLinked Dataに変換します。 - LinkData.orgで公開されているRDFデータに対応しています。 - 開発言語:バックグラウンド処理 C/C++,ユーザインタフェース PHP ■着想に至った経緯  Linked Open Data(LOD)は、Resource Description Framework (RDF) に基づいて主語、述語、目的語の3つ組 (triple)で構成されたオープンデータです。述語は、主語と目的語の意味関係を表現する重要な存在であり、オープンデータの二次利用促進や知識処理の効率化を図るために、述語の再開発を避けることが望ましいと考えられます。
4

value

4

Comments