LODすぐに見つかる、まとめて探せる。情報検索がもっと便利に

インターネットで情報を探すとき検索エンジンを使うことが一般的ですが、どんなに有益な情報でも検索結果に表示されないと辿り着けないという問題を抱えています。そこで今、必要な情報を横断的に探し出すための技術開発が、世界中で進行中。関連するデータ同士にリンクを持たせ、相互に発見されやすくすることで、必要な情報をスピーディーかつ体系的に探し出せるようになっています。

「Linked Data」形式の情報を横断的に検索できる基盤技術を開発

多くの人はインターネットで情報を探すとき、検索エンジンに知りたい情報のキーワードを入力し、該当するWebサイトにアクセスし、その内容を確認しているでしょう。しかし、これでは検索エンジンにひっかからない情報は、どんなに有益な情報であってもインターネットの世界に埋もれてしまいます。インターネットの世界で本当に知りたい情報を素早く確実に探しだすことは、じつは非常に困難なことなのです。

そこで、今、インターネットの世界を巨大な1つのデータベースとしてとらえ、必要な情報を横断的に、瞬時に探し出すことを可能とする技術の開発が進められています。それを実現するのが「Linked Data」と呼ばれるデータ形式と、そのデータ形式に適合した検索技術です。現在、官公庁、公文書館や図書館、研究機関などでは、膨大なデータをCSVやXML、RDF、RDBMSなどさまざまな形式で保有しています。これらのデータを全てLinked Data形式に変換して保有すれば、データがリンクを持つことで相互に発見されやすく、活用されやすくなります。個々のWebサイトを探さなくとも、Linked Data形式のデータを横断的に検索することで必要な情報を素早く探し出せるようになるのです。

そのため、現在、日本を含む世界各国で、さまざまな情報をLinked Data形式に変換し、データ群である「Linked Open Data(LOD)」として整備する取り組みと、LODの活用基盤の開発が急がれています。富士通研究所は、このLODの活用という世界的な取り組みにも、基盤技術を提供することで貢献しています。

世界中の機関から収集した膨大なLODを自由に組み合わせて活用できる基盤を無償公開

富士通研究所が開発した「LOD活用基盤」は、政府や自治体の統計、企業の財務情報、株価、新聞記事など、世界中の機関から収集した数百億項目にもおよぶLODのデータを組み合わせて分析できるプラットフォームです。従来比で5~10倍となる高速な検索アルゴリズムで必要な情報を一括検索でき、あわせて収集した情報の相互のつながりを可視化できるのが特長です。

この「LOD活用基盤」を利用すれば、個々のWebサイトを探しまわることなく、欲しいデータを即時に入手し、利用することが可能となります。また、多種多様なデータを自由に組み合わせて新たなアプリケーションを開発することも容易になります。富士通研究所では、すでに企業分析アプリケーションを開発しており、LODとして公開されている企業の業種や従業員数といった基本情報、各企業が公開している財務情報、株価情報などを組み合わせることで、企業業績を瞬時に多角的に分析することができます。富士通研究所では、このLOD活用基盤を2013年中に無償公開する予定です。これにより世界中の研究者や開発者がインターネット上に存在する膨大なLODをさらに活用しやすくなり、新たなインターネットアプリケーションの開発が進むことが期待されています。