セマンティック・トランスコーディング: Web の意味的な拡張と効率的な再利用のメカニズム

長尾 確
日本アイ・ビー・エム株式会社 東京基礎研究所
knagao@jp.ibm.com

Abstract

本稿では、WWW上に、 より上位の構造を構築する手法とそれに基づくコンテンツの再利用の手法を紹介する。 その上位構造はWeb の情報に新たな利用法と価値を与えるものである。 具体的には、 Web ドキュメントの任意のエレメントに アノテーションと呼ばれる付加情報を付与する仕組みを導入し、 そのドキュメントへのリクエストに対してアノテーションを考慮して 加工した結果を返すメカニズムを実現した。 この場合のコンテンツ加工(一般にトランスコーディングと呼ばれる) は、 アノテーションに基づくドキュメントの意味的内容を考慮したものなので セマンティック・トランスコーディングと呼ばれる。 アノテーションには、大きく分けて、 文章の言語構造を付与する言語的アノテーション、 イメージやリンクなどのエレメントに対するコメントアノテーション、 ビデオなどのマルチメディアデータの意味的構造に関するマルチメディアアノテーションがある。 コメントアノテーションには文章の他にリンクやイメージを含めることもでき、 文章の場合はその言語構造がXML (Extensible Markup Language) 形式の タグとして埋め込まれている。 セマンティック・トランスコーディングの具体例として、 ビデオや音声などのマルチメディアデータを含む ドキュメントの要約、翻訳、音声化、詳細化がある。 また、アノテーションのその他の利用法には、 自然言語による内容検索や、関連するコンテンツの検索と要約、 さらに知識発見がある。

Valid XHTML 1.0!