mb_language("uni"); mb_internal_encoding("utf-8"); mb_http_input("auto"); mb_http_output("utf-8"); ?>
前回は,印刷業が製造工程で扱う自社の情報を運ぶコンテナとして注目されているJDF,JMF,PrintTalkについてお話ししましたが,私の消化不良から残念ながら説明が十分にできませんでした。またの機会にその続きをお話ししたいと思っています。
さて,今回は,最近話題になっているニュースサイトやブログに関わる書誌情報を表わすXMLボキャブラリについての話です。言うまでもなく,書誌情報とは,出版社が発行する「出版目録」や「新刊案内」,図書館の「蔵書目録」に記載された内容で,目的の書籍を閲覧するための便宜を図るものです。RDF,RSS 1.0,RSS 2.0,Atomは,いずれもWebにおける書誌情報を表わすXMLボキャブラリです。
すでにRSSをご存知の方や利用されている方は,この「書誌情報」という呼び名に違和感を感じるかもしれません。しかし,RSSの綴りのままで話を進めると混乱してしまいそうです。最初のRSS 0.9はRDFボキャブラリに基づくボキャブラリとして「RDF Site Summary(RDFによるサイト要約)」と呼ばれました。ここで,RSS 1.0は,RDFで表わされていますが,この二つのボキャブラリは別ものであって関係が直接あるわけではありませんので,注意しなければなりません。RDFについては後述します。
続くRSS 0.91はRDFボキャブラリを捨てて独自のボキャブラリにしたことから「Rich Site Summary(豊富な表現を持ったサイト要約)」と呼ばれました。そしてRSS 1.0は再びRDFボキャブラリを採用しました。さらにRSS 2.0は今までのRSSとの互換性を保証したボキャブラリとなり「Really Simple Syndication(実に単純な記事配給)」と呼ばれています。しかし同様の目的を持ったAtomが登場してきたことから,今後のRSSとAtomの進展には予想がつきません。そこで,こうしたボキャブラリには,「RSS」ではなく,より広い意味の「書誌情報」という言葉を当てるべきであると考えています。
Webの書誌情報はなぜ必要なのでしょうか。当初のWebでは,あるWebページから他のWebページへのリンクはまだ少なく,あっても従来の書籍の引用程度でありました。その後,大半のWebページは他のWebページとの相互依存を深めています。現在,いくつかのWebページはテレビ局や新聞社などのマスメディアとは異なる「草の根的メディア」となってきました。そのために情報インフレーション気味ながらも,それらのWebページの更新と関連記事への関心はますます高まっています。一方,ポータルサイトの検索は万能ではありませんので,ポータル経由で目的の情報を引き出すことがだんだん不便になってきています。そこで,Webサイトがページを更新した際に,その書誌情報を発行し,利用者が容易に引用できる仕組みが考えられたわけです。
この仕組みはNetscape Communications社が最初に実現し,頻繁に更新されるサイトを「チャンネル」と呼びました。現在,いくつかのWebサイト(つまり,チャンネル)は,書誌情報をRSS形式で発行しています。利用者はRSSリーダーという専用ブラウザーでそれを引用できるようになっています。RSSリーダーは従来のブラウザーと併用できますが,いずれ大半のブラウザーがRSSを引用できるようになると思われます。
ここで,経済産業省北海道経済産業局のホームページが発行している書誌情報を見てみましょう。図1はRSS 1.0による書誌情報,図2はRSS 2.0による書誌情報,図3はAtomによる書誌情報で,三つとも同じ情報を表わしています(紙面の関係から一部を割愛してあります)。表1にはRSS 1.0,RSS 2.0,Atomの対応する要素を列挙しましたので,比べてみてください。
▼表1 RSS 1.0,RSS 2.0,Atomの対比
意味 | RSS 1.0要素 | RSS 2.0要素 | Atom要素 |
---|---|---|---|
RSS | rdf:RDF | rss | - |
チャンネル | channel | channel | feed |
チャンネル名 | title | title | title |
チャンネルのURL | link | link | link |
チャンネルの概要 | description | description | - |
チャンネルの表現言語 | dc:language | language | - |
チャンネルの著作権 | dc:rights | - | - |
チャンネルの更新日時 | dc:date | - | modified |
チャンネルの発行者 | dc:publisher | - | author/name |
チャンネルの作成者 | dc:creator | - | - |
チャンネルのコンテナ | items | - | - |
順序付きコンテナ | rdf:Seq | - | - |
コンテナの項目 | rdf:li | - | - |
記事 | item | item | entry |
記事の表題 | title | title | title |
記事記載ページのURI | link | link | link |
記事の概要 | description | description | summary |
記事の主題 | dc:subject | category | dc:subject |
記事の発行日付 | dc:date | pubDate | issued/modified |
▼図1 RSS 1.0による書誌情報
<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns="http://purl.org/rss/1.0/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:syn="http://purl.org/rss/1.0/modules/syndication/"
xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/">
<channel rdf:about="http://www.hkd.meti.go.jp/">
<title>METI Hokkaido</title>
<link>http://www.hkd.meti.go.jp/</link>
<description>北海道経済産業局</description>
<dc:language>ja</dc:language>
<dc:rights>Copyright 2005 METI Hokkaido. All rights reserved.</dc:rights>
<dc:date>2006-07-26T11:05:46+09:00</dc:date>
<dc:publisher>北海道経済産業局</dc:publisher>
<dc:creator>北海道経済産業局</dc:creator>
<items>
<rdf:Seq>
<rdf:li rdf:resource="http://www.hkd.meti.go.jp/hokss/ido/
h18_meti0724.htm?date=20060724"/>
<rdf:li rdf:resource="http://www.hkd.meti.go.jp/hoksc/kawara/
index.htm?date=20060720"/>
</rdf:Seq>
</items>
</channel>
<item rdf:about="http://www.hkd.meti.go.jp/hokss/ido/h18_meti0724.htm?date=20060724">
<title>経済産業省人事異動...</title>
<link>http://www.hkd.meti.go.jp/hokss/ido/h18_meti0724.htm?rss=true</link>
<description/>
<dc:subject>おしらせ</dc:subject>
<dc:date>2006-07-24T00:00:00+09:00</dc:date>
</item>
<item rdf:about="http://www.hkd.meti.go.jp/hoksc/kawara/index.htm?date=20060720">
<title>「企業かわらばん」を更新しました</title>
<link>http://www.hkd.meti.go.jp/hoksc/kawara/index.htm?rss=true</link>
<description><![CDATA[<p> 「地域経済振興室」は...</p></description>
<dc:subject>地域振興・産業立地</dc:subject>
<dc:date>2006-07-20T00:00:00+09:00</dc:date>
</item>
</rdf:RDF>
▼図2 RSS 2.0による書誌情報
<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title>METI Hokkaido</title>
<link>http://www.hkd.meti.go.jp/</link>
<description>北海道経済産業局</description>
<language>ja</language>
<item>
<title>経済産業省人事異動...</title>
<link>http://www.hkd.meti.go.jp/hokss/ido/
h18_meti0724.htm?rss=true&date=20060724</link>
<pubDate>Sun, 23 Jul 2006 15:00:00 GMT</pubDate>
<description/>
<category>おしらせ</category>
</item>
<item>
<title>「企業かわらばん」を更新しました</title>
<link>http://www.hkd.meti.go.jp/hoksc/kawara/index.htm?rss=true&date=20060720</link>
<pubDate>Wed, 19 Jul 2006 15:00:00 GMT</pubDate>
<description><![CDATA[<p> 「地域経済振興室」は...</p></description>
<category>地域振興・産業立地</category>
</item>
</channel>
</rss>
▼図3 Atomによる書誌情報
<?xml version="1.0" encoding="UTF-8" ?>
<feed xmlns:dc="http://purl.org/dc/elements/1.1/"
version="0.3"
xmlns="http://purl.org/atom/ns#">
<title>METI Hokkaido</title>
<link rel="alternate" type = "text/html" href="http://www.hkd.meti.go.jp/"/>
<modified>2006-07-26T11:05:54+09:00</modified>
<author>
<name>北海道経済産業局</name>
</author>
<entry>
<title>経済産業省人事異動...</title>
<link rel="alternate" type="text/html" href="http://www.hkd.meti.go.jp/hokss/ido/
h18_meti0724.htm?rss=true&date=20060724"/>
<issued>2006-07-24T00:00:00+09:00</issued>
<modified>2006-07-24T00:00:00+09:00</modified>
<dc:subject>おしらせ</dc:subject>
</entry>
<entry>
<title>「企業かわらばん」を更新しました</title>
<link rel="alternate" type="text/html" href="http://www.hkd.meti.go.jp/hoksc/
kawara/index.htm?rss=true&date=20060720"/>
<issued>2006-07-20T00:00:00+09:00</issued>
<modified>2006-07-20T00:00:00+09:00</modified>
<summary type="text/html"><![CDATA[<p> 「地域経済振興室」は...</p></summary>
<dc:subject>地域振興・産業立地</dc:subject>
</entry>
</feed>
さて,Webページに記載された情報資源をRDFボキャブラリによって記述する方法を手短に説明します。RDFは「Resource Description Framework(情報資源記述の枠組み)」の頭辞語です。RDFはSemantic Webを実現するためのものでもありますが,その話はまたの機会といたしましょう。ここで「"http://www.jagat.or.jp/index.html"に値が"JAGAT"である"creator"がある」という資源を記述する文(statement)は,主語(subject),述部(predicate),目的語(object)に区別され,図4または図5のように記述されます。図5では,述部と目的語が別のボキャブラリで表現されています。これは人が読むというよりも,コンピューターが読んで処理できるということに重点が置かれています。
▼図4 RDFによる資源の記述
<rdf:Statement>
<rdf:subject rdf:resource="http://www.jagat.or.jp/index.html"/>
<rdf:predicate rdf:resource="creator"/>
<rdf:object rdf:resource="JAGAT"/>
</rdf:Statement>
▼図5 RDFとその他のボキャブラリによる資源の記述
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.jagat.or.jp/index.html">
<dc:creator>JAGAT</dc:creator>
</rdf:Description>
</rdf:RDF>
最後に,ブログとRSSの関わりについて少し触れておきます。周知の通り,ブログとは,特定のテーマに関する論評や記事,あるいは個人的な日記のような内容を時系列順に表示し,さらに関連する他のブログやWebページとリンクを持つWebサイトのことです。ブログは一般のWebページに比べて頻繁に更新され,引用も盛んですので,RSSの便利さが際立つ応用と言えます。
Webでブログのことを調べていると,「ブログとは何か」という論評がいくつかあるのに気がつきました。例えば,ブログの内容には公共性がなければならないとか,あるいは時事性あるいは専門性が高くなければならないとか。しかし私は,こうした意見には賛同できません。今後,ブログやニュースサイトでないWebも書誌情報を発行するようになると見ているからです。
▲このページのTOPへ