XML技術
HOME  >  XML技術  >  探検 XMLボキャブラリの世界 第3回

探検 XMLボキャブラリの世界 第3回

第3回:書誌情報のボキャブラリ ~RDF,RSS,Atom~

2008年2月14日 更新
著者:岸 和孝(JAGAT客員研究員)

前回は,印刷業が製造工程で扱う自社の情報を運ぶコンテナとして注目されているJDF,JMF,PrintTalkについてお話ししましたが,私の消化不良から残念ながら説明が十分にできませんでした。またの機会にその続きをお話ししたいと思っています。

書誌情報

さて,今回は,最近話題になっているニュースサイトやブログに関わる書誌情報を表わすXMLボキャブラリについての話です。言うまでもなく,書誌情報とは,出版社が発行する「出版目録」や「新刊案内」,図書館の「蔵書目録」に記載された内容で,目的の書籍を閲覧するための便宜を図るものです。RDFRSS 1.0RSS 2.0Atomは,いずれもWebにおける書誌情報を表わすXMLボキャブラリです。

すでにRSSをご存知の方や利用されている方は,この「書誌情報」という呼び名に違和感を感じるかもしれません。しかし,RSSの綴りのままで話を進めると混乱してしまいそうです。最初のRSS 0.9はRDFボキャブラリに基づくボキャブラリとして「RDF Site Summary(RDFによるサイト要約)」と呼ばれました。ここで,RSS 1.0は,RDFで表わされていますが,この二つのボキャブラリは別ものであって関係が直接あるわけではありませんので,注意しなければなりません。RDFについては後述します。

続くRSS 0.91はRDFボキャブラリを捨てて独自のボキャブラリにしたことから「Rich Site Summary(豊富な表現を持ったサイト要約)」と呼ばれました。そしてRSS 1.0は再びRDFボキャブラリを採用しました。さらにRSS 2.0は今までのRSSとの互換性を保証したボキャブラリとなり「Really Simple Syndication(実に単純な記事配給)」と呼ばれています。しかし同様の目的を持ったAtomが登場してきたことから,今後のRSSとAtomの進展には予想がつきません。そこで,こうしたボキャブラリには,「RSS」ではなく,より広い意味の「書誌情報」という言葉を当てるべきであると考えています。

書誌情報の発行と引用

Webの書誌情報はなぜ必要なのでしょうか。当初のWebでは,あるWebページから他のWebページへのリンクはまだ少なく,あっても従来の書籍の引用程度でありました。その後,大半のWebページは他のWebページとの相互依存を深めています。現在,いくつかのWebページはテレビ局や新聞社などのマスメディアとは異なる「草の根的メディア」となってきました。そのために情報インフレーション気味ながらも,それらのWebページの更新と関連記事への関心はますます高まっています。一方,ポータルサイトの検索は万能ではありませんので,ポータル経由で目的の情報を引き出すことがだんだん不便になってきています。そこで,Webサイトがページを更新した際に,その書誌情報を発行し,利用者が容易に引用できる仕組みが考えられたわけです。

この仕組みはNetscape Communications社が最初に実現し,頻繁に更新されるサイトを「チャンネル」と呼びました。現在,いくつかのWebサイト(つまり,チャンネル)は,書誌情報をRSS形式で発行しています。利用者はRSSリーダーという専用ブラウザーでそれを引用できるようになっています。RSSリーダーは従来のブラウザーと併用できますが,いずれ大半のブラウザーがRSSを引用できるようになると思われます。

ここで,経済産業省北海道経済産業局のホームページが発行している書誌情報を見てみましょう。図1はRSS 1.0による書誌情報,図2はRSS 2.0による書誌情報,図3はAtomによる書誌情報で,三つとも同じ情報を表わしています(紙面の関係から一部を割愛してあります)。表1にはRSS 1.0,RSS 2.0,Atomの対応する要素を列挙しましたので,比べてみてください。

▼表1 RSS 1.0,RSS 2.0,Atomの対比

意味 RSS 1.0要素 RSS 2.0要素 Atom要素
RSSrdf:RDFrss
チャンネルchannelchannelfeed
チャンネル名titletitletitle
チャンネルのURLlinklinklink
チャンネルの概要descriptiondescription
チャンネルの表現言語dc:languagelanguage
チャンネルの著作権dc:rights
チャンネルの更新日時dc:datemodified
チャンネルの発行者dc:publisherauthor/name
チャンネルの作成者dc:creator
チャンネルのコンテナitems
順序付きコンテナrdf:Seq
コンテナの項目rdf:li
記事itemitementry
記事の表題titletitletitle
記事記載ページのURIlinklinklink
記事の概要descriptiondescriptionsummary
記事の主題dc:subjectcategorydc:subject
記事の発行日付dc:datepubDateissued/modified

▼図1 RSS 1.0による書誌情報

<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns="http://purl.org/rss/1.0/" 
         xmlns:dc="http://purl.org/dc/elements/1.1/" 
         xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
         xmlns:syn="http://purl.org/rss/1.0/modules/syndication/" 
         xmlns:taxo="http://purl.org/rss/1.0/modules/taxonomy/">
  <channel rdf:about="http://www.hkd.meti.go.jp/">
    <title>METI Hokkaido</title>
    <link>http://www.hkd.meti.go.jp/</link>
    <description>北海道経済産業局</description>
    <dc:language>ja</dc:language>
    <dc:rights>Copyright 2005 METI Hokkaido. All rights reserved.</dc:rights>
    <dc:date>2006-07-26T11:05:46+09:00</dc:date>
    <dc:publisher>北海道経済産業局</dc:publisher>
    <dc:creator>北海道経済産業局</dc:creator>
    <items>
      <rdf:Seq>
        <rdf:li rdf:resource="http://www.hkd.meti.go.jp/hokss/ido/
        h18_meti0724.htm?date=20060724"/>
        <rdf:li rdf:resource="http://www.hkd.meti.go.jp/hoksc/kawara/
        index.htm?date=20060720"/>
      </rdf:Seq>
    </items>
  </channel>
  <item rdf:about="http://www.hkd.meti.go.jp/hokss/ido/h18_meti0724.htm?date=20060724">
    <title>経済産業省人事異動...</title>
    <link>http://www.hkd.meti.go.jp/hokss/ido/h18_meti0724.htm?rss=true</link>
    <description/>
    <dc:subject>おしらせ</dc:subject>
    <dc:date>2006-07-24T00:00:00+09:00</dc:date>
  </item>
  <item rdf:about="http://www.hkd.meti.go.jp/hoksc/kawara/index.htm?date=20060720">
    <title>「企業かわらばん」を更新しました</title>
    <link>http://www.hkd.meti.go.jp/hoksc/kawara/index.htm?rss=true</link>
    <description><![CDATA[<p> 「地域経済振興室」は...</p></description>
    <dc:subject>地域振興・産業立地</dc:subject>
    <dc:date>2006-07-20T00:00:00+09:00</dc:date>
  </item>
</rdf:RDF>

▼図2 RSS 2.0による書誌情報

<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
  <channel>
    <title>METI Hokkaido</title>
    <link>http://www.hkd.meti.go.jp/</link>
    <description>北海道経済産業局</description>
    <language>ja</language>
    <item>
      <title>経済産業省人事異動...</title>
      <link>http://www.hkd.meti.go.jp/hokss/ido/
      h18_meti0724.htm?rss=true&date=20060724</link>
      <pubDate>Sun, 23 Jul 2006 15:00:00 GMT</pubDate>
      <description/>
      <category>おしらせ</category>
    </item>
    <item>
      <title>「企業かわらばん」を更新しました</title>
      <link>http://www.hkd.meti.go.jp/hoksc/kawara/index.htm?rss=true&date=20060720</link>
      <pubDate>Wed, 19 Jul 2006 15:00:00 GMT</pubDate>
      <description><![CDATA[<p> 「地域経済振興室」は...</p></description>
      <category>地域振興・産業立地</category>
    </item>
  </channel>
</rss>

▼図3 Atomによる書誌情報

<?xml version="1.0" encoding="UTF-8" ?>
<feed xmlns:dc="http://purl.org/dc/elements/1.1/" 
      version="0.3" 
      xmlns="http://purl.org/atom/ns#">
  <title>METI Hokkaido</title>
  <link rel="alternate" type = "text/html" href="http://www.hkd.meti.go.jp/"/>
  <modified>2006-07-26T11:05:54+09:00</modified>
  <author>
    <name>北海道経済産業局</name>
  </author>
  <entry>
    <title>経済産業省人事異動...</title>
    <link rel="alternate" type="text/html" href="http://www.hkd.meti.go.jp/hokss/ido/
    h18_meti0724.htm?rss=true&date=20060724"/>
    <issued>2006-07-24T00:00:00+09:00</issued>
    <modified>2006-07-24T00:00:00+09:00</modified>
    <dc:subject>おしらせ</dc:subject>
  </entry>
  <entry>
    <title>「企業かわらばん」を更新しました</title>
    <link rel="alternate" type="text/html" href="http://www.hkd.meti.go.jp/hoksc/
    kawara/index.htm?rss=true&date=20060720"/>
    <issued>2006-07-20T00:00:00+09:00</issued>
    <modified>2006-07-20T00:00:00+09:00</modified>
    <summary type="text/html"><![CDATA[<p> 「地域経済振興室」は...</p></summary>
    <dc:subject>地域振興・産業立地</dc:subject>
  </entry>
</feed>

RDF

さて,Webページに記載された情報資源をRDFボキャブラリによって記述する方法を手短に説明します。RDFは「Resource Description Framework(情報資源記述の枠組み)」の頭辞語です。RDFはSemantic Webを実現するためのものでもありますが,その話はまたの機会といたしましょう。ここで「"http://www.jagat.or.jp/index.html"に値が"JAGAT"である"creator"がある」という資源を記述する文(statement)は,主語(subject),述部(predicate),目的語(object)に区別され,図4または図5のように記述されます。図5では,述部と目的語が別のボキャブラリで表現されています。これは人が読むというよりも,コンピューターが読んで処理できるということに重点が置かれています。

▼図4 RDFによる資源の記述

<rdf:Statement>
  <rdf:subject   rdf:resource="http://www.jagat.or.jp/index.html"/>
  <rdf:predicate rdf:resource="creator"/>
  <rdf:object    rdf:resource="JAGAT"/>
</rdf:Statement>

▼図5 RDFとその他のボキャブラリによる資源の記述

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
         xmlns:dc="http://purl.org/dc/elements/1.1/">
  <rdf:Description rdf:about="http://www.jagat.or.jp/index.html">
    <dc:creator>JAGAT</dc:creator>
  </rdf:Description>
</rdf:RDF>

ブログとRSS

最後に,ブログとRSSの関わりについて少し触れておきます。周知の通り,ブログとは,特定のテーマに関する論評や記事,あるいは個人的な日記のような内容を時系列順に表示し,さらに関連する他のブログやWebページとリンクを持つWebサイトのことです。ブログは一般のWebページに比べて頻繁に更新され,引用も盛んですので,RSSの便利さが際立つ応用と言えます。

Webでブログのことを調べていると,「ブログとは何か」という論評がいくつかあるのに気がつきました。例えば,ブログの内容には公共性がなければならないとか,あるいは時事性あるいは専門性が高くなければならないとか。しかし私は,こうした意見には賛同できません。今後,ブログやニュースサイトでないWebも書誌情報を発行するようになると見ているからです。

社団法人日本印刷技術協会(JAGAT)
PrintersCircle 2006年9月号より転載
探検 XMLボキャブラリの世界

▲このページのTOPへ

  • XMLとは?IT初心者でもすぐわかるXML超入門
  • 無償で使える!XMLDB「NeoCore」
  • サイバーテック求人情報
  • メールマガジン申し込み
  • TEchScore

  • ▲NeoCoreについて記載されています!

  • ▲XMLマスター教則本です。試験対策はこれでばっちり!
Copyright (c) CyberTech corporation ltd. All ights Reserved. | サイバーテックについて | ご利用ガイド