表紙へ 前の記事 次の記事


XML:拡張可能なマーク付け言語

石塚 英弘

 XMLは,eXtensible Markup Language(拡張可能なマーク付け言語)の略で,その名前はWWWのHTML(HyperText Markup Language)の機能を拡張したことに依っている.この拡張は単なる機能追加ではなく,後に説明するように抜本的である.XMLの目的は,Java言語で書くソフトウェアと組み合わせることによって,インターネット上に次世代高度情報システムを実現することで,その対象はマルチメディア,ディジタル図書館,電子商取引等々と広い.そのため,XMLは各方面から期待されている.
 HTMLは以前からWWWで広く使われてきたが,WWWの適用範囲の拡大に伴ってその限界が明らかになってきた.そこで,HTMLの規格を制定したW3C(WWW Consortium)自体が,HTMLを拡張した新しい言語:XMLを策定し,1997年12月にその仕様の第1版をWWW上で公開した.98年2月にはその修正版が出て,現在(98年11月)に至っている.XMLの最新版は<URL:http://www.w3.org/TR/REC-xml>で見られる.また,97年12月版は日本語に翻訳され,”JIS TR X OO08:1998拡張可能なマーク付け言語(XML)”として日本規格協会から出版され,また,<URL:http://www.y-adagio.com/public/standards/xml/toc.htm>でも見ることができる.なお,TR(Technical Report)は正規の規格になる前の段階であることを示す.
 HTMLの限界とは何か.その第1は,データ項目名(タグ名)を自分で設定できないことである.HTMLにはH1,H2,H3等々のタグがあるが,データの内容を示すタグではない.たとえば,著者名にも章のタイトルにも日2を使った場合,情報サービスの受け手側のプログラム(クライアント)には両者の区別がつかない.どちらも<H2>と書かれているからである.もしも,著者名は<AUT>,章のタイトルは<CHPTIT>と書かれていれば区別できるから,たとえば,章のタイトルだけを取り出して内容目次を作ることができる.また,本の価格に<PRICE>と書かれていれば,購入処理プログラムは楽である.
そこで,XMLではデータ項目名とデータ項目間の関係(階層関係や参照関係)を自分で設定できるようにした.これをDTD(Document Type Definition)というが,この機能の有無がXMLとHTMLの根本的な違いである.
 HTMLの限界の第2は,付加機能はサーバのCGI (Common Gateway Interface)を使って実現するため,サーバに負担が掛かり,実現機能にも限りがあることである.XMLならばクライアント側のプログラムで処理ができるから,サーバの負担を減らし,よりインタラクティブな処理が可能となる.プログラムはJavaで書けるから,クライアントはPCでもWSでもよい.
 なお,XMLには,HTMLを拡張した言語という面の他に,SGML(Standard Generalized Markup Language)の機能を制限することによって,これを扱うソフトウェアを作り易くしたという面もある.SGMLは複雑な言語で,DTDの機能ほか多くの機能を持つ.XMLはDTDは継承したが,SGMLの機能のうち今では不要になった機能を取り外して簡略化した.
 XMLの関連規格として,XMLをWebブラウザに表示するための仕組み:CSS(Cascading Style Sheet)やXSL(XML Stylesheet Language)がある.また,強力なリンク機能の規格:XLinkも提案されている.
 与えられた紙面も尽きようとしている.代わりにXMLの解説書を挙げておくので,参照願いたい.
 WebブラウザがXMLに対応し,XMLを使った次世代高度情報システムが実現する.その日は近い.そして,XMLの関連分野で本学卒業生が今活躍している.その点でも今後が楽しみである.
XMLの解説書
1)村田 真.XML入門.日本経済新聞社, 1998,216p[購入中]
2)XML/SGMLサロン.標準XML完全解説.技術評論社,1998,354p[547.48:X]  


XML(eXtensible Markup Language), by Hidehiro ISHIZUKA

本学教授