糖尿病とXML


最近は、本屋さんに行くとコンピュータ関連の書棚にはやたらと「XML」関連の書籍が並 んでいます。これは、一体何なのでしょうか。

XMLとはデータを構造的に記述するための言語です。言語といっても単に通常の文章に タグといわれる記号(<>)を付け加えたものです。

これと非常に似たものにHTMLというものがあります。 インターネットをしている方にはおなじみのものです。

ブラウザでどこかのホーム・ページを表示しておいてメニューの 「表示」「ソース」ででてくるものがHTMLなのです。 これをよく見てみるとたとえHTMLについて全く知らなくても、何となく何が 書いてあるかわかります。

HTMLについては、この連載でも何回か取り上げました (第65回第70回第76回第82回)。

さて、XMLはホーム・ページを記述するときにも利用できますが、ホーム・ページを記 述するためのものではありません。HTMLではホーム・ページの見た目(文字の色とか大き さとか、背景の色指定など)を記述することができますがXMLでは見た目は記述できませ ん。あくまでもデータを構造的に記述するためのものです。

では、構造的に記述するとはどういうことでしょうか。たとえば「網膜症」という言葉 を記述したとします。これだけでは、「網膜症」という言葉を知らない人が見てもほとんど 意味がありません。しかし、「疾病」というタグで囲まれた中に「糖尿病」というタグがあ り、この中に「合併症」というタグがあり、この中の「慢性合併症」というタグで囲まれ た中に「網膜症」が記述されていたらどうでしょうか。たとえ「網膜症」という言葉を知 らなくても「あ、これは糖尿病という病気の慢性合併症の一つなのだな」と想像がつくで しょう。

さて、XMLで記述するにはもう一つ良い点があります。XMLでもHTMLでも単純なテ キストファイルと呼ばれるファイル形式で保存されます。これは、コンピュータの種類と か基本ソフト(OS)などに依存せず読み出すことができます。また、ある言葉を含んだファ イルを探し出すときテキストファイルであれば大変便利です。

ある大学では、いろいろな文書を特定のワープロソフトで作っておいて系統的な資料に せよと指導しているところがありますが、これは間違いです。ワープロソフトで作った文 書はバイナリ・ファイルであり検索に問題があります。また、互換性も問題となります。 さらに決定的な違いは、データを構造的に記述しなくてもワープロは何も文句を言いませ ん。

すでにXMLはいろいろなところで使われています。コンピュータを持っている人は調べ てみてください。思わぬ所で使われていてびっくりするはずです。


目次(9)に戻る 前の号を読む 次の号を読む ホーム・ページに戻る