1. | EMLって何ですか? |
EMLは生態学メタデータ言語を表しています。 EMLはXMLスキ ーマ文書のセットであり、生態学における典型的なデータセットを 文書化するために必要なメタデータを構造的に記述することを可能 にします。 | |
2. | EMLに責任を持つのは誰ですか? |
EMLの最初の2つのリリースバージョン(EML 1.0 と EML 1.4.1) はカルフォルニア大学サンタバーバラ校の国立生態分析統合センター (NCEAS)で開発されました。EML 2.x (とそれに先立つベータ版) を提供する努力は EMLプロジェクトを通して組織されました。 EMLプロジェクトはオープンソース、かつ、コミュニティ指向のプロジ ェクトであり、生態学分野に関係のあるデータを記述するための高 品質なメタデータの仕様を提供するために献身的に活動しています 。 このプロジェクトは完全にボランティアメンバーによって形成され ていて、ボランティアたちは自分の時間と経験を生態学の情報管理 の発展のために提供しています。 プロジェクトの意志決定は、 ecoinformatics.org 憲章 に明記され ている投票手続きによるコンセンサスによってなされます。 最新のリリースに対する重要な貢献は NCEAS や 長期生態系調査プ ログラム、ジョセフ・W・ジョーンズ生態学研究センターの人々か ら来ました。 | |
3. | FGDC が今では CSDGM を通じて生物学データをサポートしてい るのに、EML を使おうというのはなぜですか? |
EML はモジュール方式で、また拡張しやすいからです。 | |
連邦地理資料委員会(FGDC)によって開発された、デジタル地 理空間メタデータのための内容標準(CSDGM)は、モノリシック(一 枚岩)な標準で、そのため他の標準と混ぜたり部分的に合わせたり するのは難しいです──主に空間的な必要条件が理由で。だから、 我々はEMLを一連のモジュールとして構築し、モジュール同士でリ ンクしたり、また他のメタデータ標準ともリンクできるようにしま した。このことは我々に大きな柔軟姓を与えてくれますし、少ない コストで簡単に CSDGM 互換の文書に変換することが可能です。第 二に、我々はより高度なデータ処理ツールを作成しています。これ は、EMLによるメタデータの記述に基づいて、データセットを自動 的に構文解析し、またデータを解析することができるツールです。 FGDC標準におけるさまざまな欠点、主に空間データに対する狭い焦 点のために、たとえば、CSDGM に機械的に文法解析ができて、かつ 意味論的な指向を持つ属性タグを追加する、というようなニーズに 対して CSDGM は充分ではありません。なぜなら CSDGM はモノリシ ックであり、他のメタデータ仕様と動的に結びつけることが許され ないからです。CSDGMにとって唯一の拡張方法は、CSDGM のスーパ ーセットを作成するように管理の申し立てを通すことです──そし てそれはとてもメンテナンスが困難です。加えて、FGDCにおけるメ タデータの粒度水準は非常にむらがあります──空間の投影法など についてはとても細かいですが、手法や標準的ではないデータ形式 の記述に対する顧慮は信じられないくらい簡素です。これは、デー タ形式の数が少ない空間世界では適切ですが、データ形式の標準化 がされていない生態学ではあまり良くありません。 | |
4. | 英文で書かれたEML のための文書はありますか? |
はい、EMLの開発史や構造、モジュールを記述した EML公式仕様書 があります。 それぞれのモジュールの意図が物語として記述されていて、 またそれぞのモジュールの技術的記述がXML注釈にあります。 モジュールの要素ごとの記述は、技術的記述の一部として含まれて います。 | |
5. | なぜ EML はそんなに重要な成果なのですか? |
社会的関心に触媒され、また技術の進歩に促進された結果、 最近の10年間で、生態学や環境のデータは恐ろしいほど爆発的に増 えました。それらのデータは生物圏の複雑性に対する理解を大きく 促進するポテンシャルを持っています。しかしながら、広いスケー ルや総合的な研究は邪魔されている。なぜならデータは、とてつも ない不均一性や複雑性、また多くのばらばらの保管庫に分散してい ることの結果として、とても非組織的でアクセスしにくいからであ る。 EMLは、生態学データのこのような問題に対処するように特に 意図された最初の標準です。EMLが広く採用されて利用されること が、データの発見、アクセス、統合と総合に対してエキサイティン グで新しい可能性を創造することでしょう。 | |
6. | EML の入手法は? |
EML の開発物に関連する全ての文書はプロジェクトのwebサーバ (http://knb.ecofinromatics.org/sofrware/eml/) から利用可能で す。これらのプロジェクトはGPL(Gnu Public License)契約のもとで認 可されており、自由に配布したり修正したりすることができます。 | |
7. | EMLスキーマ文書は極めて複雑です。XMLエディタを使って内容 をマークアップすることは平均的な生態学者にはおそらく不可能で あり、またそれよりもましな人でもしたいと思わないでしょう。 あなた方はどうやって内容をEML化しているのですか? |
「生物多様性のための知識ネットワークプロジェクト」は、特にこのニ ーズに対処するためにクライアントソフトウェアを開発しました。 Morpho (チョウ属に因んで)は(コンピュータプラットホームを越 えた可搬性のために) java で書かれており、EMLへの使いやすい インターフェイスを、生態学者がデータを文書化することを容易に する多くのツールと結びつけます。 これらには逆エンジニアリングウィザードが含まれます。 Morphoは http://knb.ecoinformatics.org/software から利用でき ます。Morpho は現在のところ EML 2.0.0beta6版をサポートしてい ますが、Morpho の開発者たちは EML 2.0.0が安定し次第 Morpho を EML 2.0.0 をサポートするように改良するつもりです。 加えて、 EML文書の編集と、既存のデータベースシステムからEML互換 のメタデータの作成を助けるために、 Xylographa と Xanthoria システムがデザインされています。 | |
8. | EML はコミュニケーションのための対策を含んでいます。 EML の動的オンラインデータ資源を文書化することは可能 ですか? |
はい、eml-physical モジュールの中に、オンラインデータ資源を 記述するための用意があります。eml-physical モジュールは、 ネット越しに配布されたり、またファイルシステムに格納されたり する時のデータフォーマットの構造的な特徴を記述します。 ひとつの物理的オブジェクト(バイトストリームあるいはファイル システム上のオブジェクト)は複数の実体を含むことができます (たとえば、データの表を複数含んだ MS Access のファイルが典 型です)。しかし、ファイルやストリームは典型的に 、テキストベースの形式(ASCIIやUTF-8)で記述されており、 またストリームから実体や属性を取り出すために データストリームをパースするのに必要な情報を含んでいます。 配布形式には3種類あります。オンライン、オフライン、そして インラインです。オンラインデータセットをEMLで記述するために 、あなたはオンライン要素に配布情報を書き込むでしょう。 | |
9. | EMLを使うのに、特別なソフトウェアをダウンロードする必要が ありますか? |
ありません、しかしEMLと協同可能なソフトウェアがあります。 FAQ 7 を見てください。 | |
10. | 既に存在するメタデータをEML化するにはどうしたらよいです か? |
あなたの既存のメタデータがどのような形式かによって、 既存メタデータをEML化するのに使える道はいくつかあります。
注記・いずれの場合においても、EML準拠の文書を作成するために は、いくらか追加のメタデータを加える必要があるでしょう。 Morpho は、追加データを加えたり、必須項目を指示したりして、 自動的にEML準拠のメタデータを生成します。 | |
11. | メタデータを一旦 EML に変換したら、わたしは何をすればい いのですか? もしすべてのメタデータをテキストベースのEMLフ ァイルに格納しているとしたら、データを検索したり、 データの管理のために使ったりするにはどうしたらいいですか? |
EMLはメタデータの伝達のための交換標準ですが、データ管理シス テムの枠組としても使うことができます。 Metacat は多目的なXMLメタデータおよびデータ保管庫で、EMLと一 緒に使うために最適化されています。もしあなたがメタデータをリ レーショナルデータベースに格納していたり、またその計画をして いるなら、解決策があります。 Cocooon と Xanthoria は RDBMS か らEMLを取り出すプログラムの例です。 Cocoon と Xanthoria はともに java アプリケーションで、データ の取り出しと整形に java データベース通信フックとスタイルシー トを使っています。Xanthoria は軽量の解決策で、EML 2.0 のため の XSLT スタイルシートが既に書かれています。この解決策はサイ トを、 おそらくサイト管理活動に統合している RDBMSに張り付けさせますが、またEMLに曝されたメタデータを持ち ます。 | |
12. | EMLのモジュール性は、ひとつの記述が他の多くの文書によっ て共有されることができるということを意味するのですか? |
前のバージョンで、EMLパッケージはパッケージ間のリンクをサポ ートしていました。だからあなたは同じ文書を複数のパッケージで 再利用することができます。EML 2.0.0 RC1 では、我々は単一のパ ッケージの中でのみリンクを許すようにパッケージ構造を再設計し ました。ですから、パッケージの内部で集団の説明や属性一覧を再 利用することはできますが、複数間ではできません。 これは、再利用性を保つことと管理上の問題をより少なくすること の妥協の結果です。 この変更に沿って、全てのメタデータとデータを単一の文書に入れ て運ぶ能力があります──モノリシックな構造に対する制限はまだ ありませんが。これは利点がありますが(DBの正規化と同様の)、 手間もかかります(アクセス制限、所有権、複数のアップデート問 題)。 | |
13. | EMLモジュール同士をリンクするにはどうしたらいいですか? |
"id"属性と"references"要素をそれぞれのモジュールに付けてくだ さい。EMLに含まれるいくつかのモジュールは、ユニークな識別子 (id)によって特定のサブツリーを同定することを許します。 この識別子は、EML文書の他の場所で、"referecnes"要素の中に置 くことによって使うことができます。 | |
再利用可能な特定のブロックが欲しい時、 EMLにおける一般的な道は、複合型(CT)を生成することです。 この概念は、それぞれの複合型に"id"という名前で "xs:string"型 の付属的属性を加えることによって、モジュール同士のリンクをす るために拡張されました。これはCTによって定義されたそれぞれの ブロックをユニークに指示することを可能にします。 "ResourceBase"CTの場合、id要素は"identifier"要素に置き換えら れ、そのパッケージの全体的な識別子として振舞います。 それぞれのCTの内容モデルは、存在している内容モデルと、 "xs:string"型の"references"という名前の新しい要素との間の選 択です。この要素は、そのidによって同定される既存のサブツリー への参照を持つために使われます。 "references"要素と"id"識別子の間の関係は、"id"要素のための "key"と"references"要素のための"keyref"を定義することによっ て実施されます。 key,keyrefの使用はXMLスキーマの場合とやや異なります。なぜな ら、XMLスキーマにおいて、keyはnullであってはならないが、一方 我々は"id"属性を省略可能なものにしたいからです。 従って我々は、keyとkeyrefの調和についての規則をEML規約の中に 組み込みましたが、しかしスキーマの中に直接組み込むことはしま せんでした。それゆえ、EML文書が妥当なEMLかどうかを検証するた めには、EMLにおける参照システムを理解し、それが正しく使用さ れているかどうか検証できるパーサを使わなくてはなりません。 このkeyの妥当性を取り扱うシステムの見本がEMLの配布物と一緒に 送り出されています。(「EMLパーサ」を見てください)。 ここに説明のためのxml文書の見本の断片があります。 ... <creator id="id.p1"> <individualName><surName>Jones</surName></individualName> </creator> <associatedParty> <references>id.p1</references> <role>lackey</role> </associatedParty> <contact> <references>id.p1</references> </contact> ...
サブクラスが参照をするものである限り、 これはまさに他の型を拡張する型のために動作します (たとえば、関連団体は作成者を参照できますが、逆はできません )。 | |
14. | メタデータと同様にデータをEMLに入れることはできますか? |
はい、eml-physicalモジュールにデータを入れるための用意があ ります。このモジュールは、ネット越しに配送されたりファイルシ ステムの中に見られたりする時のデータ形式の構造的な特徴を記述しま す。 ひとつの物理的オブジェクト(バイトストリームあるいはファイル システム上のオブジェクト)は複数の実体を含むことができます (たとえば、データの表を複数含んだ MS Access のファイルが典 型です)。しかし、ファイルやストリームは典型的に 、テキストベースの形式(ASCIIやUTF-8)で記述されており、 またストリームから実体や属性を取り出すために データストリームをパースするのに必要な情報を含んでいます。 配布形式には3種類あります。オンライン、オフライン、そして インラインです。 EMLの中にデータを入れるためには、インライン要素に、データ形 式要素で記述されたデータファイルを置きます。 インライン要素に置かれたデータはeml-physicalモジュールによっ て提供された記述に適合するべきです。バイナリデータファイルは Base64で符号化して入れることができます。 | |
15. | EMLで構造化されたメタデータを使って何ができますか? |
現在、EMLメタデータに基づいて、不均一なデータを自動的に統合したり、 解析的な処理や品質試験をしたりするためのツールの開発が進めら れています。一般的に、EMLのようなメタデータ標準を使うことで データのエントロピーは小さくなり、将来的にデータはより使いや すいものになるでしょう。 | |
16. | EML文書をDTDに対して妥当性検証することができますか? |
いいえ。EML 2.0.0 現在で、DTD はもはやEMLリリースの一部とし て作成されていません。 XMLスキーマ のみがリリースされるでしょう。 それでもなお、XMLスキーマでは表現でき ないEML規則があり、そのためにあなたは特別な妥当性検証装置を 使わなければなりません、この配布物と一緒に提供されている「 EMLパーサ」のような。 | |
17. | EMLにおいて必須の要素はありますか? |
あります。柔軟性のために必須要素を限定しようと試みましたが、 メタデータ文書が意味を持つために要求される情報がいくつもあり ます。メタデータをより有用なものにするために、我々はそのモジュー ルの推奨使用法を持ちます。必須項目と推奨使用法についての詳細 は仕様書を見てください。将来的には、 データやメタデータをある特定の文脈において使いやすいものにし たいという場合に、その目的のために要求されるEML要素を提供す るといったような、 使用法に応じた情報を提供するかも知れません。 | |
18. | EMLにある種のメタデータを入れるのに複数の場所があります。 自分の情報にとって正しい場所がどこなのか知る方法は? |
EML仕様書はそれぞれの要素について詳細な規範的作法について説 明しています。EMLは階層的であり、異なる要素をどこで使うかは 非常に重要です。たとえば、TemporalCoverage要素を使用し、そ れをdataset要素へ参照するならば、データセット全体がその期間 に起こったということを宣言しています。 代わりに、もし DataTable へ参照するならば、そのテーブルだけがそ の期間をカバーしていると宣言しています。 あなたは、使用している構造で何を説明しようとしているのか正確 に判断しなければなりません。 要素の定義におけるありうるバグについての質問は eml-dev MLへ 電子メールを通じて送ることができます。 | |
19. | EMLにおいて "method" と "protocol" の違いはとても微妙だ と思います。両者をどう区別するのですか。 |
eml-methodモジュールは、 フィールドや実験室、処理手順、サンプリング法、単位、品質管理手続きの説明を含む、 そのデータセットの作成時に使われる方法を説明します。 eml-methodモジュールは、データセットの作成や後続の処理に使わ れる「実際の」手続きを説明するのに使用されます。 同様に、eml-methodはデータファイルの品質を定義したり改良した り、もしくはデータファイルに付随する起こり得る問題を同定した りするのに使われる処理を説明するのに使われます。 eml-protocolモジュールは「規定された」手続きを文書化するのに 使うように意図されています。これに対してeml-methodモジュール は実際に実行された手続きを記述するのに使用されます。 この区別は、"protocol"という用語が「規範的な」感覚で使用され ていて、"method"という用語が「記述的な」感覚で使われていると ころにあります。この区別は、良く知られ、確立されたプロトコル についてのライブラリを作ることを許しますが、確立されたプロト コルに関連して真に実施された手続きは何だったのかについても文 書化できます。method は 故意に、もしくはおそらく偶然に、 prolocol からはずれることがあります。しかし手続き上の血統は まだ保存されており、理解可能です。 eml-methodモジュールは、他のモジュールと同様に、 "references"タグを通じて参照することができます。 このことによって、方法について一旦記述したことを、EML文書の他の場 所で ID を通じて参照として利用することができます。 | |
20. | EMLのXSLT変換において "references"はどのように取り扱うこ とができるのですか? |
XSLTは EMLを他の形式に変換するのに使うことができます。しかし 、"references"要素の取り扱いはいくらか複雑です。 "references"要素を取り扱うためのひとつの方法が詳細に記述され たテキストファイルが http://knb.ecoinformatics.org/software/eml/eml-2.0.1/references_XSLT.txt に用意されています。 | |
21. | Dublin Coreメタデータ構想の要素をEML上に対応付けるにはどうす ればいいですか? |
EMLは、全範囲の生態学的資源を文書化できるようにまだ柔軟性を 維持していますが、その一方で、 仕様に Dublin Core のメタデータ要素を採り入れるように試みてい ます。 EMLにおける Dublin Core要素の表現についてのより詳細な情報は http://knb.ecoinformatics.org/software/eml/eml-2.0.1/eml-dublinCore.html で見ることが出来ます。 | |
22. | EMLに貢献したいと思うのですが、可能ですか? |
どんな形であれ、この仕事に対する貢献を歓迎します。 充分な量の時間をつぎこんでEMLの開発と維持に価値のある貢献を する個人は、 ecoinformatics.org憲章 において示されている規則に 応じて、EMLプロジェクトメンバーになるように招待されるで しょう。貢献は多くの形式を取ることができます、EMLスキーマを 開発したり、文書を書いたり、維持を助けたり、など。 このプロジェクトに対して労力を提供したくて、どのようにしたら いいか相談したいのなら、 eml-devMLへ連絡してください。全般的に、我々はあらゆる助力を 欲しています。 | |
23. | EMLはどこで手に入りますか? |
アーカイブされたリリース版を http://knb.ecoinformatics.org/software/eml/ からダウンロード できますし、また CVS サーバから最新の開発版をチェックアウトす ることができます。 |