1. はじめに

Metacat はデータとメタデータ(データについての説明文)のための リポジトリ(貯蔵庫)であり、科学者が、自分で管理しているデータセットや 他の科学者が作成したデータセットを見つけ出して内容を理解して 効果的に利用することができるようにするものです。 現時点で幾千ものデータセットが標準的な方法で文書化されて Metacat システムに格納されています。 データが充分かつ矛盾なく説明されていることにより、科学コミュニティは 幅広い科学的データを容易に検索したり比較したり統合したり、 また別の用途に利用したりすることができるのです。

Metacat リポジトリはメタデータとデータを格納するのに信頼できる場所である (データベースは安全な接続の上で複製され、すべての記録が複数のコンピュータに 格納されるので、技術的な失敗によりデータが失われることがない)が、 それだけでなく、情報の入力や取り出しのためのユーザフレンドリな インタフェイスを提供する。 科学者たちは、カスタム可能な検索フォームを使って、このリポジトリをウェブから 検索することができる。検索はユーザが指定した条件に基づいて結果を 返す。たとえば地理的範囲や分類学的範囲についての指定や、データセット タイトルやデータの所有者の名前などの場所に指定したキーワードが あるかどうか、など。 ユーザは単に検索結果をクリックするだけで該当するデータセットの説明文を ブラウザに表示することができ、データそのものを入手するのに誰に連絡 すればいいのか(またはウェブ経由でデータを即座にダウンロードするには どうしたらいいのか)を見付けることができる。

Metacat は使いやすい登録アプリケーションを持っていて、 データ提供者がウェブフォームを使ってデータセットの説明文(メタデータ)を Metacat に 入力できるようにしている。そのフォームが送信された時、 Metacat は与えられた説明文(メタデータ)を必要な書式に変換して、格納する。 情報提供者はメタデータ格納のための XML 書式 (訳註・EML 書式のこと)やデータベースのレコードそのものを直接操作する必要はない。 加えて、Metacat アプリケーションは、個々のプロジェクトの特定の要求に合うように データ入力インタフェイスを簡単にカスタマイズできるような拡張性を持っている。 Metacat ユーザは Morpho アプリケーションを使ってメタデータを入力することを 選択できる。Morpho にはデータ入力ウィザードがあり、情報提供者が 個々のデータセットにメタデータを付与する過程を助けてくれる。 (訳註・JaLTER コミュニティでは JaLTER Data Center という メタデータ入力インタフェイスを開発中である)

Metacat に格納されているメタデータは、このデータが何なのか、 利用するにはどうしたらいいのかを理解するのに必要なすべての 情報を含んでいる、すわなち、データセットのタイトル、要約、 そのデータの時間的、空間的、分類学的な範囲、データ収集の方法、 データの配布に関する情報、そして連絡先の情報。 個々の情報提供者は、この情報に誰がアクセスできるのか (一般公開か、指定ユーザだけなのか)、データの説明文(メタデータ)と 一緒にデータセットそのものをアップロードするかどうか、を 決定する。また情報提供者はメタデータを編集したり、リポジトリから 削除して Metacat のわかりやすいウェブインタフェイスを再び 使用(して情報を再投入)することもできる。

Metacat は Java servlet アプリケーションであり、 Linux や Mac OS や Windows 上で PostgreSQL (や Oracle)などのデータベースとウェブサーバと 連携して動作する。 Metacat アプリケーションは、 Ecological Metadata Language (EML) や、 ISO 19139FGDC Biological Data Profile などの他の メタデータ標準を用いて、 XML 書式でデータを格納する。 Metacat についてより多くの情報、または現在 Metacat を使用中の プロジェクトの例については、 http://knb.ecoinformatics.org を参照すること。

1.1. この手引きの内容

この管理者用手引きには、Linux, Mac OS, Windows システム用に Metacat をインストール、設定、管理、拡張するための情報が含まれている。 第4章では、Metacat と、Metacat を Linux および Windows プラットフォーム上で 動かすのに必要なアプリケーションの、ダウンロードとインストールについて 説明する。 第5章では Metacat の設定方法について、新規インストールおよび アップグレードインストールの両方の場合を扱う。 第7章では、Metacat のインタフェイスをカスタマイズしてユーザが 簡単に情報にアクセスしたり情報を登録したりできるようにする方法を 説明する。それは Metacat の汎用ウェブインタフェイス (Registry) を 利用したり、HTML フォームを自作したり、(Morpho のような) デスクトップクライアントを自作する方法である。 第8章では Metacat に埋め込まれた Geoserver を扱う方法について議論する。 第9章では Metacat の複製機能(リプリケーション)の設定方法について説明する。 この機能は複数の Metacat サーバがお互いにデータを共有できるようにし、 メタデータとデータファイルを効果的にバックアップできるようにする。 (訳註・正しくは、リプリケーションとバックアップは異なる概念であり、 リプリケーションはバックアップの代用にはならない) 第10章では Metacat ハーベスタを扱う。これは、サイト(訳註・各 LTER サイト) からEML文書を 取り出して Metacat に投入する作業を自動で実行するプログラムである。 第11章はログについて記す。 第12章は、個々のメタデータをウェブ検索で扱えるようにするための サイトマップの作り方を説明する。 (訳註・ Metacat は各ページを動的に生成し、ページのURLとページ内容が 固定的でないので、ウェブ検索との相性が悪い) 開発者向けに Metacat の Java API が利用可能である。

1.2. Metacat の特徴

Metacat は データとメタデータ(データについての説明文)のリポジトリであり、 科学者たちが、自分で管理するデータセットや、他の科学者が作成した データセットを見つけ出し、内容を理解し、効果的に利用できるようにする ものである。とりわけ、

  • Metacat は、Linux, Mac OS, Windows 上で動作する、Java で書かれた オープンソースウェブアプリケーションである
  • Metacat のウェブインタフェイスはデータの入力や取り出しを容易にする
  • Metacat の地図表示機能は格納されているデータセットの地理的な範囲を 検索したり視覚化することができる
  • Metacat の複製(リプリケーション)機能は Metacat 内のすべてのデータと メタデータが複数の Metacat サーバに安全に格納されるようにする
  • Metacat のインタフェイスは、ウェブフォームやスキン、Java などの言語で作られた ユーザ開発のクライアントツールを用いて簡単に拡張・カスタマイズが可能
  • Metacat ハーベスタはサイトからEML文書を取り出して格納する過程を 自動的に実行する
  • Metacat は Life Sciences Identifiers (LSIDs) (すべてのデータレコードに 重複しない ID が付与される) を使用するようにカスタマイズできる
  • Metacat はメタデータの登録、更新、削除、閲覧などのイベントを記録する ためのロギングシステムを内蔵している
  • Metacat のウェブインタフェイスの見た目はスキンによってカスタマイズできる
  • Metacat は DataONE Member Node インタフェイスに完全に対応しており、 Metacat を設置することで DataONE 連盟に簡単に参加することができる
_images/image007.png

Metacat のデフォルトのホームページ。ユーザはスキンによって見た目をカスタマイズできる。