サイトマップは、Google のような検索エンジンに、自分のウェブサイトの クロール可能な URL を教える XML ファイルである。 現時点では、これが検索エンジンに Metacat のクロールとインデクス化を させる唯一の方法である。一件一件のメタデータはサイトマップを使うことで ウェブ検索上で利用可能になるからである。 Metacat はリポジトリ内の誰でも閲覧できる文書全部に対して自動的に サイトマップを作成する。しかし、 それが効果を現すには、サイトマップを検索エンジンに登録しなければ ならない。
Metacat は、リポジトリ内の誰でも閲覧できる文書全部に対して、 毎日自動的にサイトマップファイルを生成する。 そのサイトマップファイルは各自のサーパのウェブ経由で利用可能で なければならない。 そしてそれが効果を発揮するには Google に登録しなければならない。 サイトマップのプロトコルについて詳しくは、Google の サイトマッププロトコルの使用に関するページを参照すること。 Metacat のサイトマップファイルは以下の場所で見る事が出来る。:
<webapps_dir>/sitemaps
このディレクトリには以下のような名前の XML ファイルがある:
metacat<X>.xml
ここで <X> は、各サイトマップファイルを増やすのに使用する 番号である(たとえば、1 や 2)。 Metacat は各サイトマップファイルの中身を 25000 件に制限するので、 25000件のグループごとに追加のサイトマップファイルを作成するのである。
サイトマップファイルがウェブ上で見えるようになっているかどうか 確認するには、以下を見る:
<your_web_context>/sitemaps/metacat<X>.xml
(例えば your.server.org/metacat/sitemaps/metacat1.xml)
自分の Metacat 内の誰でも見られるファイルを Google に インデクス化させるには、そのサイトマップを登録しなければならない。 サイトマップを登録し、またそれが確実に最新の状態になるようにするには、
サイトマップが登録されると、Google は Metacat リポジトリの中の 誰でも見られる文書のインデクス化を開始する。
註: Metacat に誰からでもアクセスできるデータを追加する時は、 Google Webmaster Tools ユーティリティに再び訪問し、 サイトマップの登録をリフレッシュする必要がある。