Dealing with Data, Executive summary 和訳

この文章は、Liz Lyon (2007) “Dealing with Data: Roles, Rights, Responsibilities and Relationships Consultancy Report” の Executive summary を和訳したものです。

原文は JISC のサイト にあります。

[]は訳者のメモです。

「データの取り扱い」要約

この報告書は、データを扱っている機関・データセンター・他の主要な 利害関係者の役割・権利・責任・関係を調査する。 この報告書は主に英国の状況に焦点を当てており、他国の関連する経験や意見も 多少参照する。 またこれは比較的動きの速い分野の「スナップショット」として作成されている。 これは、 「研究データ管理職のための原理とガイドラインについての 高レベル RIN フレームワーク」 と、実践家に焦点を当てた技術開発作業との間のブリッジを提供するために、 戦略的に位置づけられる。 クロス参照しやすい様に、関連する RIN 原則の番号を、個々の勧告に与えた。 [RIN: Research Information Network]

この報告書は2つの方法論的手段に大いに依存している。 協議集会と、利害関係機関の代表者に対する多数の半構造化インタビューである。

これは、e-Science アプリケーションから出現した、急拡大している「データの洪水」の文脈内に ある。 e-Science は、データに対するオープンアクセス方針の推進、 および英国用に調整されたeインフラのための要件を定義するための開発 の背後で勢いを増してきている。 データの多様性や複雑性への認識や、 発展中の類型学への参照が行われている。

結果を突き合わせて統合すると、8つの主要なカテゴリが示される。 連携と戦略、方針と計画、実践、技術的統合と相互運用性、 法的・倫理的問題、持続可能性、市民参加、訓練と技能、である。 著者は示唆する、JISCや利害関係のある幅広いコミュニティは この分野における彼らの活動に焦点を当てる必要がある、と。 そして以下の勧告を作成した。 以下に太字で示した10の勧告は、JISCや研究機関、研究資金提供組織 にとって最も高い優先度であることを示す。

連携と戦略

  • REC 1. JISC は、分野ごとに、関連するキュレーション・保全支援インフラを使っ てデータセットマッピングとギャップ分析することを委託するべきである。(1,5) [既存のデータセットが扱っている対象・分野を整理して、データが少ない対象・分 野を明らかにする]
  • REC 2. 研究資金提供組織は、より長期間にわたり決定的なデータ問題に取り組むた めの協調データキュレーション・データ保全戦略を、共同で開発するべきである。 (1,5)
  • REC 3. The Strategic e-Content Alliance は、データキュレーション・データ保全 のために部門横断的戦略促進の推進役になることを考えるべきである。(1) [JISC の Strategic Content Alliance プログラムのことか。 2006-2012]
  • REC 4. JISC はデータ監査フレームワークを開発するべきである。すべての大学が 、学部ごとのデータ収集、意識、方針、実践の監査を、データキュレーション・デー タ保全のために実施できるように。(1)
  • REC 5. DCC は Data Networking Forum を作るべきである。研究協議会のデータセン ター、JISC データサービスや他の団体のディレクター・マネージャーやスタッフが、 経験や良い実践例を交換できるように。(1)

方針と計画

  • REC 6. 各研究資金提供組織は、データ管理・保全・共有方針を公開し、履行し、強 制するべきである。(1)
  • REC 7. すべての関連する利害関係団体は、研究者が適切なオープンアクセスのデータ リポジトリに研究データを定期的に預けることを奨励するようなインセンティブを、 識別して促進するべきである。(3)
  • REC 8. JISC は研究を委託するべきである。ソーシャルソフトウェアフォーラムを通 して研究データを共有することに関連する、現時点の実践を調査し、将来的な潜在力 を査定し、キュレーションと保全の問題を評価する研究を。(3)
  • REC 9. 助成を受けている各研究プロジェクトは、構造化されたデータ管理計画を、 資金申請書の不可欠な部分として、ピアレビューのために提出するべきである。 (1,2)
  • REC 10. 各高等教育機関は、機関ごとにデータ管理・保全・共有方針を履行するべ きである。その方針は、適切なオープンアクセスのデータリポジトリやデータセンタ ーが存在する場合はそこにデータを預けることを推奨するような方針である。 (1,2,5)

実践

  • REC 11. JISC は DCC SCARP プロジェクトの作業を拡張するべきである。データ管理 ・キュレーション・共有・保全についての徹底的な分野ごとのデータに関するケース スタディの範囲を増やすために。(3,5) [DCC SCARP: Disciplinary Approaches to Sharing, Curation, Reuse and Preservation, 2007-2009]
  • REC 12. JISC は研究を委託するべきである。 end to end の研究ワークフローの一部 として、幅広い装置や実験設備からデータやメタデータを源で捕獲することを取り巻 くプロセスと問題を評価するための研究を。(2,3) [何を言いたいのかよく分からな い。分析機器にコンピュータを直接繋いでデータをそのまま取り込むようなことを言 っているのか?]
  • REC 13. JISC は研究を委託するべきである。科学的データのための、一般的なデータ モデル、およびメタデータスキーマアプリケーションプロファイルの応用可能性につ いて。(2,3) [metadata schema application profiles って何?]
  • REC 14. JISC は、Common Repository Interfaces Working Group (CRIG) とドメイン パートナーを通して、分野ごとのデータのためのリポジトリ保管 API の実現可能性を 調査するべきである。 (3)
  • REC 15. データ保管のためのスケーラブルで持続可能な運用モデルを識別して促進す る必要がある。それは研究者と共通標準との協調的協力関係に基づくものである。 (2,3)
  • REC 16. JISC 学術コミュニケーショングループは RIN コミュニケーショングループ と協力するべきである。データ公開原則とその良い実践例を精査するために。(3)
  • REC 17. JISC は委託するべきである。分野をまたいだアクセス管理とデータ共有のた めの様々なメカニズムの効率性と応用可能性の調査を。(3)
  • REC 18. 機関リポジトリとデータセンターソフトウェアプラットホームを結び付ける ような、統合的情報アーキテクチャを識別するためのより多くの作業が必要である。 (3)
  • REC 19. すべての関連する利害関係団体は研究を委託するべきである。データセッ トの流用(re-purposing)を見積もり、再利用を促進する重要な性質の識別し、良き実 践のためのガイドラインや効果的な品質保証メカニズムを開発し奨励するための。 (2,3)
  • REC 20. JISC は調査を始めるべきである。研究者への訓練からユーザの要求を集め て、アーカイブやリポジトリに保持されているデータの解釈・変換・再利用のために どのような付加価値のあるツールやサービスを開発すればいいのかを明らかにするた めに。 (2,3)

技術的統合と相互運用性

  • REC 21. JISC はドメインパートナーと協力するべきである。コミュニティのデータ標 準についての分野内の意見の一致を達成することに成功したメカニズムを識別して奨 励するために。(2,3)
  • REC 22. コミュニティのデータ標準の開発と採択のためのレジストリまたは他のイン フラサービスの効率性の評価が必要である。 (2,3)
  • REC 23. JISC は開発作業を委託するべきである。データセットに対する識別子の応用 を調査すること、データ引用についての良き実践のためのガイドラインを生産するこ とを。(2,3)
  • REC 24. 複雑なデータセットのバージョン制御のために、モデルを決定するための技 術的作業と、良き実践例が必要である。(2,5)
  • REC 25. JISC は他の利害関係団体と協力するべきである。データセットのための様々 の注釈モデルと標準を調べること、良き実践のためのガイドラインを開発することに ついて。(2,3)
  • REC 26. JISC はリポジトリの技術的開発プロジェクトに資金提供するべきである。 OAI-ORE の作業に基づいていて、データオブジェクトと派生資源との間の頑強で双方 向の分野間リンクを作るようなプロジェクトに。(2,3) [由来追跡機能のことか]
  • REC 27. JISC は資金提供するべきである。データ・情報の環境全体を横断して作動す るようなデータ発見サービスを強化しようとする技術的開発プロジェクトに。 (2,3)

法的・倫理的問題

  • REC 28. JISCLegal は強化された助言と案内を研究コミュニティに提供するべきであ る。知的所有権 (IPR, Interectual Property Rights) の全側面において、またデー タセットに関連する他の権利問題についての助言・案内を。 (2,3)
  • REC 29. JISC および研究協議会による、データのためのモデルライセンスの開発作業 は、標準ライセンスの最小セットがより広く採用されるように調整されるべきである 。(2,3)

持続可能性

  • REC 30. JISC は、研究資金提供団体と協力関係を結んで作業するべきである。また 共同で、データキュレーション・データ保全インフラについて費用対効果研究を委託 するべきである。(4,5)
  • REC 31. JISC は、持続可能な解決策を開発するために、保全・データ共有インフラの ための新しい経済モデルの構築を委託するべきである。(4,5)

提言

  • REC 32. DCC は、特定の分野に絞り、データ収集・保管についての技術的側面に取り 組むような。協調的な提言プログラムを奨励するべきである。(2,3)

訓練と技能

  • REC 33. DCC は他の団体と協力するべきである。特定の分野の研究者を狙い、その 部門の労働力の容量を築くための協調的訓練プログラムや支援物質を配ることに対し て。 (3,4)
  • REC 34. データ科学者の職務とキャリア開発、およびそのことによる専門的なデータ キュレーション技能の研究コミュニティへの供給を調べる研究が必要である。(3,4)
  • REC 35. JISC は研究に資金提供するべきである。学部または学部卒業後のカリキュラ ムにおいてデータ取り扱い、キュレーション、保全の技能を拡張することの価値と潜 在力を評価する研究に。(4)

この勧告集に含まれている主な年代依存性についても記述する。 分野別のデータセットマッピングとギャップ分析(Rec 1)は、 研究資金提供団体によって、 協調的データキュレーション・保全戦略の開発(Rec 2)を特徴付けるだろう。 データ監査フレームワーク(Rec 4)は理想的には 機関ごとのデータ管理・保全・共有方針(Rec 10)の開発のための共通基盤を形成する のに適しているだろう。

この結果から明らかとなった、 提案された役割・権利・責任・関係はサマリ表に示されている。

2つの新しい高レベルのデータフローモデル(サマリ表から派生したものと 良き実践のメリハリついた代表例を描いたもの)が記述されている。 Domain Data Deposit Model と Federation Data Deposit Model である。

脚注

参考のため、5つの RIN 原則とは:

  • 1. 研究者・研究機関・資金提供者の役割と責任は可能な限り明白に説明されるべきで ある。それらは協力して実践の慣例のフレームワークを確立するべきである。研究デ ータの作成者と利用者がこの文書の述べられているこの原則に合わせて彼らの責任を 意識して果たすことを確実にするために。
  • 2. デジタル研究データは適切な国際的標準に従って作成・収集されるべきである。ま た他人に利用可能にするためにデータを選別するプロセスには適切な品質保証が含ま れるべきである。
  • 3. デジタル研究データは容易に発見できるべきである。またアクセスは最大限使いや すい環境で提供されるべきであり、データを収集して作成した人々の権利に対してク レジットを提供して保護し、またデータがどのようにアクセス可能になり利用される のかについて正当な関心を持つ人の権利を保護する。
  • 4. デジタル研究データに対するアクセス管理やアクセス提供のためのモデルやメカニ ズムはどちらも、公的資金や他の資金の使用の点で効果的でコスト効率的でなければ ならない。
  • 5. 現在・将来の研究から生じるデジタル研究データの長期的な価値は、現在・将来世 代に対して、保護されるべきであり、利用可能であり続けるべきである。