The Skills, Role and Career Structure of Data Scientists and Curators, Executive summary 和訳¶
この文章は、 Key Perspectives (2008) “The Skills, Role and Career Structure of Data Scientists and Curators: An Assessment of Current Practice and Future Needs” の executive summary を和訳したものです。
原文は JISC のサイト にあります。
[]は訳者による補足を表します。
データ科学者とキュレーターの技能・職務・キャリア構造 —— 現在の実際と将来の必要性の評価¶
1. 要約¶
JISC から委託されたこの研究は、英国内のデータ管理についての リズ・リオンの報告 (Lyon, 2007) にある、2つの勧告に特に取り組む ためのものである。 このプロジェクトの主目的は、 データ科学者の職務とキャリア開発について、 またそれに連携して データキュレーション技能を持った専門家を 研究コミュニティに対して供給することについての 勧告の検討と作成である。
現在普及している用語は不正確であり、既存のデータ関連の職務の 違いについて誤解を導く傾向がある。 我々は 3.1節において、権威ある組織やこの分野で働いている 人々の実際の経験から提案された定義を一致させることを試みた。 我々は4つの職務を弁別した。すなわち、データ作成者(data creator)、 データ科学者(data scientist)、データ管理者(data manager)、 データ司書(data librarian)である。 我々は以下のように簡潔に定義する。
- データ作成者: 分野の専門知識を備えた研究者で、データを生産する人。 この人々は、データの取り扱いや操作、利用について高い水準の専門技能を 持っていることもある。
- データ科学者: 研究が実施される場所で働く人々、もしくは、 データセンター職員の場合、データの作成者と密接に協力する人々。 彼らは、創造的な調査・解析や、 他の人がデジタルデータを扱えるようにすることや、 データベース技術の開発に関わることがある。
- データ管理者: 計算機科学者、情報技術者、または情報科学者であり、 コンピュータ設備やストレージ、継続的アクセス、データの保全に対する 責任を取る人である。
- データ司書: 図書館コミュニティ出身で、データのキュレーションや 保全や保管について訓練を受け、それを専門とする人。
実際には、データコミュニティ内ではこのような用語はまだ厳密に使用されてはいない。 これらの職務間の境界がはっきりしないこともある。 明白な用語法が広く普及するようになるには時間がかかるだろう。
データ科学は今や国際的に注目される話題である。 USA、カナダ、オーストラリア、英国、そして欧州でも、 進歩が生じている。 注意するべきは、これらの場所すべてにおいて、 データ科学に対する無計画でバラバラの対応に頼るよりも、 各国の様態の上にデータ科学を組織化して開発するべきである、という 見通しが持たれていることである。
研究者たちは概して、データに基づいた研究が引き起こす問題について よりはっきりと気付きつつある。幾らかの人々は既に、 データの取り扱いや管理に関して かなりの技能を備えている(このような人はよく 「生まれつきのデータ科学者」と呼ばれる)。 しかし、この点については経験の浅い人でさえも、 より学ぶことに興味を示すのである。 彼らの仲間内にデータ科学者が居ない場合には、 彼らは手助けと助言を求めて その機関のITサービス部門や図書館に出向く。 幾つかの英国の大学は現在、データ管理に関する 科目履修型修士課程の提供を始めている。 これは全般的なデータ技能の水準を向上させるのに役立つだろう。 データセンターはこのところしばらくの間、データ科学者を訓練し続けて来たし、 彼らが結局は他の職業に転職することを受け入れ、 それゆえデータ技能が研究コミュニティに普及するのを援助して来ている。 それと同様に、 特にデータ関連の問題について大学卒業後に訓練を受けた 研究者の数を増やすことは[データ技能が研究コミュニティに普及する という点で]同じである。
データ科学者は大抵、意図的でなく偶発的にその職務に行き着いている、 より多くのデータ科学のポストが創設されるように変わって来ているけれども。 データ科学者がその職務に適しているのは、 分野の専門家でありながらキャリアを積む間に専門的データ技能を身につけたか、 または、計算機科学出身であるが長年の間に分野の専門知識を獲得したか、 いずれかの理由であろう。 現在ポストを得ているデータ科学者の大部分はこのように言う。 これらの技能は、この仕事に従事する中で学んだ [いわゆる on the job training か]、その理由は、 適切な訓練機会が不足していたからであり、 適切なイベントに参加するコストが(時間的にも金銭的にも)払えないからである、と。 最近まで、資格・適性に関して厳しい要件は無かったが、 現在では、情報学に関する学部卒業後の訓練が要求されるように なる傾向が強まっている。 実際、データ科学者は幅広い技能を必要とする。 分野の専門技能やコンピュータ技能は必要不可欠であるが、しかし 「対人スキル」も評価される。というのもこの職務の主要部分は 研究者のニーズと実践をコンピュータ専門家(先にデータ管理者と定義した 人々に当たる)に通訳することにあるからである。 またある程度は逆方向の通訳もする。
データ科学者について確定的なキャリア構造は存在しない。 もし英国の研究コミュニティにデータ技能を適切に供給するべきであるなら、 これは解決しなければならない主要な問題である。 データ科学者は、大学やデータセンターにおいてテニュア(無期雇用)な 仕事に就いていることもあるし、 短期の研究契約で雇用されていることもある。 大学でテニュアな職に就いているデータ科学者には、さまざなま職級がある だろう。技術的なものから、サービスや学術関連の職級を通って、 完全な学術的職級まで。現時点ではこの体系には一貫性はない。 職の保証が欠けていることは、データ科学者を奨励したり保有し続けたりする点で 問題である。そして現時点では、技能のある人々の供給よりも需要の方が はるかに大きい。 データ科学者(またはその志望者)の間である程度の不満の原因となっている 他の問題は、 彼らが過小評価を感じる傾向があるということである。その原因は、 彼らの職務の専門化が不十分であることや、公式な、組織化されたキャリア構造が 欠けていることにある。
データ科学の職務にある人々は、適切に技能を磨き続けることについて、 大きな、そして継続的な困難に直面している。 データ関連の状況はとても素早く動いていて、 一般的な発展や、分野特有の発展に遅れずに付いて行く必要がある。 幾つかの分野では、これを助けるための国際ワークショップがあるが、 常に十分である訳ではない。 データ科学者は、「今現在一番重要な」特定の話題についての 定期的な短期コースという形態での 専門性開発を継続するという考えを好む。 そして、そのようなシステムが彼らの職務の一部として認められるようになる ことを望んでいる。
学部生のカリキュラム内でデータ技能を伸ばすことに価値があるのかどうか、 見方は二分している。多くの人が利益があると考える — データ科学者自身は、 将来の研究者に昔の基本データ技能を注入することはいいことだと考える — 一方で、学部プログラムを教える多くの人々は、 学部プログラムはそれでなくてもいっぱいいっぱいで、 一定のデータ技能に関する単位を追加する余裕はない、と言う。 彼らはまた指摘する、データ取り扱い技能がとても重くのしかかる分野においては、 学部カリキュラムは既にその要素を持っている(たとえば簡単な関係データベースの 構築と使用を教えるなど)、と。 長い時間をかけて物事が進化して行くにつれて、さらなるデータ技能の訓練は 自然と学部の訓練の一部になっていくのだろうと思われる、 ただし[データ技能という一般的な教え方ではなくて]各分野に適切なやり方で。
データ集約的な研究において図書館の役割は重要である。 研究支援という観点で図書館を戦略的に再位置づけすることは今こそ適切である。 我々は図書館の主要な潜在的役割を3つ発見した。 研究者たちのデータへの意識を高めること、 その機関内で、機関リポジトリを通じて、データの保管・保全サービスを提供すること、 実践に関する新しい専門的要素を データ図書館学という形態に作り上げて行くこと、である。 米国では、この点において既に進歩が見られ、 図書館コミュニティが、データ洪水の需要に合わせて、 データの保管や保全技術を図書館学校教育経由で正式に提供するために組織化 している。 英国でもこの領域において未熟な進歩がある。 しかしながら、充分に専門化されたデータ司書はまだいない。 英国では今現在でちょうど5人いると考えられる。これは早急に変える必要がある ことである。 データ司書がここまで少ない理由のひとつは、 データ科学者にとっての状況と同様である — つまり認められたキャリアパスがないのである。 適任者 — すなわち、 ひとつの専門分野に関してデータの構造や利用法を 理解していることが当たり前になるように、 特定の分野で事前の審査に合格した人 — を呼び寄せるのは現在でも難しい。 加えて、英国よりも先進的な米国では、 データ司書実習生のための適切なインターンシップが欠けていることも この職業の訓練を妨げる要因として明確化されている。 英国でもいずれ、このことが問題であると判明するかも知れない。
本研究から得られる主要な勧告は次の通りである。
1. 研究分野におけるデータ技能開発についての勧告¶
勧告 RD1: 英国内の主要な研究資金提供者は、 データ科学者を正しく定義し正式化するために、 またデータ科学者の仕事が認められ、報酬を受け取ることができる 方法を開発するために、大学・研究機関と協力するべきである。
勧告 RD2: これらの同じ団体は協力するべきである。 データ科学を支援し、その研究を育成し、その職務の専門化することを励ます 情勢を作るために。
勧告 RD3: JISCやその他の、独創的な研究を委託している組織は、 次の問題を扱う研究を進めるべきである。 ・データ科学者が演ずる役割や、彼らが研究に貢献する価値の記述 ・データ科学のキャリアの例 ・データ科学における成功例を代表する事例集の開発
勧告 RD4: 関連団体(HEFCE や研究協議会)は、 データ管理の基礎を扱う 短期の卒業後訓練コースを研究者に届ける技能を持った トレーナーのネットワークを確立し資金提供し、 その結果として基本的なデータ科学の技能を研究プロセスに組み込むこと を考えるべきである。 幾らかの研究協議会はこのための基礎を築いた、 助成申請にデータ計画に関する要項を付けるという方法で。
勧告 RD5: 研究協議会や他の研究資金提供者は考慮するべきである、 助成申請や授与のプロセスの一部として、プロジェクトチームの メンバーのうち少なくともひとりをそのプロジェクトのデータ科学者に 任命することを要求するべきかどうか、を。 この人物は、データ科学とデータ管理の基礎を扱った短期のコースに 参加することを要求されるべきである。 研究協議会は、妥当なコースを公認したり、 参加の証明を必要にしたりという程度の拡張を考えるべきである。
2. 研究図書館におけるデータ技能開発に関する勧告¶
勧告 RL1: 英国の研究図書館コミュニティは大学や研究機関と 協力するべきである、データ司書の役割を適切に定義して 正式なものにすることを、また、データの取り扱いの技能を持っている 図書館員の適切な供給を確実にするようなカリキュラムを開発することを。
勧告 RL2: JISC は International Data curation Education Action (IDEA) 作業部会の発展を支援することを考えるべきである。 このグループは 将来のデータ司書(特に図書館情報学ルートを通って来た人々) のための適切なカリキュラムの開発に関して、 重要な諮問的役割を演じるのに有利な位置にある。
3. データ技能開発に関する一般的な勧告¶
勧告 RG1: データ分野では既に多数の人間が活動しているので、 データ技能訓練という観点から相乗効果を開発するための潜在力がある。 研究はこの潜在力を視野に入れることを推奨する、特に UK Data Archive、データ科学が進んでいる大学や研究グループ、 図書館学校、Digital Curation Center、IDEA (the International Data curation Education Alliance)の活動を調べることを。 また国際的に、US、カナダ、オーストラリアのイニシアチブも 調べてもよいだろう。