Series
「博士論文インターネット公表」の現在地 3(終)
「国内博士論文の収集」の舞台裏!〜国立国会図書館インタビュー
植山 廣紀
24/10/29
岡山大学
はじめに
前回の記事では、機関リポジトリで博士論文を登録する際に確認が必要なポイントについてまとめました。博士論文をリポジトリに登録した後は、IRDBを経由してCiNiiや国立国会図書館とデータ連携が行われる、というところまでを追いました。
博士論文がリポジトリに登録された後、IRDBを通して自動的にメタデータが連携されることになりますが、連携先ではどのような業務が行われているのでしょうか?
今回は、博士論文の網羅的な収集を行なっている国立国会図書館の担当者に書面インタビューを行いましたので、その模様をお届けします。
話し手:国立国会図書館関西館電子図書館課 博士論文担当
聞き手:植山 廣紀
国立国会図書館関西館外観
出典:国立国会図書館ウェブサイト(https://www.ndl.go.jp/jp/kansai/about/index.html )
-国立国会図書館における博士論文収集の歴史について、概要を教えてください。
▼国立国会図書館は、学術研究成果の公開・利用の促進に資するため、博士論文を重要なコレクションと位置付け、網羅的に収集しています。
昭和10(1935)年に、当館の前身の一つである帝国図書館に、文部省(当時)が保管していた博士論文が移管されました。以降、帝国図書館が当館に引き継がれてからも同様に、文部省に送付された博士論文の移管を受ける形で収集してきました。そして、文部省大学局長通知「博士の学位授与に関する報告等について」(昭和50年文大大第150号)により、昭和50(1975)年度以後は、学位授与大学等から直接、博士論文の送付を受けてきました。
平成25(2013)年3月11日に学位規則(昭和28年文部省令第9号)が改正され、同年4月1日から施行されたことに伴い、博士論文がインターネットの利用により公表されることになったため、機関リポジトリからの自動収集又は学位授与機関からの送付により電子形態の博士論文を収集するようになり、現在に至ります。
詳細は、以下の国立国会図書館Webサイト等をご覧ください。
◆国内博士論文の収集
https://www.ndl.go.jp/jp/collect/hakuron/index.html
◆外垣豊重「博士論文の収集とその経緯について」(『国立国会図書館月報』 205 号(1978年4月))
https://dl.ndl.go.jp/ja/pid/1151907
◆リサーチ・ナビ>博士論文
https://ndlsearch.ndl.go.jp/rnavi/kansai-kan/post_100044
◆遠隔研修>日本の博士論文の調べ方
https://www.ndl.go.jp/jp/library/training/remote/phd.html
-博士論文の収集状況について教えてください。
▼令和6(2024)年3月末時点で、冊子体の博士論文を約60万点、電子形態の博士論文を約12万点所蔵しています。また、冊子体の博士論文は、当館で順次デジタル化を実施しています。令和6年7月末時点では、昭和62(1987)年度から平成12(2000)年度に送付を受けた冊子体の博士論文約18万点のデジタル化が完了し、国立国会図書館デジタルコレクション(以下、デジコレ)で提供しています。このうち、インターネット公開資料約1万点、図書館・個人送信資料(※)約14万点については、当館に来館せずに本文画像を閲覧することが可能です。一方、電子形態で収集した博士論文は全てデジコレに収録しており、基本的には国立国会図書館の施設内での閲覧に供しています。
※インターネットに公開していないデジタル化資料のうち、絶版等の理由で入手困難な資料については、図書館向けデジタル化資料送信サービス(図書館送信)及び個人向けデジタル化資料送信サービス(個人送信)で提供しています。博士論文でも図書館送信・個人送信での利用が可能なものもあります。
-博士論文のインターネット公表に至った理由の一つに、学位論文の利用ニーズが高いことが挙げられますが、インターネット公表の開始以降、国立国会図書館での利用傾向に変化はありましたか。
▼博士論文の利用傾向の変化がわかる統計は採取しておらず、具体的な数値をお示しすることができません。ただ、冊子体の時は関西館に来館するか東京本館に取り寄せないと利用できなかった博士論文が、インターネット公表やデジタル化により簡便に閲覧できるようになったことで、利用者がアクセスしやすくなったということは言えると思います。
-大学等においては、博士論文を機関リポジトリに公表し、IRDBのデータ連携を確認するまでを行っています。IRDBにデータが連携された後、データはどのような形で連携されていますか。例えば、システム上で確認ができるようになっているのでしょうか。
▼博士論文のデータ連携(当館視点では自動収集。大学側視点では自動提出)は、IRDB、国立国会図書館サーチ(以下、NDLサーチ)及びデジコレ間でのシステム連携により実現しています。
機関リポジトリからIRDBへ連携されたメタデータは、博士論文に限定しない全件をNDLサーチが収集しています。これによりNDLサーチでは、機関リポジトリに収録された各種学術成果の検索が可能となっています。博士論文の自動収集は、NDLサーチがIRDBから収集したメタデータのうち、自動収集の条件[1]に合致する博士論文のメタデータをデジコレに取り込むことにより行います。デジコレでは、メタデータに記述されたURIを用いて機関リポジトリから博士論文の全文ファイルを取得し、メタデータとファイルをセットで登録しています。デジコレに登録された博士論文は、職員がシステム上で確認をした後、公開します。
管理画面(国立国会図書館提供)
このように、システム連携経路の整理・効率化の観点から、機関リポジトリとデジコレが直接連携するのではなく、アグリゲーターであるIRDBやNDLサーチを経由して連携しています。
自動収集の状況を確認したい場合は、デジコレで検索してみてください。IRDBへ連携済みの博士論文がデジコレで見つからず、収集状況の確認をご希望の場合は、個別にお問合せください。
[1]“データ連携 - 国立国会図書館”. 学術機関リポジトリデータベースサポート.
https://support.irdb.nii.ac.jp/ja/harvest/jpcoar/dataprovide_ndl, (参照 2024-09-18).
国立国会図書館による博士論文の自動収集(イメージ)出典:国立国会図書館ウェブサイト (https://www.ndl.go.jp/jp/collect/hakuron/index.html )
-自動収集された博士論文の内容のチェックはどのようにされているのでしょうか?
▼収集したメタデータをもとに、当館の収集対象ではない、全文ファイルを持たないデータが含まれていないかを確認しています。加えて、全文ファイルについては、メタデータと全文ファイルのタイトル・著者等が対応しているか(大きな齟齬がないか)、利用提供に支障がないか(ファイルの閲覧・印刷可否、大部分の図の欠落・文字化け等)を確認しています。機械的な処理と、人力による作業があり、一部は外部委託作業により行っています。
確認の結果、正しい全文ファイルが収集されたのかを当館側で判別することが困難である場合や、電子ファイルに不備がある場合には、各学位授与機関へ確認・修正を依頼しています。
-カレントアウェアネス「国立国会図書館による博士論文収集の現況と課題」 では博士論文の未収集・誤収集の原因が触れられています。これに関連して「未収集の原因」についてお伺いします。カレントアウェアネスは2017年現在のものですが、それから現在までにJPCOARスキーマ対応をはじめ、大学側でも状況が一部で変わりました。2024年現在、「未収集の原因」として大学図書館が注意したほうが良いことは何でしょうか?
▼「未収集の原因」についての分析には至っていませんが、IRDBへ連携されたメタデータのうち、所定の条件を満たしているものが当館へ自動収集されますので、IRDBのご案内[3] [4]に沿ってメタデータを記述いただくことで未収集となってしまうケースが減ると考えられます。ご協力いただけますと幸いです。
また、機関リポジトリのシステムリニューアルなど、大きな変更が生じたタイミングで、博士論文の自動収集が途切れてしまうケースがあります。機関リポジトリ全体に係る変更が発生した際には、博士論文のメタデータが正しく移行・設定されているか、改めてご確認ください。
[3]“データ連携 - 国立国会図書館”. 学術機関リポジトリデータベースサポート.
https://support.irdb.nii.ac.jp/ja/harvest/jpcoar/dataprovide_ndl, (参照 2024-09-18).
[4]“データ連携 - 国立国会図書館”. 学術機関リポジトリデータベースサポート. https://support.irdb.nii.ac.jp/ja/harvest/junii2/dataprovide_ndl, (参照 2024-09-18).
-メタデータの入力の際に気を付けてほしいポイントやよくある誤りと、どのようにすれば改善できるか、教えてください。
▼ご注意いただきたいポイントや、よくある誤りは以下のとおりです。
【メタデータ】
○メタデータフォーマットが「JPCOARスキーマ」の場合
資源タイプ(dc:type)は“doctoral thesis”か。
→“thesis”等、別の値が設定されていることがあります。
本文URL(jpcoar:file/jpcoar:URI)にobjectType属性=“fulltext”が設定されているか。
→設定が漏れていることがあります。また、要旨や要約に対して、“fulltext”が設定されているケースもあります。
全文ファイルがインターネット公開されており、アクセス権(dcterms:accessRights)は“open access”か。
→設定が漏れていることがあります。また、全文ファイルがインターネット公開されていない場合に、“open access”が設定されていることもあります。
○メタデータフォーマットが「junii2」の場合
著者版フラグ(textversion)に“ETD”が設定されているか。
→設定が漏れていることがあります。また、全文ファイルを公開していないアイテムに対し、“ETD”が設定されているケースもあります。
学位授与番号 (grantid)が「科研費機関番号(5桁)+ [甲|乙|*]+第*+報告番号+号」(*は0字以上の任意の文字列、+は文字列の連結)の形式になっているか(例:12345甲第123456号)。
→異なる形式で記述されている、または科研費機関番号が記載されていないことがあります。
なお、IRDBのご案内によると、メタデータが正しく条件を満たしている場合、IRDBのマイコンテンツの一覧表示「OAI連携先種別」に「ndl」が表示される仕様とのことです。IRDBの連携結果を定期的にご確認いただきますと、メタデータの入力誤りに気が付きやすくなると思われます。
【コンテンツファイル】
全文ファイルが登録されているか(要旨等でないか)。
電子ファイルにデータ破損が生じていないか。
メタデータと全文ファイルの組み合わせが、誤りなく登録されているか。
全文ファイルに印刷制限がかけられていないか。
また、メタデータの入力に関することではなく、機関リポジトリをリニューアル等される際の移行仕様やシステムの設定に起因する事象かと思いますが、ご協力いただきたいポイントがあります。
機関リポジトリのリニューアルにより、連携されるメタデータの更新のキーに用いる識別子(OAI-PMHのidentifier)が変更されるケースがあるようです。更新のキーが変更された場合、当館が収集済みのメタデータに対し、以降の更新情報が正しく反映されません。システムリニューアルにおいては様々な制約があるかと思いますが、可能な範囲で更新のキーとなる識別子を維持するようご協力をお願いします。
-収集の漏れは、国立国会図書館側では調査・把握されているのでしょうか。それとも、大学側に任されているのでしょうか。
▼各学位授与機関には、文部科学大臣に提出する学位授与報告書[5]の写しを当館へお送りいただくようお願いしていますが、一部送付漏れが生じています。また、当館にはExcel形式で送付いただくようお願いしていますが、機関ごとにExcelの書式が異なり、報告番号等の記載内容に表記ゆれがある場合もあります。このような事情で学位授与状況の全容把握が困難であるため、調査の着手には至っていません。
学位授与報告書は、当館において収集漏れを確認するためにも必要なものだと考えていますので、記載内容に誤りがないようにご注意いただき、引き続き、当館への送付にもご協力をお願いします。
また、網羅的な収集を達成するため、各機関のお手間が少ない納入方法として自動収集をご活用いただきつつ、学位授与日から1年以内のインターネット公表が困難な博士論文(学位規則第9条第2項)については、当館が提供する送信システムを利用して、メタデータ及び全文ファイルの納入をお願いします。送信システムのご利用には、ID及びパスワード(機関ごとに発行)が必要となります。ID、パスワードの発行を希望される場合は、ご連絡ください。
[5]編注:学位授与報告書の提出方法と様式は、以下に掲載されています。
(別添2)学位規則の一部を改正する省令の施行等について(通知) https://www.mext.go.jp/a_menu/koutou/daigakuin/detail/1332305.htm
文部科学省Webサイト トップ > 教育 > 大学・大学院、専門教育 > 大学院教育について > 学位規則(昭和28年文部省令第9号)https://www.mext.go.jp/a_menu/koutou/daigakuin/detail/mext_02402.html
-最後に、博士論文のインターネット公表を担っている大学図書館のリポジトリ担当に一言、お願いします!
▼当館では、博士論文が印刷公表されていた時代から長きにわたり、学位授与機関のご協力により、博士論文を網羅的に収集・保存してきました。インターネット公表されるようになってからは、各学位授与機関において機関リポジトリを維持いただき、また、所定の記述ルールに則ってメタデータを入力いただくことで、自動収集という効率的な収集を実現・維持することができています。まず、ご協力に深く感謝いたします。
今回はお願いごとばかりを並べてしまいましたが、博士論文の網羅的収集と長期保存、オープンアクセス推進のため、引き続き適切な納入にご協力をお願いします。博士論文の納入に関してお困りの事柄や不明点は、お気軽にご相談ください。
今回のインタビューが、読者の皆様の日々の業務の参考となりましたら幸いです。
(取材を終えて)
博士論文のインターネット収集は、IRDBを通して自動的に連携される点で効率的ではありますが、リポジトリ担当者が気を付けなければいけないポイントが少なくないことがわかりました。私も誤って図版のみのファイルを全文として公表してしまったことがあり、これについてご指摘をいただいて修正したことがありました。気を付けなければならないと思う一方で、細やかなチェックをいただいており大変ありがたいと感じました。
国立国会図書館の担当者様、インタビューへのご協力をいただきありがとうございました。改めましてこの場でもお礼申しあげます。そして、今後もよろしくお願いいたします。
シリーズ「博士論文インターネット公表」の現在地
第1話 「博士論文の公表」を振り返る
第3話 「国内博士論文の収集」の舞台裏!〜国立国会図書館インタビュー