
Talk
BarOA|第1夜 : 浦上裕光氏×鈴木雅子氏|3杯目
出版社は研究データにどう関わっているんですか?
浦上 裕光 / 鈴木 雅子
25/6/27
Springer Nature / 九州大学
とある下町にある雑居ビル。裏手の階段を降りた先にあるBar Open Access(BarOA)では、様々な思惑を秘めた大人たちが和やかに好きな飲み物を片手に談笑している。さて、今宵はどんなお話が展開されているのやら......。
話は進み研究データ管理・公開の話題に。現状の取り組み、政策動向、データの実際、それらを受けた今後の図書館・学術情報流通の在り方。データと同じく様々な粒度で巡りながら、夜は更に深まっていきます。 -- おかわりをご希望ですか? 〔 1杯目 2杯目 〕
\今宵のお客様/

浦上 裕光(Springer Nature) 岡山県生まれ、千葉とカリフォルニア育ち。大学からポスドクまでアメリカとドイツで化学関連の分野で研究に携わり、国内企業の研究職に。その後、出版業界に転職し11年強。化学は好きなので、まだ時々論文を眺めます。最近は読書と海外旅行から離れてしまっているので、そのうちまた再開したいと考えております。

鈴木 雅子(九州大学) 学術情報センター(現国立情報学研究所NII)で採用され、大阪大学に転出。諸事情により北海道大学に転勤したのち、小樽商科大学、北海道大学、旭川医科大学、静岡大学、NII、名古屋大学、神戸大学、九州大学、と転々としてきた。住んだ所みな都。『月刊DRF』やJUSTICE『jusmine』を創刊・命名した若かりし頃のヒラメキやパワーが今や見る影もないため、最近は体力をつけるべく山登りを楽しんでいる。
1. オープンサイエンス推進と研究データの公開
浦上(以降U)|僕も図書館の方に会ったら聞いてみたかったことがあるんですよ。 研究データの管理・共有においての図書館の役割、具体的にはデータ登録って、どういうことをされるんですか?
鈴木(以降S)|研究データの管理や公開については、大学図書館ではまだ「データ登録」を定常的に行っているところはあんまりないかなと思います。 例えば九州大学の場合は、データ駆動イノベーション推進本部、DX推進本部って呼んでますけど、図書館とは別の組織があって、その中の研究データ管理支援部門が学内のデータ管理や保存について検討や支援を行っているんですね。研究データ10年保存の、研究公正の文脈で、ストレージを用意したりですね。その部門の事務を図書館が担当していて、連携して検討や支援をしている格好です。 大学の研究データ管理・公開ポリシーも作ったし、各学部で実施要領も作ってもらったんですよね。全部局の実施要領が策定済みという面では国内でも進んでいる方かなと思うんですが、だけど実施要領があっても、実際に運用しようと思うとなかなか難しい。先日は、退職教員のデータについて相談がありました。まだ事例も少ないんですよね。だから大学では、教員、図書館職員、学部の担当事務の方、関係者みんなで一緒にひとつひとつ考えているような段階かなと思います。
U|即時OA方針[1]に沿ったデータ登録っていうのと、実際の、より生データに近いところの登録って、だいぶ違うとは思うのですが、いかがでしょうか。
S|全然違いますね。
U|両方お聞きしたいのですが、今回のOA方針の文脈で、論文に紐づいてるデータを登録していくというのは、図書館としてどういったところが難しいですか?
S|まず、どんなメタデータをつければいいか、ですね。国の方針では、論文掲載ジャーナルから公開が求められる根拠データを公開することって言ってるんですよね。ジャーナルが求める場合、場所も指定されることが多いのかな、リポジトリに載せるのはもしかしたらあんまりないのかな、って想像してるんですが、Springer Natureさんはデータ公開する基盤はあるんですか?
U|Nature関連誌、あとは、アカデミックジャーナルの一部は機関リポジトリ・インフラストラクチャーのプロバイダーであるFigshareと提携をしておりまして、論文投稿と一緒にデータも投稿できるサービスがあります。出版社側では、投稿されたデータのメタデータが揃っているかとか、センシティブなデータが含まれていないか、などのチェックが入り、その論文が出版されると同時に、データも一緒に公開されるみたいな、そういったサービスはあるんですよ。 ただ、今回の方針に関しては、論文に紐づくデータで、生データとは書いてないですよね。だからおそらく、DOIとかで、データはここで公開されています、って示せたらいいんですかね。
S|いいんですかね。データのDOIを示すのかな[2]。 そういえば、何年か前に、査読者に論文の関連データを見せてほしいと言われているんだけど置く場所がない、って学内の先生から相談を受けて、リポジトリを使ってもらったケースがある、と聞いたことがあります。 論文が出版されたら根拠データとしてそのリポジトリから公開することになると思うんですが、査読に落ちた場合は、消すのか、メタデータを付けて単独で公開するか、リポジトリのポリシーにも関係しますね。
U|今回の方針とは別にも、おそらく各大学では、論文に紐づいていないデータの登録、及び利活用が促されていると思うんですけど、そういう根拠データに限らない研究データの扱いでは、どういったところが一番難しいですか?
S|どんなデータがあるのか分からないところですね。メタデータをどう付けたらいいか、という点もそうだし、ファイル形式とかサイズとか、公開してよいものかどうかとか。難しいです。 利活用のためにどんどんデータを公開してくださいという方針は、今回の方針よりもっと前に内閣府から出てるんですね[3]。先生方からは、大事なデータをなぜ公開しなきゃいけないのか、といった意見もありました。 それを基に論文を書くわけなので、公開してもいいと思うデータはもういらなくなったデータなのかなと思ったりします。どの段階のデータを公開すればよいのか、という質問もありましたね。 あと、データを取ったこと自体が評価される分野、取ったデータを使ってほしいっていう分野もあるってよく言われますが、どの分野なのか、扱うデータがどういうものなのか、そもそも分野で分けられるものなのかよくわからない。そういうところも難しいです。
U|データの種類は本当に多いですよね。個人情報の課題もあるかと思います。また、リポジトリの数も多く、先生方も全ての専門分野のリポジトリを知っているわけではないかもしれないし、どれを分野リポジトリに置いて、どれを大学のリポジトリに置くか、その辺もいろいろ難しそうですね。 漠然とは難しさが分かるようなところもあるんですけど、具体的にはどうなのかとずっと思っていて。

S|これは個人的な意見ですが、図書館は、先生方に、データをどんどん公開してください、こう活用してください、と旗振りをするんじゃなくて、どちらかというと、困っている学内の先生を助けたい、とか、お手伝いしたいって思っているんですよね。
U|データに関して先生方をサポートされるのは図書館の役割で、URAなど、いわゆる研究推進ではないんですね?
S|研究推進だと思うんですけど……ただ、URAの人もいろいろ役割があって、外部資金を取りに行くところとか、産学連携とか、研究の前の部分のサポートを主に担当されている場合が多いように思います。URAがたくさんいる大学もありますけど、多くの大学はそうじゃないので、学内バランスですね、図書館は研究成果論文の公開をやってきたから、少なくとも公開の部分に関しては研究成果としてのデータも図書館が担当します、学内関連部署みんなで連携・協力してやっていきましょう、という感じではないかと思います。
U|図書館でも、知っていないといけない知識とかスキルセットは変わってきているのでしょうか? その場合、勉強会やトレーニングを通して学んでいくか、新しい人を雇用するしかないのでしょうか。
S|そうですね。でも、新しい人を雇用しても、その人が全部の分野に詳しいわけではないから……。結局はそのデータの持ち主の先生に聞きながらやるしかないかなと感じます。各分野に詳しい人に協力してもらう体制がとれるといいですね。 トレーニングについては、JPCOARからトレーニングツールや教材動画を公開していますよ。
U|大変そうですね!
S|一方で、これは以前在籍した大学の話ですが、分野のリポジトリで公開してる観測データを、うちの大学にも大学の成果として保存しておきたい、っていう先生もいて。素晴らしいですよね。でもそんな大きいストレージが用意できるか、そういう問題もありますよね。
U|ストレージの課題は我々にもあります。我々のFigshareのサービスもサイズ上限が決まっていますから。
2. 何のために、どのデータを公開するか
S|話が戻るんですけど、ジャーナルで求められる根拠データってどの程度のデータなんでしょう? ジャーナルや分野によって違うと思うんですけど。 たとえば、ある論文に表とかグラフとかがあったとして、どんなデータを根拠として出すんでしょう? 生データじゃないですよね?
U|根拠データとして重要なのは、そのデータが論文の内容や主張をエビデンスとしてサポートしているということだと思います。生かどうかというより、論文をサポートするのに十分であるかどうか、でしょうか。 データのリポジトリへの登録に関しては、そのコミュニティーごとにスタンダードというか、習慣があるようです。この分野であれば、こういったデータはここのリポジトリに入れてください、みたいな。ただ、各分野で習慣が大きく異なるかもしれません。 より上流にあるデータの利活用の文脈では、既に精製されている表やグラフだけ出されてもそれは見て終わりなので、ある程度自分なりに遊べるものが良いと聞いたことはあります。その一方、生データに関して、ある研究者は、生データのまま出しても意味がないものもあるから、って言われたりするんですよ。だから、全て生データであればいいというわけでもなくて。 自分が知らないことが多いので、もっと知識を深めたいと思います。
S|先日、データ公開、公開って言うけど、全部フォーマットは違うじゃないか、期間も違えば、粒度も違う、そんなデータを各自が公開していってビッグデータとして使えるの? って聞かれたんですよね。
U|そうですね。でも、そのような詳細は透明性や再現性の観点から、また記録としても大切ですよね。
S|だから、メタデータが大事なんだっていうのはわかるんだけど、じゃあどこまで書いとけばいいか難しいですよね。各分野でメタデータスキーマが作られている分野もありますが。
U|再現性や透明性の観点では、できるだけオープンで、できるだけ粒度が細かくて、コンディションもメタデータもきちんと詳しく書いている方が良いのだと思います。 あと再現について言えば、化学分野では、なぜかこの人だとうまくいく、ってこともあるらしいんです。説明が難しいコツのようなものでしょうか……。 最近聞いた、植物を使った研究をされている方の話だと、同じ植物を育てても、ちょっと土が違ったり陽の当たりが違うと、影響されるようです。 その分野によって、もしかしたら再現性の定義というか、幅って違うんだろうなって想像しています。
S|面白いですね。
U|データに関しては今後もっと勉強していかないといけないと思っていて。例えば、データ管理に関する問題は色々聞くんですけど、自分自身が直接関わっていないので、耳にする課題に関して具体的に想像がつかないところが多々あります。その辺はもうちょっと理解を深めたいと思います。
3. 大学図書館の役割
U|今はその、OAやオープンデータの潮流がありますが、その中で図書館の新しい役割というか、図書館は、今後や未来ってどうなっていくんでしょうか?
S|どうなっていくんでしょうね。
U|この前、ある海外の大学で図書館関係者と図書館の未来について話した時に、もちろんモノはデジタルになっていくんだけど、やっぱりフィジカルスペースとしてのバリューをちゃんと上げていかないといけない、みたいなこと話されてて。そういった話は日本でも聞いたことあるんですけど。
S|場としての図書館はね、やっぱりコロナ禍を経て、大事だなと思いますね。その価値を上げていくのは大事だし、価値を理解してもらって図書館を活用してもらわないと、というのはもちろんあるんですけど。大学図書館の未来としては、私自身は、もっと研究支援の方向に行くのかなと思ってます。学生も研究者の卵なので、レポートの書き方や文献検索セミナーは学習支援というより、研究支援と言えると思うんですよね。 なので、個人的には、雑誌とか論文とかの学術情報流通が今後どうなっていくのかな、っていうところが本当、興味深いですね。

U|ジャーナルの数は今後も増えていくかとか、出版自体が、つまり研究成果を入れる箱がどう変わっていくかとか、そういったところですか。
S|よく思うんですけど、図書館の業務も、紙の本を買ってきて整理して並べて、っていう昔の業務から、デジタル資料がけっこう増えたりサービスの種類も増えてたりしているけど、システムはあんまり変わってないんですよね。ジャーナルも、紙ベースだった雑誌がデジタルになって数が劇的に増えた、便利になった、と思いますが、基本的なカタチは変わっていないように思うんです。今後は、もっと劇的に、カタチも変わっていくんじゃないかなと予感しています。どう変わるのか予測できているわけじゃないんですけど、論文やジャーナルとは別の新しいカタチが出てくる可能性があるんじゃないかと。 そうしたら、「研究成果」自体が変わることになりますし、「研究」自体も変わるかもしれないですね。図書館は、先生方の研究が変わったから変わるんじゃなくて、兆候を見逃さずに先んじて劇的に変わっていかないといけないなと思っているんです。
U|そうですよね。多分これって、何が研究成果としてみなされるか、ってのもあると思うんですよね。現時点では、一番まとまった形が論文である、ってことだと思うんですけれども。 研究の伝え方も、例えば、ネガティブデータの扱い、データセットを中心とした発表や、例えばポッドキャストなど、今までとは異なる形式での発信だとか、可能性としては色々な伝え方が考えられますよね。今後、そういったものがどういう風に評価されるかって考えると、面白いですよね。
S|面白いですね。
→ 4杯目へつづく(準備中)
~ 今宵のドリンク(3杯目) ~


[1]“学術論文等の即時オープンアクセスの実現に向けた基本方針”.https://www8.cao.go.jp/cstp/oa_240216.pdf, (参照2025-06-12). [2]“「学術論文等の即時オープンアクセスの実現に向けた基本方針」(統合イノベーション戦略推進会議令和6年2月 16 日決定)の実施にあたっての具体的方策”(参照2025-06-27)の「4. オープンアクセスの実施状況の把握」において、「(略)各資金配分機関に対する毎年度の実績報告時に個々の学術論文及び根拠データごとに以下の情報を記載する。」として「ⅶ. 根拠データへのリンク(「機関リポジトリ等の情報基盤」のランディングページの URL 等の識別子。根拠データの公表が求められていない場合はその旨)」とされており、また“学術論文等の即時オープンアクセスの実現に向けた基本方針、及び学術論文等の即時オープンアクセスの実現に向けた基本方針の実施にあたっての具体的方策に関するFAQ(令和6年10月8日更新)”(参照2025-06-27)において、質問番号12 回答にて「所属機関のリポジトリへの掲載により公開をすることを原則としつつ、資金配分機関への実績報告に識別子(DOIあるいはそのほかのPID(永続的識別子))を記載するなど、NII RDC上で学術論文及び根拠データを検索可能になれば、他のプラットフォームで公開することも可能です。」とされている。 [3] "我が国におけるオープンサイエンス推進の在り方について:サイエンスの新たな飛躍の時代の幕開け". https://www8.cao.go.jp/cstp/sonota/openscience/150330_openscience_1.pdf, (参照2025-06-12).
※BarOAは架空のバーです。 ※対談は2024年11月に行われたものです。内容・所属等は対談時の情報に基づきます。