2025年BioHackathon国内版参加報告 by suzuki

先日、DBCLS(ライフサイエンス統合データベースセンター)主催の「2025年BioHackathon国内版」に参加しました。本記事はその参加報告です。

DBCLS は、2007年からライフサイエンスデータの利活用を目指したデータベース開発を行っている機関です。特に知識グラフを活用した情報統合に力を入れており、様々なデータベースやツールの開発に取り組まれています。

BioHackathonとは?

BioHackathonは、ライフサイエンス研究に携わる様々な分野の研究者、技術者、エンジニア、学生などが集まり、お互いに協力しながらデータベースや関連技術を活用して、研究や開発を集中的に進める場です。

今回は福井県の三国で開催されました。スケジュールは、1日目がDBCLSと質量分析インフォマティクス学会によるワークショップ、2日目の午前に自己紹介と課題出し、2-4日目に研究・開発に取り組み、5日目に成果発表という流れでした(私は参加しませんでしたが、3日目には恐竜博物館と東尋坊へのエクスカーションも企画されていました)。参加者の自己紹介や各グループが取り組んだ課題のスライドは、下記GitHub内のリンクに整理されています(https://github.com/dbcls/bh25.7/wiki)。

2025年BioHackathon国内版の様子

私自身、学生時代から何度か参加させていただいており、自身が取り組んでいる課題の研究意義を考え直すきっかけになったり、データ収集や解析、取り扱いに関する実践的なアドバイスをいただいたりと、毎回非常に有意義な時間を過ごさせてもらっていました。

会期中は1週間、ほとんど会場に缶詰状態となり、多くの方と話す機会があります。現在進行形の研究の話や、研究の歴史の話、さらには皆さんの人生経験なども聞く機会があり、刺激的です。大浴場での雑談や、夜にはお酒を交えたディスカッションなど、普段の学会では得られないようなリラックスした雰囲気での交流ができる点も魅力のひとつだと思います。Science Aid代表の山田さんとも、初めての出会いはこのBioHackathonで、研究の話をきっかけに交流が始まりました。

今回の取り組み

今回のBioHackathonでは、主に2ヶ月前から取り組んでいる、ライフサイエンス文献の補足資料に着目した研究に集中して取り組みました。補足資料は検索が難しく見逃されがちですが、データ駆動型研究にとって重要な手がかりとなる情報が多く含まれている可能性があるため、調査を進めています。例えば、18種類の論文誌から均等に収集した4155件の補足資料を調査したところ、合計で63種類ものファイル形式(拡張子)が含まれていることがわかりました。(※ 20250724アップデート:BioHackathon後に発見した2025年6月25日に発行された下記論文によると、3500万件程度の補足資料データを解析し、1200種類以上のファイル形式が確認されたようです。Unlocking the potential of PubMed Central Supplementary Data Files)。これは、補足資料に多様な情報が含まれていることが示唆される一方で、それらを整理・利活用するには大きなハードルとなっていることがわかります。研究はまだ初期段階で、課題の重要性を検証するフェーズなので、共同での開発といった形ではありませんでしたが、多くの方から貴重なご意見をいただき、議論を深める良い機会となりました。特にDBCLSには、私の研究課題と近いテーマに過去取り組まれていた方がいらっしゃったため、非常に鋭いアドバイスを数多くいただけたのは大きな収穫でした。

また、DBCLSのサービスの一つであるTogoTV(ライフサイエンス分野のツールやデータベースの使い方を紹介する動画コンテンツサービス)が、今回のBioHackathonでの開発取り組みインタビュー動画を撮影する試みを行うと聞き、私もインタビューに参加させていただきました。口下手と緊張が発動してしまい動画編集のご負担になってしまっているかもしれませんが、研究の背景や課題意識を簡潔に言語化する機会となり、自身の理解を整理する良い訓練にもなりました。

BioHackathonに参加されている皆様は、それぞれの領域における深い専門知識や熱意を持たれているように感じ、毎度刺激をいただいています。いつもお世話になりっぱなしで、それでも懐深く惜しみなく知識や経験を共有してくださるコミュニティの皆さんに感謝しております。今後は、私もコミュニティに何か貢献できるよう、さらに精進していきたいと思っています。