知っておきたいバイオ/生命科学系データベース・10選《2024年版》【定番無料ツールまとめ】
新型コロナウイルス感染症の流行によりワクチンや抗体医薬・核酸医薬の開発などますます生命科学分野の研究に注目が集まっています。
新たな研究開発をするにあたって、研究者が最初に行うことといえば研究対象の情報収集です。
生命科学分野には学術論文や特許文献、遺伝子・タンパク質配列などの多種多様なデータベースやウェブツールが存在します。
高機能・高付加価値の有料データベース(商用DB)も色々とありますが、今回はバイオ・生命科学分野の研究開発者として絶対に押さえておきたい無料データベースの特徴を目的別にご紹介します。
(※この記事の内容は、2024年6月時点における情報を掲載しています。)
目次
統合データベースサイト
(1)NCBI(エヌシービーアイ)
アメリカ国立医学図書館(National Library of Medicine,NLM)内の国立バイオテクノロジー情報センター(National Center for Biotechnology Information,NCBI)が運用し、生命科学・医学の様々な情報を検索するための窓口(ポータル)となるサイトです。
PubMed、GenBank、Protein、OMIM、dbSNP、BLASTなどの複数のデータベースや解析ソフトにアクセスでき、文献情報検索システム“MEDLINE”と配列情報を結び付けて検索することもできます。
【図1 NCBIサイトの画面】
(※ NCBIのURL:https://www.ncbi.nlm.nih.gov/)
文献データベース
(2)PubMed
生命科学系文献検索の大定番といえるデータベースです。
NCBIが運営する医学・生命科学分野の文献情報データベース”MEDLINE”の無料公開版であり、3,000万件以上の文献データを提供する文献書誌データベースです。
“MEDLINE”に掲載されていない最新の文献も掲載されており、遺伝子・疾患名などでのキーワード検索や雑誌名・著者名などの絞り込みも可能であり、またMeSH(医学用語シソーラス)を用いて論文を検索することができます。
論文の書誌情報や抄録を読むことができますが、リンク機能が強化されPMC(PubMed Central)や電子雑誌で全文を無料で参照することもできます。
[★PubMedの基礎知識についてはこちらのページにまとめていますので、併せてご参照ください。]
【図2 PubMedの画面】
(※ PubMedのURL:https://pubmed.ncbi.nlm.nih.gov/)
(3)Google Scholar
お馴染みのGoogleが提供している、学術論文、特許、書籍に特化した検索エンジンです。
論文が別のどのような論文に引用されているか(被引用情報)を得ることができます。
PubMedでカバーしていない生命科学系以外の分野や、バイオインフォマティクスの解析など情報系の論文も検索できます。
【図3 Google Scholarの画面】
(※ Google ScholarのURL:https://scholar.google.com/)
(4)J-GLOBAL
科学技術振興機構(JST)が提供する検索サービスで、キーワード、研究者、文献、特許、研究課題、期間、科学技術用語、化学物質、遺伝子、資料、研究資源から一括で情報収集することができます。
単純な情報検索ではなく、入力したキーワードの情報につながる情報(文献、特許、最新ニュースなど)を縦横に結び付け関連情報を入手することができ、また外部サイトのリンクが充実しているため、外部リンクよりさらに詳細な情報も入手できます。
【図4 J-GLOBALの画面】
(※ J-GLOBALのURL:https://jglobal.jst.go.jp/)
塩基配列・アミノ酸配列データベース
(5)GenBank/EMBL/DDBJ
塩基配列データベースはDNA、RNAの情報と文献情報を記載したデータベースです。
米国、欧州、日本に各々GenBank(NCBI)、EMBL(EBI)、DDBJ(DDBJセンター)というデータベースが構築されており、3者が国際塩基配列データベース(INSC)を共同運営し、塩基配列の収集を行っているため、いずれかを通じてデータ登録が行われています。
GenBankにアクセスするには、NCBIのサイトの検索窓で”Nucleotide”を選択してキーワード検索することで、目的の配列にアクセスすることができます。
【図5 DDBJの画面】
(※ DDBJのURL:https://www.ddbj.nig.ac.jp/index.html)
(6)Uniprot
タンパク質の配列と機能に関する網羅的かつ精度の高いアノテーション情報を含むデータベースです。
UniProtKB、UniRef、UniParc、Proteomesの4つのデータベースで構築されています。
主要なUniProtKBはタンパク質の配列とアノテーション情報がまとめられており、文献情報を元に手作業で高品質のアノテーションを付けたSwissProtと、機械的にアノテーションを加えたTrEMBLを公開しています。
キーワード検索、BLAST検索、マルチプルアライメント、IDマッピングの検索の検索サービスが提供されており、また数多くの外部データベースへのリンク付けが行われています。
【図6 Uniprotの画面】
(※ UniprotのURL:https://www.uniprot.org/)
ホモロジー検索
(7)NCBI BLAST
BLASTは塩基配列およびアミノ酸配列から類似配列を検索できるツールです。
類似度の確認や2つの配列のアライメントの確認、データベース中の類似配列からの機能推定、PCRプライマーの設計などを行うことができます。
【図7 NCBI BLASTの画面】
(※ NCBI BLASTのURL:https://blast.ncbi.nlm.nih.gov/Blast.cgi)
パスウェイデータベース
(8)KEGG(Kyoto Encyclopedia of Genes and Genomes)
京都大学で開発された生命システム情報統合データベースです。
遺伝子やタンパク質情報(ゲノム情報)と化合物の情報を、分子間相互作用や反応・関係のネットワーク情報のシステム情報)に統合したDBであり、また疾患・医薬品情報も含まれています。
KEGG PATHWAYでは代謝や遺伝情報、シグナル伝達、細胞プロセスなどの経路マップが参照できます。
【図8 KEGGの画面】
(※ KEGG PATHWAY DatabaseのURL:https://www.genome.jp/kegg/pathway.html)
データベース検索のためのデータベース
(9)Integbioデータベースカタログ
JSTバイオサイエンスデータベースセンター(NBDC)が運用するデータベース検索のためのデータベースです。
2,400件以上の国内外の生命科学系データベースの概要を提供しており、[生物種]、[対象]、[データの種類]、[稼働状況]などのタグを組み合わせて検索することができ、自分の目的にあうデータベースを効率的に探すことができます。
【図9 Integbioの画面】
(※ IntegbioのURL:https://integbio.jp/dbcatalog/?lang=ja)
データベースの横断検索
(10)生命科学データベース横断検索(NBDC Cross Search)
NBDCが運用しており、国内外の生命科学分野のデータベースを特許や文献情報とあわせて一括して検索することができます。
検索結果をカテゴリーごとに絞り込むこともでき、入力した語句が含まれるデータベースの検索結果のリンクから直接アクセスすることができます。
【図10 生命科学データベース横断検索の画面】
(※ NBDC生命科学データベース横断検索のURL:https://dbsearch.biosciencedbc.jp/)
【おススメ】知らないと損する生命科学用語のお役立ちツール
① 統合TV (TogoTV)
ライフサイエンス統合データベースセンター(DBCLS)が運用する生命科学分野の有用なデータベースやツールの使い方を動画で紹介するウェブサイトです。
対象は主に無料データベース・ウェブツールが中心で、初めて使用する場合にもわかりやすく、アクセスから操作説明まで動画で解説しています。
キーワード検索以外にも目的別検索(ゲノム・核酸・配列解析、タンパク質配列・構造解析、著名データベースなど)、再生数ランキングから人気の番組も確認することができます。
(※ 統合TVのURL:https://togotv.dbcls.jp/)
② ライフサイエンス辞書
京都大学ライフサイエンス辞書プロジェクトが提供する辞書サイトです。
PubMedに公開されている学術雑誌の論文抄録をもとに解析した生命科学分野の英語専門用語に日本語を解析した結果に基づく訳語を割り当てて、またMeSHに準拠した類似語を整理したシソーラスとなっています。
キーワードを検索すると[音声]、[シソーラス]、[コーパス(*)]など発音や類義語の情報も得られます。
(*)コーパス:注目している英単語の前後にどのような単語が並んでいるかを視覚的に表現し、掛かり受けの関係(名詞なら直前の形容詞や直後の動詞など)を数量的に明らかにするもの。
(※ ライフサイエンス辞書のURL:https://lsd-project.jp/cgi-bin/lsdproj/ejlookup04.pl)
ということで今回は、バイオテクノロジー・生命科学分野の研究開発者なら絶対に知っておきたい定番の無料データベース・無料ツールを厳選してご紹介しました。
もちろん有料の商用情報検索システムを利用すると、きめ細やかな検索機能があり検索がさらに便利になりますが、まずは気軽に使える無料データベースで何かできるのかを把握しておきましょう。
無料DB・ツールの情報をまとめておきたい方は、是非このページをブックマーク登録してご活用ください!
(日本アイアール株式会社 特許調査部 N・Y)