Aktualisierung der frei zugänglichen Datenbank BacDive ermöglicht Zugriff auf über 900.000 Metadaten
Die Wissenschaftler Dr. Lorenz Reimer, Joaquim Sardà und Prof. Dr. Jörg Overmann vom Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen haben mit der Aktualisierung im April 2019 die Datenbank BacDive ( https://bacdive.dsmz.de) umfassend erweitert. Bereits seit 2012 entwickeln die Bioinformatiker der DSMZ mit BacDive (the Bacterial Diversity Metadatabase) eine weltweit einzigartige Datenbank, die bisher nicht verfügbare Daten von Bakterien und Archaeen frei zugänglich macht. Die Entwicklung folgt dabei den FAIR-Prinzipien, nach denen wissenschaftliche Daten auffindbar, zugänglich, interoperabel und wiederverwendbar (Findable, Accessible, Interoperable, Re-usable) sein sollen.
Mehr als 600 Datenfelder verfügbar
Die Nutzungsmöglichkeiten von BacDive werden kontinuierlich erweitert, aktuell können Wissenschaftler über 600 Datenfelder für die Suche nach mikrobiologischen Informationen nutzen. Das Repertoire umfasst neben den initialen Speziesbeschreibungen und Stoffwechselprofilen auch Daten über enzymatische Aktivitäten und Antibiotikaresistenzen. Darüber hinaus bietet BacDive mit 9.000 Analytical Profile Tests (API) für über 5.000 bakterielle Stämme die größte öffentlich verfügbare API-Datensammlung weltweit.
Integration von externen Daten und Interoperabilität
Um der Wissenschaft eine umfassende Datenbank bieten zu können, pflegen die DSMZ-Wissenschaftler kontinuierlich auch die mikrobiologischen Metadaten anderer europäischer Stammsammlungen in BacDive ein. Mit dem aktuellen Update integrierte die DSMZ beispielsweise Daten von mehr als 19.505 Bakterienstämmen der schwedischen Sammlung Culture Collection University of Gothenburg (CCUG). Somit sind in BacDive aktuell Informationen zu 80.584 Bakterien und Archaeen abrufbar. Für die wissenschaftliche Arbeit mit quellenübergreifenden Datensätzen müssen die verschiedenen Informationsquellen möglichst direkt über eindeutige Identifikatoren verknüpft sein. Dazu wurden zum Beispiel direkte Links zu der 16S rRNA Sequenz eines Bakterienstammes in der Datenbank SILVA oder zu den an Stoffwechselreaktionen beteiligten Enzymen in der Datenbank BRENDA eingerichtet. Über Verlinkungen in PubMed, NCBI Taxonomy, NCBI Nucleotide, aber auch in Speziesbeschreibungen von Wikipedia gelangen Nutzer zu den strukturierten Metadaten in BacDive.
Die DSMZ ist eines der größten Bioressourcenzentren weltweit. Die Sammlung umfasst derzeit über 67.000 Kulturen, einschließlich über 35.000 verschiedene Bakterien- und 4000 Pilz-Stämme, 800 menschliche und tierische Zelllinien, 41 Pflanzenzelllinien, 1.400 Pflanzen-Viren und Antiseren und 13.000 verschiedene Typen genomischer Bakterien-DNA.
Kontakt
Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen
Sven-David Müller
Inhoffenstraße 7 B
38124 Braunschweig
0531-5312616300
sven.david.mueller@dsmz.de