Laborjournal 2019-12

| 12/2019 50 Methoden Unter dem Gesichtspunkt der genetischen Komplexität spielt Homo sapiens in der glei- chen Liga wie der Fadenwurm, dem knapp 20.000 Gene reichen, um im Boden zu über- leben und binnen kurzer Zeit geschlechtsreif zu werden. Immerhin kann sich Homo sapiens damit trösten, dass sein Genom aus weitaus mehr Nukleotiden besteht als das desWurms: Nur ein Prozent menschlicher Genomsequen- zen haben eine Funktion als Gen. Die restli- chen 99 Prozent, also schlappe 2,97Milliarden Basenpaare, enthalten zumeist unbekannte Informationen. Ohne Bioinformatik-Software und umfangreiche Datenbanken ist es nahe- zu unmöglich, aus diesen die biologisch rele- vanten Sequenzen herauszufiltern. Dank fleißiger Bioinformatiker, die als Dol- metscher zwischen den Biodisziplinen fungie- ren, existieren mittlerweile unzählige Analy- sewerkzeuge, die von der Genom-Annotati- on über Ökologie bis hin zur Chemoinforma- tik reichen. Die Frage ist nur: Wie finde ich im Internet das passende Bioinformatik-Tool, das mich inmeiner Fragestellung unterstützt, und wie wende ich es an? Manche Werkzeuge dienen als reine In- formationsquellen, die dabei helfen können, biologische Fragen zu formulieren. So kann man zumBeispiel Roches elektronische Schau­ tafeln des biochemischenMetabolismus ( web. expasy.org/pathways ) mit geeigneten Stich- wörtern durchforsten und Reaktionskomple- xe herausfiltern, die für die eigene Arbeit in- teressant sind. Darüber hinaus sind alle auf- geführten Enzyme direkt mit ExPASys Enzym­ datenbank ( enzyme.expasy.org ) verbunden. Der Cellosaurus ( web.expasy.org/cello- saurus) beschreibt dagegen alle Zelllinien aus Vertebraten und Invertebraten, inklusive Querverweisen und Literaturangaben. Allein 85.532 humane Zelllinien befinden sich dar- unter. Der Expressions-Atlas ( www.ebi.ac.uk/ gxa/home ) wiederum listet für 64 Tiere, Pflan- zen und Pilze auf Basis von 3.500 Studien auf, welche Proteine unter welchen Bedingungen exprimiert werden können. Rhea ( www.rhea-db.org ) verzeichnet schließlich knapp 12.500 biochemische Re- aktionen samt deren Reaktionsteilnehmer und ist mit verschiedenenDatenquellen verknüpft: Darunter ChEBI ( www.ebi.ac.uk/chebi ), ein Le- xikon aller molekularen Entitäten; UniProtKB ( www.uniprot.org ) , die zentrale Drehscheibe zur Annotation von Enzymen und nicht zu- letzt PubMed ( www.ncbi.nlm.nih.gov/pubmed ) , die biomedizinische Meta-Datenbank mit ge- genwärtig mehr als dreißig Millionen geliste- ten Referenzen. Mithilfe dieser Datensammlungen fällt es nicht schwer, eigene Hypothesen aufzustel- len – die plausibelsten herauszufiltern oder in Hochdurchsatz-Datensätzen Assoziationen zu identifizieren, ist da schon komplizierter. Um der überbordenden Datenflut in den Biowissenschaften Herr zu werden, entwickeln Bioinformatiker wie am Fließband Tools und Plattformen, die Forschern die Datenanalyse erleichtern sollen. Diese setzen zwar meist keine Informatikkenntnisse voraus, ein wenig bioinformatisches Basiswissen schadet aber nicht. Auf das richtige Werkzeug kommt es an Methoden-Special: Webtools, Server und Software für Biologen Illustration : NHGRI

RkJQdWJsaXNoZXIy Nzk1Nzg=