Donnerstag, September 04, 2008

Es ist nicht alles rosarot mit DNA-Barcodes

ResearchBlogging.orgWeil ich vor kurzem auch schon mal über DNA-Barcoding als Methode zur objektiven Bestimmung der Artenvielfalt [1] will ich kurz auf ein aktuelles Paper in PNAS hinweisen, das den Heiligenschein ein wenig dimmt. Es kann laut dem Team von Hojun Song und Kollegen nämlich vorkommen, dass beim DNA-Barcoding die Anzahl von tatsächlich vorhandenen Arten überschätzt wird!

Die relativ neue Methode, die Artenvielfalt durch Vergleich einer universell zu findenden Sequenz zu bestimmen, wird als DNA Barcoding bezeichnet, eben weil man damit jede Art mit einem molekularen "Strichcode" eindeutig identifizieren kann. Klassischerweise wird dazu ein Bereich des Gens für die Untereinheit 1 der Cytochrom c-Oxidase (COI), das vom Mitochondriengenom [2] codiert wird, untersucht. Dieses Gen ist in allen eukaryoten Organismen vorhanden, besitzt aber zumindest im untersuchten Bereich so große Sequenzunterschiede, dass auch nah verwandte Arten als solche erkannt werden. Das ist zum Beispiel praktisch in Gruppen von Organismen, die sich äußerlich fast nicht unterscheiden und dadurch vielleicht als eine Art betrachtet werden. Es ist in letzter Zeit mehrmals vorgekommen, dass durch DNA-Barcoding untersuchte Gruppen plötzlich um einige Arten reicher waren.

Wenn man Sequenzunterschiede von COI (oder auch einem anderen Gen) als Artenmerkmal benutzt, geht man im Grunde davon aus, dass jeder Organismus nur eine Kopie des Gens besitzt, und dass jede Variante des Gens aus einer anderen Art stammt (Orthologe). Besäße eine Art nun aber zwei oder mehr Kopien des Gens (Paraloge), dann würde man zwischen den Kopien auch Sequenzunterschiede finden, und fälschlicherweise die Existenz von mehr als einer Art postulieren.

Song et al. konnten nun zeigen, dass es beim COI-Gen, das häufig für DNA-Barcoding verwendet wird[3], zwar keine weitere Kopie des Gens in den Mitochondrien gibt. Es ist jedoch wohl, wie viele andere mitochondrielle Gene auch, vom Mitochondrion in das Kerngenom gewandert [4]. Im Fall von COI gibt es zwar keine aktive Kopie im Kern, dafür aber jede Menge inaktive numts (nuclear mitochondrial pseudogenes). Das Problem an der Sache ist nun für das DNA-Barcoding, dass inaktive Pseudogene keinem evolutionären Druck unterliegen und deshalb viele Mutationen anhäufen. Diese Sequenzunterschiede können als neue Arten interpretiert werden.
Genau das wird in dem PNAS-Paper auch für die Beispiele Grashüpfer und Krebse gezeigt. Durch die COI-Sequenzierung konnten in beiden Gruppen mehrere Arten erkannt werden. Entfernten die Autoren die numts aus der Analyse, so fanden sich in beiden Fällen deutlich weniger Arten, in den Krebsen beispielsweise nur noch 7 statt der 25 mit den numts.
Vergleich von identifizierten Krebsarten mit numts (links) und nach ihrer Entfernung aus den Daten (rechts).
Jede Farbe stellt eine bereits beschriebene Art dar, rot steht für numts. Die Zahlen stehen für die Anzahl der Arten, wie sie nach den Richtlinien des DNA-Barcoding gezählt werden sollen. Es ist deutlich zu erkennen, dass zumindest bei den untersuchten Krebsen die numts den Großteil der erkannten "Arten" stellen.
Das Bild ist aus Abbildung 1 von Song et al. (2008).

Es ist nun allzu deutlich, dass die bisherige Praxis des DNA-Barcoding eigentlich nicht beibehalten werden kann, da sie die Tendenz hat zu viele falsch-positive Treffer zu liefern. Es müssten also Absicherungen der Daten her, doch die sind aufwendig und teuer. Man könnte beispielsweise wie die Autoren hier mögliche numts durch Algorithmen von der Analyse ausschließen. Oder man könnte sich eine neue Region suchen, von der keine numts bekannt sind. Song et al. schlagen eine ganze Reihe von Schritten vor, die die Kontamination mit numt-Sequenzen vermeiden sollen. Die DNA-Barcoding Bewegung hat jedoch das Ziel, molekulare Marker für Arten möglichst schnell und kostengünstig zu liefern. Jede weitere Absicherung wird da wohl eher als störend empfunden werden. Da Anhänger des Barconding den numts bereits einen geringen Einfluss bescheinigt haben (ohne Daten, denn das wurde schließlich erst jetzt untersucht!), bleibt wohl abzuwarten, ob die betroffenen Forscher das Problem erkennen und in Zukunft Sicherungen einbauen.


[1] Das gibt sicher böse Kommentare von Biologen die meinen, ich würde ihre Methode der Wahl nicht für objektiv halten...
[2] Mitochondrien und in den Pflanzen die Chloroplasten stammen von Bakterien ab, die vor langer Zeit als Symbionten in die Zellen der Vorläufer heutiger Eukaryoten aufgenommen wurden, und sich seitdem als Kompartimente der Zellen etabliert haben. Sie behalten aber bis heute noch einige wenige Gene bakteriellen Ursprungs zurück, sie besitzen also ein eigenes, wenn auch kleines Genom neben dem im Zellkern.
[3] Im von mir angesprochenen Paper zum DNA-Barcoding von afrikanischen Elefanten wurde nicht COI, sondern das mitochondrielle Gen CYTb untersucht. Diese Daten sind also nicht direkt von den Ergebnissen von Song et al. betroffen, aber es ist durchaus möglich (und wahrscheinlich), dass auch von CYTb numts im Kerngenom vorhanden sind.
[4] Viele ursprünglich mitochondrielle oder plastidäre Gene, die nun im Zellkern sitzen, sind immer noch aktiv und erfüllen in ihren jeweiligen Kompartimenten wichtige Rollen. Das Protein Rubisco, das die Kohlenstofffixierung in den Chloroplasten erledigt, besteht aus zwei Untereinheiten, von denen eine im Chloroplasten, die zweite aber im Kern codiert ist.

H. Song, J. E. Buhay, M. F. Whiting, K. A. Crandall (2008). Many species in one: DNA barcoding overestimates the number of species when nuclear mitochondrial pseudogenes are coamplified Proceedings of the National Academy of Sciences DOI: 10.1073/pnas.0803076105

Kommentare:

derele hat gesagt…

Hey, cooles paper, das ist mir heute schonmal irgendwo über den Weg gelaufen! "Barcoding" war die session die mit Abstand am längsten und angeregtesten diskutiert wurde auf der konferrenz, von der ich grad zurück bin.

Ich will ja nicht klugscheißen (ich hab das paper noch garnicht gelesen) aber ich glaube über was die Autoren schreiben ist eher DNA-taxonomy nicht DNA-barcoding...

Barcoding verbindet eine Sequenz mit allen möglichen Daten zur Morphologie (Museumsexemplare, Bilder, Videos etc...), Verbreitung etc...

Das in dem Paper beschriebene Problem entsteht so wie ich das bisher verstehe eher bei der Beschreibung neuer Arten (besser MOTUs) anhand ihrer Sequenzdivergenz.

Ich träum trotzde immernoch davon einen Wirtsorganismus ganz und am Stück in nen Protease-Mixer zu werfen und dann mit gebarcodeter pyrosequenzierung zum Beispiel alle Protostomia oder Ecdysozoa -Parasiten zu finden... am besten quantitativ :-)

Argent23 hat gesagt…

Da kennst du dich sicher besser aus als ich. Wenn aber die Autoren selbst über Barcoding sprechen, dann verwende ich den Begriff erstmal auch ;-)

derele hat gesagt…

Ja, klar, die Autoren des genannten Papers verwenden eine etwas schwammige Definition von barcoding... von b.-fans wird in einer Diskussion meist erstmal klargemach, was b. alles NICHT ist (phylogenetik, dna-taxonomy...)

Wobei ich selbst die Unterscheidung von DNA-taxonomy und b. etwas für Harrspalterei halte: Wenn man dann mal möglichst viele barcodes hat, möchte man diese ja schließlich auch für etwas nutzen. Daher folgt aus b. fast zwangsläufig DNA-taxonomy (aus "ökologischen Proben").