Freitag, Januar 30, 2009

Spielwiese Bioinformatik

Mit all den vielen nützlichen Werkzeugen, die die Bioinformatiker produzieren, um uns Biologen die Arbeit zu erleichtern, haben wir mittlerweile einen Punkt erreicht, der auch interessierten Laien einen spielerischen Einstieg in die Berge von Daten ermöglicht.

Ein sehr gutes Beispiel dafür ist der Genome Projector, der Genomdaten von vielen (bisher nur) Bakterienarten mithilfe dem bekannten Google Maps-Interface darstellt.
Das Referenzgenom des Laborstammes K12 von Escherichia coli (leicht in der Liste zu finden, es ist bereits mit einem Balken markiert) ist ein guter Startpunkt für jeden, der mal einen Blick reinwerfen möchte. Wer kann in der Pathway Map den Citratzyklus finden?

Dienstag, Januar 27, 2009

Und ich sags noch!

Unerwartete Evolution
Sonja von Brethorst, Presse- und Öffentlichkeitsarbeit
Stiftung Tierärztliche Hochschule Hannover
26.01.2009

Höhere Tiere stammen nicht von niederen Tieren ab
Wissenschaftler der Stiftung Tierärztliche Hochschule Hannover (TiHo), des Sackler Institute for Comparative Genomics im American Museum of Natural History und der Yale University stellen in der neuesten Ausgabe des Online-Fachmagazins PLoS Biology überraschende Ergebnisse der Evolutionsforschung vor. Die Publikation kann ab Dienstag, den 27. Januar 2009 unter http://biology.plosjournals.org im Internet eingesehen werden.

Die deutsch-amerikanische Arbeitsgruppe hinterfragt mit ihren Forschungsergebnissen die bisherige Auffassung über den Verlauf der Evolution der Tiere. Bislang galt es als selbstverständlich, dass die Evolution der Tiere vom einfachen zum komplexen Tierstamm erfolgte. Die neuen Forschungsarbeiten zeigen jedoch, dass sich die niederen Tiere parallel zu den höheren Tieren entwickelt haben. Zu den niederen Tieren werden beispielsweise Korallen und Quallen gezählt, zu den höheren Tieren gehören alle bekannten Gruppen vom Wurm bis zum Menschen.
Pressemeldung beim Informationsdienst Wissenschaft

Hab ichs nicht gerade erst gesagt? In wenigen Sätzen, sowohl die alte Leier mit der scala naturae, und eine interessante Einteilung der Tiere in zwei Gruppen - höhere und niedere. Hier wird wenigstens die Grenze an einer bekannten Stelle gezogen, mit den höheren Tieren sind die Bilateria gemeint. Aber wieso dann nicht Bilateria sagen?

In den Kommentaren zu meinem letzten Post hierüber habe ich aus Papers zitiert, die die Grenze zwischen höheren und niederen Tieren ganz woanders ziehen, beispielsweise bei den Wirbeltieren. Sinn macht das Ganze jedenfalls keinen.

Und jetzt klaue ich zum Abschluss noch bei T. Ryan Gregory von Genomicron, der sich über das Paper auch aufgeregt hat:

"It is absurd to talk of one animal being higher than another" (Charles Darwin, 1837)

Montag, Januar 26, 2009

Wofür Eliteunis jetzt alles Geld ausgeben können


Ich gehe durchschnittlich einmal pro Tag vom Büro/Labor (der Turm im Hintergrund) zu unserem Versuchsgewächshaus (ein paar hundert Meter hinter mir) und zurück. Bisher konnte man auf dieser Strecke wertvolle Sekunden sparen, indem man zwischen den Bäumen abkürzte. Was auch viele Leute an der Uni machen, der Trampelpfad ist nicht nur von mir! Jetzt hat die Uni wohl was dagegen, dass ihr gepflegter englischer Rasen ihr naturbelassenes Unkrautbeet betreten wird, und hat eine Absperrung aufstellen lassen. Nur viel gebracht hats nicht, gleich rechts vom Bild entsteht nämlich bereits ein neuer Ausgang ;-)

Projekt Paperübersicht #2: Der RTR-Komplex in Pflanzen?

Und weiter gehts mit der Besprechung unseres aktuellen Papers! Während es in Teil 1 noch um ein wenig Hintergrund für die beteiligten Gene/Proteine ging, gehts heute ins Pflanzengenom und die Frage, ob es diesen RTR-Komplex auch in der Modellpflanze Arabidopsis thaliana gibt.


Den Großteil unserer Arbeit machen wir mit Insertionsmutanten. Das sind Pflanzen, bei denen mit Hilfe des Bodenbakteriums Agrobacterium tumefaciens relativ große DNA-Fragmente in die Sequenz eines Gens eingeführt wurden. Dies führt im Endeffekt dazu, dass das Proteinprodukt dieses Gens nicht mehr hergestellt werden kann, die Pflanzenlinie unterscheidet sich also von Wildtyppflanzen nur darin, dass ein bestimmtes Gen ausgeschaltet wurde. Der Sinn hinter der Untersuchung von diesen Knockouts ist schnell einleuchtend: Vergleicht man Wildtyp und Knockoutlinie, dann ist sehr wahrscheinlich, dass jeder zusätzliche Defekt in der Knockoutlinie auf dem Ausfall des Gens beruht. Jetzt muss man nur noch umdenken - der Ausfall eines Gens führt zu bestimmtem Defekt, dann erfüllt dieses Gen normalerweise diese bestimmte Funktion, die ein Entstehen des Defekts verhindert.

Zunächst muss man sich natürlich fragen: Gibt es die Gene des RTR-Komplexes überhaupt in Arabidopsis? Hier kann man sich heutzutage sehr viel Arbeit sparen, dank sehr guter Bioinformatik und den frei zugänglichen Genomdatenbanken vieler Organismen. Was wir fanden, passt sehr gut den bereits beschriebenen Genen, vor allem aus der Bäckerhefe Saccharomyces cerevisiae und dem Menschen.
Für das Gen RMI1 (bzw. BLAP75) gibt es im Arabidopsisgenom zwei mögliche Kandidaten. Einer davon (das Gen At5g19950) scheint nicht exprimiert zu werden, und auch von uns untersuchte Insertionsmutanten waren völlig unauffällig. Hierbei könnte es sich also um ein Pseudogen handeln. Der zweite Kandidat (At5g63540) war dafür umso interessanter, wie ich heute und in den folgenden Posts zu unserem Paper zeigen will. Dieses Gen wurde von uns darum AtRMI1 getauft [1].
Auf zum T aus RTR - der Topoisomerase. Hier war es leichter, weil als Homolog zu TOP3 bzw. TOPO3α nur ein mögliches Gen in Frage kam, At5g63920 oder AtTOP3α.
Ein wenig komplizierter wird es bei der RecQ Helikase. Bei dieser Familie wissen wir schon länger, dass es in Arabidopsis sieben Mitglieder gibt. Welche von diesen sieben ist nun aber das funktionelle Homolog zu der einzigen RecQ Helikase in Hefe, SGS1? Im Menschen ist dies unter fünf Familienmitgliedern das Gen BLM, und mit dem Aufbau dieser beiden Gene bewaffnet fallen schon ein paar der Arabdopsis RecQ Helikasen raus. Von den restlichen bleibt dann nur noch RECQ4A (At1g10930) übrig, wenn man bereits bekannte Eigenschaften der Mitglieder der RecQ Familie in Arabidopsis mit einbezieht (Hartung et al., 2007).

Glücklicherweise waren für diese Gene dann auch Insertionsmutanten verfügbar, mit denen wir arbeiten konnten.

Zum Abschluss jetzt noch ein paar "richtige" Daten. Die Beschreibung, wie und warum man bestimmte Gene überhaupt gefunden und benutzt hat, und wie die Mutanten aufgebaut sind, ist zwar ein wichtiger Teil eines Papers - es ist aber eher langweilig.
Es gibt eine relativ einfache Methode, die Beteiligung eines Gens bzw. dessen Proteinprodukts an der DNA Reparatur zu untersuchen: Schädigt man die DNA absichtlich, dann müssen diese Schäden repariert werden. Ist nun aber ein Gen ausgeschaltet, das in die Reparatur der DNA involviert ist, dann funktioniert die Reparatur logischerweise nicht mehr so gut. Das kann man auf verschiedene Weisen messen, wir bestimmen das relative Frischgewicht von behandelten Keimlingen verglichen mit gleich alten unbehandelten Keimlingen. Denn Probleme bei der DNA-Reparatur resultieren beispielsweise im Absterben der betroffenen Zellen, die sich dann auch nicht mehr Teilen oder Wachsen können. Die Folge: Kleinere, leichtere Keimlinge.
Die Bandbreite an möglichen Schäden an der DNA ist unheimlich groß, entsprechend gibt es auch jede Menge von Reparaturwegen. Indem man die Organismen verschiedenen Stoffen mit bekannten Schadeffekten an der DNA aussetzt, kann man mit diesem Versuch auch eine erste Einordnung der untersuchten Gene in diese Reparaturwege vornehmen. Eine Knockoutmutante wird nämlich nur dann sensitiver als der Wildtyp auf einen Stoff reagieren, wenn es in dem betroffenen Reparaturweg aktiv ist.


Abbildung 3 aus Hartung et al (2008)

In dieser Abbildung sind Sensitivitäten von Knockoutmutanten der Gene RECQ4A, TOP3α und RMI1 gegenüber verschiedenen Mutagenen gezeigt. Gegen Methylmethansulfonat (MMS, A in der Abbildung) sind viele Gene der homologen Rekombination sensitiv, so auch unsere drei Gene. MMS erzeugt Addukte an der DNA, indem es eine Methylgruppe an Stickstoffatome in den Basen der DNA hängt. Dies hat zu Folge, dass die normale Doppelhelix verzerrt wird, und elementare Vorgänge wie die Transkription und Replikation nicht mehr stattfinden können. Dies ist wahrscheinlich auch die Verbindung mit der homologen Rekombination, da sie mithilft Probleme direkt an der Replikationsgabel zu beheben. Davon abgesehen können Schäden durch eine Alkylierung aber auch durch die Reparaturwege der Basenexzisionsreparatur und der Nukleotidexzisionsreparatur behoben werden [2]. Die Ungenauigkeit dieser beiden Wege führt übrigens über den Umweg von Mutationen zu einer krebsfördernden Wirkung von MMS.
Cisplatin (genauer cis-Diamindichlorplatin, B in der Abbildung) ist ein interessanter Stoff. Über die eher zufällige Entdeckung dieses kleinen Moleküls habe ich schon mal geschrieben. Heute ist es einerseits eines der am häufigsten eingesetzten Chemotherapeutika, andererseits aber auch eines der bestuntersuchten Stoffe, was die Mechanismen der DNA-Schädigung angeht. Was passiert, wenn Cisplatin in die Zelle kommt? Das zentrale Platinatom reagiert freudig mit so ziemlich jedem Molekül, das es in die Finger kriegt. Deshalb findet man dann Platinaddukte an Zuckern, Fetten, Proteinen, aber eben auch der DNA. Blöd an der Sache ist aber, dass Cisplatin über seine beiden Chloridgruppen auch zweimal reagieren kann, und damit zwei vorher unverbundene Moleküle kovalent verknüpft. So werden dann schon mal Proteine an die DNA gebunden, oder noch schlimmer, zwei Basen der DNA kovalent verbunden. Dies nennt man Crosslinking, und davon gibt es zwei Möglichkeiten: entweder werden zwei Basen aus unterschiedlichen DNA-Strängen verknüpft (=Interstrang-Crosslink), oder es werden zwei Basen innerhalb eines Stranges verknüpft (=Intrastrang-Crosslink). Letzteres ist bei Cisplatin das häufigere Produkt, und auch hier liegen die Reparaturaufgaben bei der Nukleotidexzisionsreparatur und der homologen Rekombination (die besonders während der Replikation).
Zuletzt noch Camptothecin (CPT, C in der Abbildung). Das ist ein Alkaloid, das beispielsweise von der Pflanze Camptotheca acuminata zur Schädlingsabwehr gebildet wird. Und die Schädlinge, die an der Pflanze knabbern tun mir wirklich leid: Im vorigen Teil habe ich knapp beschrieben, was eine Topoisomerase mit der DNA macht. Camptothecin behindert diesen Vorgang der Topoisomerase 1. Genau in dem Zustand, wenn TOP1 kovalent mit der DNA verbunden ist und ein Einzelstrangbruch in der DNA vorliegt, bindet CPT daran und verhindert, dass die Topoisomerase die Lücke schließt und sich von der DNA löst. Dies hat zur Folge, dass bei der Replikation einerseits ein Protein kovalent verbunden auf der DNA sitzt und die Replikationsproteine behindert, und dass außerdem durch das Entwinden des Doppelstrangs aus dieser Lücke in der DNA plötzlich ein Doppelstrangbruch wird. Großes Problem, und sehr wahrscheinlich der Tod des hungrigen Schädlings [3].

Wie man sehen kann, sind alle Mutanten sensitiver als der Wildtyp (Col-0 in der Abbildung) gegenüber MMS und Cisplatin. Gegen CPT ist dagegen nur die Knockoutmutante von TOP3α sensitiv, die beiden anderen nicht. top3A-2 reagiert genau genommen auch auf MMS und Cisplatin sensitiver als recq4A-4 und rmi1-2. Während nun diese gemeinsamen Sensitivitäten eines der Indizien sind, dass die drei Proteine ihre Aufgaben gemeinsam erfüllen (also möglicherweise in einem RTR-Komplex), deuten die Resultate auch auf eine Sonderrolle für TOP3α hin. Auf die will ich aber erst im nächsten oder übernächsten Post eingehen - mit nem Cliffhanger müsst ihr einfach wiederkommen, oder?


[1] So wirklich neue und kreative Namen gibts bei Genen eher selten, aber es kommt vor. Siehe etwa das Gen SUPERMAN und sein Antagonist KRYPTONITE...
[2] Wenn ich jetzt noch anfange, jeden Reparaturweg ausführlich zu beschreiben werde ich gar nicht mehr fertig mit dem Post. Ich hab da aber eine nette Idee: Ich könnte den Mutagenen eigene Posts widmen, und dabei dann auch auf die relevanten Reparaturwege eingehen.
[3] Die Camptothecin-produzierenden Pflanzen besitzen übrigens TOP1-Gene mit leicht veränderten Sequenzen, so dass sie selbst nicht anfällig gegenüber CPT sind (Sirikantaramas et al, 2008).

Montag, Januar 19, 2009

Edgar Allan Poe

Heute vor 200 Jahren wurde der amerikanische Schriftsteller Edgar Allan Poe geboren.
It was many and many a year ago,
In a kingdom by the sea,
That a maiden there lived whom you may know
By the name of Annabel Lee;
And this maiden she lived with no other thought
Than to love and be loved by me.

I was a child and she was a child,
In this kingdom by the sea:
But we loved with a love that was more than love —
I and my Annabel Lee;
With a love that the winged seraphs of heaven
Coveted her and me.

And this was the reason that, long ago,
In this kingdom by the sea,
A wind blew out of a cloud, chilling
My beautiful Annabel Lee;
So that her highborn kinsmen came
And bore her away from me,
To shut her up in a sepulchre
In this kingdom by the sea.

The angels, not half so happy in heaven,
Went envying her and me —
Yes! — that was the reason (as all men know,
In this kingdom by the sea)
That the wind came out of the cloud by night,
Chilling and killing my Annabel Lee.

But our love it was stronger by far than the love
Of those who were older than we —
Of many far wiser than we —
And neither the angels in heaven above,
Nor the demons down under the sea,
Can ever dissever my soul from the soul
Of the beautiful Annabel Lee:

For the moon never beams, without bringing me dreams
Of the beautiful Annabel Lee;
And the stars never rise, but I feel the bright eyes
Of the beautiful Annabel Lee;
And so, all the night-tide, I lie down by the side
Of my darling — my darling — my life and my bride,
In her sepulchre there by the sea,
In her tomb by the sounding sea.
Annabel Lee, von Edgar Allan Poe

Dies ist das letzte von Poe verfasste Gedicht vor seinem frühen und mysteriösen Tod 1849. Es ist einer der Texte von Poe, die mich am meisten berühren (neben The Raven, aber das Gedicht dürften viele ja kennen). Höchstwahrscheinlich ist es an seine Frau Virginia gerichtet - sie war die letzte in einer ganzen Reihe von Poe nahestehenden Frauen, die er durch Tuberkulose verlor. Eine von Poes Kurzgeschichten, die Maske des Roten Todes (The Masque of the Red Death), bezieht sich wahrscheinlich auch auf die Tuberkulose und die zur Zeit der Veröffentlichung daran leidenden Virginia. Ich finde es faszinierend, dass zwei der wichtigsten Themen von Poes Texten - Frauen und Tod - auch sein Leben auf eine Weise prägten, dass es eine seiner Kurzgeschichten hätte sein können.

In guter Tradition stoße ich mit einem guten Cognac an und hinterlasse drei rote Rosen.

Poe auf Deutsch (Projekt Gutenberg-DE)
Poe auf Englisch (Project Gutenberg)
Poe zum Anhören (Librivox.org)

Donnerstag, Januar 15, 2009

Wieso man zumindest naturwissenschaftliche Kenntnisse der Mittelstufe haben sollte, wenn man medizinische Pressemitteilungen herausgibt...

...oder: Gene, Gene, Gene und die böse junk DNA!



Dies ist mal wieder ein gutes Beispiel dafür, warum ich normalerweise verzichte, Pressemeldungen zu lesen. Eine Forschergruppe hat in einem aktuellen Paper in Nature gezeigt, dass eine microRNA (miR-21) zur Erkrankung der Herzmuskelschwäche beitragen kann. Das interessante daran ist, dass sie eine Verbindung zwischen einem der vielen Gene Silencing-Mechanismen und einer menschlichen Erkrankung zeigen konnten. Wohlgemerkt, diese Verbindung ist schon länger bekannt, wie die Autoren selbst schon im Abstract des Artikels schreiben. Soweit ist alles noch in Ordnung.

Aber was macht die Pressestelle des an der Arbeit beteiligten Rudolf-Virchow-Zentrum daraus?
"Genetischer Müll" löst Herzmuskelschwäche aus

Würzburg, 30.11.2008. Winzige Bruchstücke des Erbguts - so genannte "micro-RNAs", die bis vor kurzem als unwichtig galten, könnten jetzt die Prävention, Diagnose und Therapie der Herzmuskelschwäche revolutionieren. Würzburger Forscher fanden eine solche erstmals im Herzen, blockierten sie und konnten damit nicht nur gefährdete Mäuse vor dem Ausbruch der Erkrankung schützen, sondern auch an Herzmuskelschwäche erkrankte Mäuse heilen. Die Ergebnisse beschreiben die Wissenschaftler der Universität Würzburg in dem renommierten Wissenschaftsmagazin Nature.
Die Entschlüsselung des menschlichen Genoms brachte eine überraschende Nachricht mit sich: Nur ungefähr 1,5 Prozent der gesamten genetischen Information wird für die Herstellung unserer Proteine benötigt, wobei die Gene über eine Art Kopie, die Boten-RNA, in Proteine umgeschrieben werden. Der Rest der Gene galt lange als bedeutungsloser "genetischer Müll", weil deren RNA ohne nennenswerte Funktion sei. 2006 wurde jedoch für die Entdeckung, dass RNAs, aus denen keine Proteine entstehen, auch wichtige Aufgaben im Körper besitzen den Medizin-Nobelpreis verliehen [sic]. Diese RNA-Stücke regulieren die Bildung der Proteine über Bindung an die Boten-RNA direkt. Geht hier etwas schief, produziert der Körper also beispielsweise zu viel oder zu wenig Proteine, gerät die Körperzelle aus dem Gleichgewicht - Krankheiten entstehen.
Die Pressemeldung geht noch weiter, befasst sich mit diesem doch scheinbar so hochinteressanten Thema aber nicht mehr. Vielleicht, weil in der Pressestelle nichts tiefschürfenderes als dieses oberflächliche Blabla bekannt war?
Gehen wir das Ganze doch von vorne nach hinten durch. Der Titel ist schon super, "Genetischer Müll" gleich in scare quotes, und irgendwie klingt es so, als ob endlich der ultimative Grund der Herzmuskelschwäche gefunden wäre. Auf den genetischen Müll, also die junk DNA, möchte ich gleich ausführlicher eingehen, jetzt wird erst mal diese Meldung zerpflückt.
Erster Satz - microRNAs (schon wieder scare quotes) sind keineswegs "Bruchstücke des Erbguts", und sie galten auch nicht bis vor kurzem als unwichtig. Vielmehr werden microRNAs genauso wie alle anderen Gene (also auch die, die für Proteine kodieren) zunächst mal transkribiert, d.h. es wird eine Abschrift des Gens in Form einer RNA hergestellt. Bei proteinogenen Genen nennt man diese RNA dann mRNA (messenger RNA). Bei Genen für microRNAs, nunja, microRNA halt. Wären es wirklich Bruchstücke der DNA wäre es einerseits microDNA, und andererseits wäre die Zelle tot (Chromosomen zerbrochen und so). Eine schnelle Suche bei Pubmed ergibt außerdem, dass mindestens seit 2001 über microRNAs geschrieben wird - keineswegs "vor kurzem" also. Nehmen wir nicht nur diese Subfamilie der regulatorischen RNAs, sondern den gesamten Prozess des gene silencing, dann wird die Aussage noch lächerlicher. Über post-transcriptional gene-silencing wird dann auch schon seit 1955 geschrieben (mit bisher fast 19000 veröffentlichten Artikeln), und auf der Informationsseite für den (im Pressetext ja ausdrücklich erwähnten) Nobelpreis (Fire und Mello, 2006) wird direkt Bezug genommen auf Arbeiten in Pflanzen und Pilzen von 1990.
Im zweiten Absatz geht es dann munter so weiter. Da widerspricht sich der Text erstmal heftig. Einerseits sollen nur 1,5% des Genoms Gene sein ("für die Herstellung unserer Proteine benötigt"), andererseits ist das restliche Genom aber wohl voll von Genen ("Der Rest der Gene")!

Dieser Satz ist sowieso voll von Fehlern:
Der Rest der Gene galt lange als bedeutungsloser "genetischer Müll", weil deren RNA ohne nennenswerte Funktion sei.
Also, keine Definition was ein Gen ist. Eigentlich sogar das Eingeständnis, seit der 7. Klasse nicht mehr im Bio-Unterricht aufgepasst zu haben. Wörtlich genommen geht der Verfasser wohl davon aus, dass diese 98,5% des Genoms (weil sie ja angeblich Gene sind), auch in RNA umgeschrieben werden. Dies passiert zum allergrößten Teil aber nicht - das Genom ist transkriptionell überwiegend tot. Noch wichtiger, bisher hat noch niemand behauptet, dass eine einmal hergestellte RNA keine Funktion habe [1].

Jetzt aber zur junk DNA. Wann immer in den letzten Jahren jemand einen Effekt gefunden hat, der nicht dem Schema Gen - mRNA - Protein folgt, hat er gleich die böse junk DNA ausgepackt. Demnach sind ja alle anderen Molekularbiologen so beschränkt, dass die alles im Genom, was nicht diesem einfachen Schema entspricht, als genetischen Müll abtun, der völlig unnötig rumliegt und die Suche nach Genen erschwert. Jetzt kommt aber der Underdog, der mit seiner tollen neuen Entdeckung dem engstirnigen wissenschaftlichen Establishment entgegentritt. Klar, dass so eine Darstellung von den Medien gerne aufgegriffen wird.
Mit dieser Sichtweise gibt es nur ein Problem: Sie ist falsch, und das schon fast so lange, wie wir überhaupt wissen dass es Gene gibt und dass die DNA das Erbmaterial in der Zelle ist. Nur wenige Jahre nach der Beschreibung der DNA-Struktur durch Watson und Crick 1953 wurde die Translation in ihren Grundzügen aufgeklärt, also das Herstellen von Proteinen aus der Information der mRNA. Hier war aber schon klar, dass für diesen Prozess RNAs benötigt werden, von denen keine Proteine produziert werden: die tRNAs und die rRNAs. Auch das lernt eigentlich jeder in der Schule. Die Grundannahme, nicht-kodierende RNAs mit einer Funktion in der Zelle wären erst seit ein paar Jahren bekannt, ist also nicht nur falsch - diese RNAs gehören zum Establishment!

Das ist der eine Aspekt. Die andere Seite hat mit der Definition des Begriffs junk DNA zu tun. Zunächst mal ist nicht alles "Müll", von dem wir die Funktion nicht kennen. Mit junk DNA werden Elemente im Genom bezeichnet, die nachweislich keine Funktion haben! Der Nobelpreisträger Sydney Brenner gibt in diesem Video auf iBioSeminars (ab ca. 11:20) ein sehr gutes Beispiel. Die Alu Sequenz mit einer Länge von etwa 300 Basenpaaren kommt im menschlichen Genom in mehreren Millionen Kopien vor; sie macht damit je nach Schätzung zwischen 10 und 30% des gesamten menschlichen Genoms aus! Funktion? Fehlanzeige! Letzten Endes sind Alu-Elemente Parasiten von genetischen Parasiten.
Sogenannte Transposons sind genetische Elemente, die bestimmte Sequenzen an ihren Enden tragen und dazwischen Gene kodieren, deren Proteinprodukte diese Endsequenzen erkennen und dort Schnitte in die DNA setzen. Ein Transposon kann so per cut and paste von einer Stelle im Genom an eine andere wandern. Einen Nutzen für das Wirtsgenom hat das erstmal keinen, Transposons nutzen es nur als Transportvehikel. Alu-Elemente und andere, ähnliche Sequenzen gehen dabei noch einen Schritt weiter: Um selbst Gene zu tragen sind sie zu klein. An ihren Ende besitzen sie aber auch die Sequenzen, die von den Transposonproteinen erkannt werden. Alu-Elemente sind also ehemalige Transposons, die sich den Aufwand mit den Genen gespart haben und ihre noch funktionsfähigen Transposonkollegen ausnutzen. Wiederum aber kein direkter Nutzen für die Wirtszelle.
Larry Moran hat in den letzten Monaten verschiedenste Elemente im menschlichen Genom aufgelistet, die gesichert keine Funktion besitzen, also unter junk DNA fallen. Die Alu Elemente sind auch dabei (zu finden unter SINEs). Insgesamt ist er jetzt schon, ohne alle Arten von funktionslosen Elementen im Genom genannt zu haben, bei über 50% des Umfangs des Genoms - und das ist eine sehr zurückhaltende Schätzung!
In dem oben genannten Video weist Sydney Brenner auch auf ein weit verbreitetes Missverständnis hin, was den Begriff junk DNA angeht. Mit junk wird nämlich im Englischen keineswegs der Müll gemeint, den man wegwirft. Eine bessere Übersetzung wäre wohl das Wort Gerümpel; laut Brenner Dinge, die man gerade nicht brauchen kann, die man deshalb auf dem Dachboden lagert.
Most of the genome appears to be unneccesary; it is - if you like - call it rubbish. Now as you well know, there are two kinds of rubbish: The rubbish you keep, which we call junk, and the rubbish we throw away, which we call garbage.

Dieses Verständnis von junk DNA löst dann auch eine häufig gegen sie gerichtete Kritik in Wohlgefallen auf: Nur weil aktuell kein Nutzen für diese Elemente vorhanden ist, heißt das noch lange nicht, dass diese Sequenzen nicht irgendwann mal benutzt werden können!


[1] von der aktuellen Diskussion über stochastische Transkription und dem Nutzen der so hergestellten RNA mal abgesehen.

Montag, Januar 12, 2009

Projekt Paperübersicht #1: Der RTR-Komplex

Leider gab es nicht so viele Rückmeldungen auf meine Frage, ob ich über ein aktuelles Paper, bei dem ich Mitautor bin, hier berichten soll. Die Umfrage in der Sidebar wurde genau 1 Mal angeklickt. Da das Ergebnis nun aber bei 100% für das Erklären steht, werde ich das auch tun. Nur werde ich, wie caesar im Kommentarteil geschrieben hat, auf ein Einstellen bei researchblogging verzichten. Deren Richtlinien verbieten zwar nicht das Schreiben über eigene Paper, mir scheint das aber trotzdem nicht vertretbar zu sein.
Da in dem Paper mehrere Punkte zur Sprache kommen, die auch auf eigenen Beinen stehen können, werde ich die Besprechung des Papers aufteilen. So wird das nicht ein Megapost, und ich kann jeweils besser auf den Hintergrund eingehen.

Heute beginne ich damit, die für das Paper relevanten Gene und ihre Proteinprodukte kurz vorzustellen, dass jeder eine Vorstellung über ihre Funktion in der Zelle hat. Zentral steht hier ein Komplex aus drei Proteinen, die für sich alleine gänzlich unterschiedliche biochemische Eigenschaften haben.

Über die Familie der RecQ Helikasen habe ich bisher nur sehr wenig geschrieben, obwohl ich mich schon seit meiner Diplomarbeit mit ihnen beschäftige. Aus dem Biounterricht kennen manche vielleicht noch den Begriff der Helikase für ein Protein, das für das Kopieren der DNA (die Replikation) benötigt wird. Da in der DNA zwei Stränge aneinandergelagert sind, kann sie erst dann kopiert werden, wenn die Basenpaarungen aufgelöst wurden. Dies wird durch eine Gruppe von Proteinen namens Helikasen erreicht, die unter Energieverbrauch aus einem Doppelstrang zwei Einzelstränge machen. Danach kann dann das lustige DNA-Kopieren starten. Helikasen werden jedoch nicht nur während der Replikation gebraucht - die meisten Vorgänge an der DNA benötigen die Hilfe einer Helikase, warum es von denen im menschlichen Genom auch laut der Proteindatenbank UniProt über 150 gibt. Beschäftigt man sich ein wenig intensiver mit dem Metabolismus der DNA, dann läuft man fast zwangsläufig einer Familie von Helikasen (also eine Gruppe von Proteinen, deren Gene evolutionär verwandt sind und alle ein einziges Gen als gemeinsamen Vorfahren haben), den RecQ Helikasen. Das liegt daran, dass Vertreter dieser Familie verschiedenste Aufgaben im Erhalt der DNA, so wie wir sie kennen, besitzen: Sie sind aktiv in der Rekombination und der Reparatur von DNA, man findet sie an den Enden der Chromosomen, der Telomere, wo sie für den Erhalt dieser Strukturen beitragen und somit beispielsweise ein schnelles Altern unserer Zellen verhindern. Andere Familienmitglieder nehmen Funktionen im Gene Silencing wahr (das auch als RNAi bekannte Phänomen wurde 2006 mit dem Nobelpreis belohnt). Biochemisch erfüllen RecQ Helikasen diese Funktionen in der Regel, indem sie besondere DNA-Strukturen [1] erkennen, und sie unter Energieverbrauch wieder auflösen. Fallen diese Funktionen in tierischen Zellen aus, dann kann Krebs entstehen.
Die allermeisten einzelligen Lebewesen besitzen genau eine RecQ Helikase, die als Allroundtalent die meisten dieser Aufgaben erfüllt. Interessanter, aber auch komplizierter, wird es in vielzelligen Lebewesen, da diese mehrere Gene für RecQ Helikasen in ihren Genomen tragen, die die Aufgaben untereinander aufgeteilt haben. Menschen haben beispielsweise 5, Arabidopsis sogar 7 RecQ Gene. Ein recht gut untersuchtes Familienmitglied beim Menschen heißt BLM, weil es durch Mutation die verheerende Erbkrankheit Bloom Syndrom auslösen kann. Funktionell entspricht dies in Arabidopsis dem Gen RECQ4A. Beide unterdrücken die Rekombination und sind involviert in bestimmte Arten von DNA-Reparatur. Zumindest ein Teil dieser Aufgaben wird in dem RTR-Komplex wahrgenommen, um den es heute geht. Darum will ich es auch gut sein lassen für jetzt.

Das zweite Protein im Komplex ist eine Topoisomerase. Sie wird in der Bäckerhefe TOP3, in vielzelligen Eukaryoten TOPO3α genannt. Topoisomerasen lösen topologische Probleme der DNA - darum der Name. Ein einfaches Beispiel soll helfen zu verstehen, was damit gemeint sein soll: Stellt euch ein Gummiband vor; ein Ende macht ihr an einem Türgriff fest, das andere haltet ihr in der Hand. Nun verdrillt (überdreht) ihr das Gummiband. Wie lässt sich diese Überdrehung wieder auflösen, wenn die Enden fest verankert sind? Mit der DNA ist das etwas einfacher als mit einem Gummiband, aber genau das machen Topoisomerasen: Sie schneiden einen Strang durch, an dieser Position kann das Gummiband/die DNA nun frei drehen. Wenn die Überdrehung aufgelöst wurde (dies geschieht durch die in der Überdrehung gespeicherten Energie von selbst), schließt die Topoisomerase die Lücke wieder. Ein geschnittenes und geklebtes Gummiband würde man wohl nicht mehr benutzen, aber in der DNA bedeutet dies nur das Lösen und Verknüpfen einer Bindung im Molekül, das macht also keinen Unterschied [2].

Der dritte Komplexpartner heißt in der Bäckerhefe RMI1 und im Menschen BLAP75. Anders als die ersten beiden Proteine scheint es keine enzymatische Funktion zu besitzen. Trotzdem erfüllt der Komplex seine Aufgabe schlechter, wenn man dieses Protein daraus entfernt. Dies liegt wahrscheinlich daran, dass RMI1/BLAP75 einerseits die Erkennung von und Bindung an besondere DNA-Strukturen fördert, und andererseits Helikase und Topoisomerase im Komplex zusammenhält. Auf diese Weise können die beiden Proteine ihre Aufgaben kooperativ erfüllen.
Vor kurzem konnte gezeigt werden, dass der Komplex auch ein Protein namens RMI2/BLAP18 enthält. Dieses ist nahe verwandt mit RMI1, und beide ergänzen sich in ihrer Funktion. Außerdem ist schon bekannt, dass noch weitere, bisher unidentifizierte Proteine im Komplex enthalten sind.

Aufgrund der drei zentralen Proteine erhielt der Komplex jedoch seinen Namen - BTB für BLM, TOPO3α und BLAP75 im Menschen beziehungsweise RTR für RecQ Helikase, TOP3 und RMI1 in der Bäckerhefe. Was er genau mit der DNA anstellt, darauf will ich in einem gesonderten Post eingehen. Kurz erwähnen will ich nur noch, dass der RTR-Komplex vor kurzem die traurige Ehre zuteil wurde, von Kreationisten als "Argument" missbraucht zu werden.


[1] Wer sich schon gefragt hat, wo der nächste Post in der Serie DNA-Strukturen bleibt - schuldig im Sinne der Anklage. Es ist ja nicht so, dass mir da die Themen ausgingen. Es geht bald wieder weiter damit, versprochen!
[2] Es gibt noch eine zweite Form von Topoisomerasen. Die schneiden nicht einen, sondern beide Stränge der DNA durch. Das ist etwa dann nötig, wenn mehrere Chromosomen ineinander verknotet sind.

Freitag, Januar 09, 2009

Gehirn einschalten hilft, auch im Labor

Für viele Routinearbeiten im molekularbiologischen Labor gibt es heute von vielen Herstellern Kits. Du musst DNA isolieren? Kein Problem, mach die Schachtel auf, nimm ein paar kleine Plastikdinger, dann soviel Lösung X drauf, abzentrifugieren, Lösung Y drauf, fertig. Das hat gegenüber der alten Methode, alles selbst zu machen, natürlich Vorteile:
Die Ergebnisse sind in der Regel reproduzierbarer, man muss nicht mehr mit gefährlichen Chemikalien wie Chloroform oder Phenol hantieren, man ist auch schneller fertig.
Das Problem dabei: Gerade weil man nicht mehr selbst mit Chemikalien arbeitet, sondern nur noch fertige Lösungen mit nichtssagenden Namen benutzt, kennen viele Leute nicht die hinter dem Kit stehende Chemie. Es wird halt einfach nach Vorschrift vorgegangen. Ein zweiter Nebeneffekt der Kits ist die geringere Ausbeute. Ein schönes Beispiel dazu ist mir auf Next Generation Sequencing untergekommen:
In the new issue of Biotechniques, a paper by Maricic and Pääbo (login may be required) describes how a change to the standard 454 sequencing protocol can dramatically increase the size of the library of DNA that goes into the actual sequencing reaction.

The trick used is to replace the last step in the library preparation where single stranded DNA is released from streptavidin beads. The original 454 protocol employes NaOH denaturation for this step, but the researchers found that this procedure results in a loss of over 99% of the DNA. However, When they replaced the NaOH denaturation with a heat denaturation by incubation recovery increased to 98%.

These authors are coming from the ancient DNA community and have an obvious motivation for optimizing the DNA retrieval from scarce ancient biological material. However, these findings are equally important to other applications aimed at sequencing small volumes of biological material such as tumors and within-host sub-populations of pathogens.
(Hervorhebung von mir.)

Wow. Ich bin ja gewohnt, nach einer DNA Aufreinigung nur ca. 50% hinten rauszubekommen, aber >99% Verlust? Ich bin sprachlos. 454 gehört zu Roche, und da arbeitet keiner der bezahlt wird, ein Verfahren zu optimieren bevor es auf Kunden losgelassen wird? Ich frage mich gerade, wie viele Leute wohl Geld für fehlgeschlagene 454-Sequenzierungen ausgegeben haben, und der Grund war nur ein Problem mit der Präparation der DNA statt mit der wissenschaftlichen Fragestellung.


Maricic T und Pääbo S (2009): Optimization of 454 sequencing library preparation from small amounts of DNA permits sequence determination of both DNA strands. BioTechniques 46(1):51-57.


(Eigentlich wollte ich gestern abend ja die Paperbesprechung posten, dann habe ich aber ein tolles Rezept für Erdnussbutter-Schoko-Brownies gefunden, das ich lieber austesten wollte. Deshalb kriegt ihr erstmal nur diesen kurzen Post.)

Mittwoch, Januar 07, 2009

Dieses warme Gefühl in der Magengegend

Nein, ich hab nicht gerade nen Döner verdrückt. Es geht mir um einen der Gründe, warum zumindest ich in der Wissenschaft bin (und ich gehe davon aus, dass dieser Grund auch für viele andere zutrifft).
Wer sozusagen an vorderster Front der Wissenschaft forscht, der hat immer mal wieder einen Vorsprung gegenüber dem Rest der Menschheit: Aus den Versuchen erhält man interessante Daten, die einem etwas über die Natur erzählen. Immer wenn das passiert, ist man der einzige auf der Welt der das weiß, und es ist ein tolles Gefühl, sei es auch noch so klein und unbedeutend. Dieses Gefühl macht jedenfalls all die Monate von x-mal wiederholten Routinearbeiten im Labor wieder wett, man ist erfüllt von einem unbeschreiblichen Tatendrang, so dass man noch mehr Zeit im Labor zubringt als sonst. Nicht nur mir ging das so - wie es aussieht hatte Alex Palazzo vom Daily Transcript dieses Erlebnis gerade, nur ne Nummer größer!

So I isolated each factor and sent them to be identified by mass spectroscopy. Then I waited. Christmas came and went. Friend visited from New York, family visited from Montreal and then early on New Years Eve I received an email from the mass spec facility. My results had arrived! Before anyone was up, I looked over the list and realized what I had stumbled into. I couldn't believe my eyes. It's obviously the answer. Obvious. I should have gone fishing earlier. Now all that is missing is the last piece of the puzzle. That last factor that must link all the bits together.

This is why I haven't been blogging. This is why it's 10:01PM and I'm in the lab. This is why I've been totally obsessed with my work.

This is why I'm in science.

Gutes für die Ohren

Wenn ich auf gute Blogposts verlinke, warum dann nicht auch auf gute Podcasts, die mir zwischen die Ohren kommen? Das dürfte sich also in so eine Art Serie entwickeln...
Diese Woche kann ich gleich mit drei Tipps loslegen:

Im immer sehr guten Futures in Biotech Podcast wird in der aktuellen Folge 37 [MP3-Link]Marty Chalfie interviewt, einer der drei diesjährigen Chemie-Nobelpreisträger. In dieser Folge geht es um seine Arbeit am Modellorganismus Caenorhabditis elegans und der Erforschung der molekularen Grundlagen des Tastsinnes. In der nächsten Folge soll dann die Entwicklung von GFP als Werkzeug angesprochen werden, für die er mit dem Nobelpreis ausgezeichnet wurde.

StarShipSofa ist die Audioversion von Science Fiction Magazinen wie Asimov's oder Astounding. Neben diversen Sektionen mit Fiktion, wie Gedichte und Short Stories, gibt es auch nicht-fiktionale Abschnitte. In der Folge Aural Delights 57 [MP3-Link] gibt JJ Campanella eine sehr gute Übersicht über grüne Gentechnik - informativ aber spannend, ohne Hype und Panik, dafür aber sehr ausgewogen. Ungefähr bei 55:30 fängt der Teil an.

BBC Radio 4 stellt mit In Our Time den meiner Meinung nach besten Geschichtspodcast ins Netz. Das liegt vielleicht daran, dass nicht wie im Geschichtsbuch ein Zeitpunkt oder ein Ereignis herausgepickt wird, und dann aufgezählt wird was da passiert ist. Vielmehr wird in jeder Folge ein Aspekt oder eine Idee aus Philosophie, Wissenschaft oder anderen Bereichen genommen und in der zeitlichen Entwicklung betrachtet. Aktuell gibt es anlässlich des Darwinjahres 2009 nur im Podcast Feed eine vierteilige Dokumentation über das Leben von Charles Darwin - klasse! Online sind bereits drei Teile [MP3-Links Teil 1, Teil 2, Teil 3].

Wenn ihr auch etwas Gutes gehört habt, immer her mit den Empfehlungen!

Freitag, Januar 02, 2009

sinnfreie Kommentare von Nobelpreisträgern

Es ist ja mittlerweile fast schon ein Merkmal von Nobelpreisträgern, dass sie mit der Annahme des Preises ihr Hirn abgeben und danach nur noch mit unverständlichen Aussagen Schlagzeilen machen. Der bekannteste Vorfall dieser Art in letzter Zeit waren die rassistischen Äußerung von James Watson, die ihn letztlich auch seinen Posten als Direktor des Cold Spring Harbor Laboratory.

Jetzt hat die deutsche Nobelpreisträgerin Christiane Nüsslein-Volhard in einem ZEIT-Interview nachgezogen. Ich konnte davon nur eine kurze Pressemeldung finden, darin stehen aber schon ein paar knackige Sätze.
Kurz zusammengefasst hat Frau Nüsslein-Volhard etwas dagegen, dass so viel DNA sequenziert werde. Genauer gehe das Sequenzieren auf Kosten anderer biologischer Arbeiten, die sie für wichtiger hält. Ich verstehe ja, dass sie ihr Fachgebiet, die Entwicklungsbiologie, für total spannend hält, aber ich konnte nie nachvollziehen, wieso man anderen Gebieten ihre Relevanz absprechen will. DNA wird nicht sequenziert, dass man große Datenbanken mit vier Buchstaben füllen kann - Sequenzen sind die Grundlage für viele weitere Probleme. Unter anderem auch für die Entwicklungsbiologie.
Christiane Nüsslein-Volhard wurde 1995 zusammen mit Edward B. Lewis und Eric F. Wieschaus mit dem Nobelpreis geehrt. Das Thema war hier die Untersuchung der Genetik der Embryonalentwicklung. Die Gene, denen die von Wieschaus und Nüsslein-Volhard untersuchten Entwicklungsmutanten zugrundeliegen, sind heute Modelle für die entsprechenden Gene in anderen Organismen. Warum? Weil wir die Sequenzen dieser Gene kennen, und darüber verwandte Gene finden können!

Nebenbei geht Frau Nüsslein-Volhard in dem ZEIT-Interview auch noch gegen die synthetische Biologie im Allgemeinen, und Craig Venter im Besonderen, an. Jetzt mal ganz von Abneigungen gegen Venter und seinen Methoden abgesehen - ihre Aussage, dass Venter es nicht schaffen wird, einen künstlichen Organismus zu erzeugen, ist mittlerweile als sehr mutig zu bezeichnen. Er hat bereits veröffentlicht, dass er ein gesamtes Genom einer Bakterienart in die Zelle einer anderen Art überführen kann, und dass diese Zelle dann alle Eigenschaften der Spenderart annimmt. In einem zweiten Paper zeigte er, dass die chemische Synthese eines kompletten Genoms möglich ist. Kombiniert man beide Techniken, hat man einen künstlichen Organismus. Und das ist wohl nur noch eine Frage der Zeit.
Interessanterweise benutzt sich hier Frau Nüsslein-Volhard einer Argumentationstechnik, die auch gern von Kreationisten benutzt wird: dem argumentum ad ignorantiam.
"Die Natur ist wahnsinnig gut. So raffiniert, dass wir sie bis heute nicht vollständig verstanden haben."
Ich bin mal gespannt, was da im vollständigen Interview noch zum Vorschein kommt.