Sonntag, August 10, 2008

DNA-Strukturen II: Haarnadeln

Die Idee, diesen Post mit einem Frisurenwitz zu beginnen, hab ich dann doch sein gelassen. Aber es stimmt wirklich: DNA kann Strukturen ausbilden, die wie Haarnadeln (oder halt auf engl. hairpins) aussehen. Der Grund dafür ist eigentlich ein simpler. Die Grundregeln der Paarung von Nukleotiden, also die Watson-Crick Basenpaarung (A-T und C-G), gilt nicht nur dann, wenn sich zwei Stränge von DNA aneinander lagern. Das klappt problemlos auch innerhalb eines Strangs, sofern es die Nukleotidsequenz zulässt.

Ein klassisches Beispiel sind hier die direct repeats. Eigentlich kann sich jeder gut vorstellen, wie so etwas aussehen muss. Wir nehmen eine bestimmte DNA-Sequenz (z.B. ACGT) und wiederholen sie ein- bis mehrmals, auch mit ein wenig Abstand dazwischen. In dem Fall ist es für die DNA möglich, Basenpaarungen innerhalb eines Strangs auszubilden.
Abbildung aus Dhar und Lahue, 2008

Die daraus entstehende Struktur sieht wie eine Haarnadel aus: Die beiden gepaarten Teile eines DNA-Strangs stehen aus der Ebene des Doppelstrangs heraus; liegt zwischen den wiederholten Sequenzen noch ein nicht wiederholter Bereich DNA, so bildet der eine Schleife (loop) aus ungepaarten Nukleotiden.

Solche Haarnadelstrukturen stellen für Zellen ein großes Problem dar. Weil die hairpins wie gesagt aus der Ebene des DNA-Doppelstrangs herausstehen, behindert dies viele DNA-bindende Proteine. Um mal mit etwas eher positivem anzufangen will ich erst ein Beispiel bringen, wie dieses Problem auch vorteilhaft ausgenutzt werden kann. Während der Transkription bildet die Zelle eine Abschrift eines Gens in Form von mRNA. Dazu muss aber der Komplex aus Proteinen, der die Transkription bewerkstelligt, genau wissen wo auf der DNA er anzufangen und aufzuhören hat. Und beim Beenden der Translation kommen zumindest in einigen Fällen die repeats ins Spiel: Im Modellbakterium E. coli besitzen manche Gene an ihrem Ende Terminatorsequenzen, in denen Sequenzen wiederholt werden. Erreicht die Transkriptionsmaschinerie diesen Terminator, dann bildet die neu hergestellte mRNA einen hairpin aus, der die Proteine von der DNA abfallen lässt - die Transkription ist beendet.

Im Allgemeinen sieht es aber nicht so rosig für die Zelle aus, was Haarnadelstrukturen angeht. Die Probleme beginnen schon viel früher als in der Transkription, wo die hairpins selbstverständlich stören, wenn sie nicht zufällig im Terminator liegen. Es ist nämlich schon schwer für die Zelle, die DNA während der Replikation über solche Bereiche hinweg zu kopieren. Deshalb gibt es auch einige Proteine, die spezifisch Haarnadelstrukturen erkennen und auflösen können.
Ein sehr berühmter (berüchtigter?) Fall ist die Krankheit Chorea Huntington (oder Huntington's Disease), eine erst spät im Leben einsetzende neurodegenerative Erbkrankheit. Da Nervenzellen im Gehirn ihre Funktion verlieren und absterben, leiden Erkrankte sowohl unter psychischen und kognitiven Beschwerden, als auch immer stärker eingeschränkter Bewegungsfähigkeit, bis sie nach mehreren Jahren sterben. Bisher ist keine Möglichkeit bekannt, die Krankheit aufzuhalten oder zu heilen.
Nach langem Suchen wurde die Ursache für diese Krankheit im Gen Huntigtin in einer Abfolge von von CAGs gefunden. In gesunden Menschen wird das CAG nicht mehr als 35 mal wiederholt. Sieht man sich diesen Bereich jedoch in Erkrankten an, dann findet man bis zu 250 CAG-Wiederholungen! Mehr noch, diese Krankheit kann vererbt werden, und in der Regel verlängert sich die CAG-Kette mit den Generationen. Wie kommt diese Verlängerung zustande? Die DNA-Polymerase, die während der Replikation die DNA-Stränge kopiert, verliert bei so langen Wiederholungen immer gleicher Basen irgendwann die Übersicht, wie viel sie denn eigentlich schon produziert hat. Schuld daran ist wahrscheinlich, dass sie auf dem CAG-Bereich hin- und herrutscht (replication slippage), und dass währenddessen die DNA hairpins ausbilden kann. So kann mit jeder Zellteilung die CAG-Kette länger werden. Wieso kann eine Verlängerung der CAG-Folge eine solche Krankheit auslösen? Dazu muss man wissen, dass die Information, in welcher Abfolge Aminosäuren zu Proteinen zusammengebaut werden, in der DNA als Nukleotidtripletts kodiert sind. Bei der Herstellung von Proteinen wird immer drei Nukleotide abgelesen und in eine Aminosäure "übersetzt", die dann mit der vorigen verknüpft wird (Translation). Aha! Drei Nukleotide gleich eine Aminosäure, und Schuld ist eine Wiederholung der drei Nukleotide CAG! Genau, die CAG-Wiederholungen auf DNA-Ebene entsprechen Wiederholungen der Aminosäure Glutamin. Es ist noch nicht genau geklärt, wieso genau eine lange Glutaminkette im Huntingtin-Protein zu all den beschriebenen Problemen führt, aber mögliche Schuldige sind ein schlechterer Abbau des Proteins, die Bildung von großen Proteinklumpen durch Zusammenlagerung über die Glutamine, oder toxische Eigenschaften des veränderten Proteins.
Neben Chorea Huntington sind noch weitere Krankheiten bekannt, die alle auf die Verlängerung von Wiederholungen von drei Nukleotiden zurückzuführen sind.

Abbildung aus Daee et al., 2007
In der Abbildung sind Möglichkeiten gezeigt, wie Trinukleotidrepeats verlängert werden können. Beschrieben habe ich die in B gezeigte Variante, replication slippage. Speziell bei Trinukleotidrepeats scheint die Helikase SRS2 eine wichtige Rolle in der Längenregulation zu spielen, indem sie hairpins entwindet. [1]

Zum Abschluss will ich noch ein wenig Abstand von Krankheiten und Haarnadeln nehmen und einen globaleren Blick auf das Genom werfen. Wenn diese repeats so schlecht für die Zelle sind, wieso gibt es sie dann überhaupt? Interessanterweise sind Nukleotidwiederholungen im menschlichen Genom [2] nicht gleich of vorhanden. Wiederholungen einzelner Nukleotide beispielsweise unterscheiden sich um den Faktor 150 in ihrem Auftreten [4]! Ähnlich ist es auch bei Di- und Trinukleotidwiederholungen. Doch nicht nur der Anteil von repeats ist nicht-zufällig, auch die Position dieser repeats im Genom. Innerhalb der kodierenden Bereiche von Genen finden sich signifikant weniger repeats aller Arten als außerhalb davon. Interessanterweise finden sich (in Pflanzen, wie es in anderen Organismen aussieht weiß ich nicht) die repeats aber häufiger in nichtkodierenden Bereichen von Genen als im Rest des Genoms. Das heißt, dass die Wiederholungen vor allem in den regulatorischen Bereichen vor und hinter den proteinkodierenden Teilen eines Gens angereichert sind. Da ein Vergleich der Verteilung von repeats in verschiedenen Pflanzengenomen ein ähnliches Muster ergab, und speziell die Wiederholungen in den regulatorischen Regionen zwischen vielen Pflanzen über Millionen von Jahren unverändert blieben, scheinen sie wohl eine regulatorische Funktion zu besitzen. Wie die aussieht ist noch niemandem klar; es ist aber nicht dumm zu vermuten, dass die Ausbildung von Haarnadelstrukturen den Zugang von Proteinen zu den Genen beeinflussen kann.

Die Abbildungen konnte ich übrigens verwenden, weil die Arbeiten in Open Access Zeitschriften veröffentlicht wurden. Ich werde auch weiterhin keine Abbildungen verwenden, die nicht unter einer freien Lizenz stehen. Schade für die vielen geschlosenen Journals. Aber es bessert sich ja so langsam!

[1] über SRS2 sicher demnächst noch mehr, und nicht nur weil ich zufällig damit arbeite :-]
[2] in anderen Genomen auch, ich habe fürs menschliche aber gerade Zahlen [3]
[3] die Daten sind aus Stewart Scherers "A short guide to the Human Genome", über das ich in den nächsten Tagen auch noch schreiben will
[4] A oder T: 27369; C oder G: 187

Dhar A und Lahue RS (2008): Rapid unwinding of triplet repeat hairpins by Srs2 helicase of Saccharomyces cerevisiae. Nucleic Acids Research 36(10):3366-3373.
Daee DL et al. (2007): Postreplication Repair Inhibits CAG · CTG Repeat Expansions in
Saccharomyces cerevisiae. Molecular and Cellular Biology 27(1):102-110.
Morgante M et al. (2002): Microsatellites are preferentially associated with nonrepetitive DNA in plant genomes. Nature Genetics 30:194-200.
Zhang L et al. (2006): Conservation of noncoding microsatellites in plants: implications for gene regulation. BMC Genomics 7:323.

4 Kommentare:

Anonym hat gesagt…

Werden diese unterschiedlich vielen Wiederholungen (variable number tandem repeats, wenn ich mich nicht irre) nicht auch zur Bestimmung von Verwandtschaften, wie z.B. Vaterschaftstests, verwendet?

Argent23 hat gesagt…

Prinzipiell ja, das sind aber ein paar wenige, speziell ausgewählte repeats, die sowieso schon sehr variabel in ihrer Länge in der Bevölkerung vorkommen, und die keinen Einfluss auf den Phänotyp haben.
Diese Art von kurzen repeats findet übrigens auch in der Erstellung von Genkarten vieler Organismen als Marker Anwendung. Da werden die Dinger jedoch meistens als SSR (simple sequence repeat) bezeichnet.

Argent23 hat gesagt…

Noch ein Nachtrag. Dass die für Vaterschaftstests verwendeten repeats sowohl sehr variabel in ihrer Länge sind und phänotypisch unauffällig hängt sicher miteinander zusammen. Wären sie in sensiblen Regionen auf einem Chromosom, dann würden Größenänderungen wahrscheinlicher Effekte haben. Anders herum: Dort, wo sich diese repeats befinden, ist es ziemlich egal, ob sie länger oder kürzer sind, es wirken also keine Selektionskräfte auf sie.

Anonym hat gesagt…

"Dort, wo sich diese repeats befinden, ist es ziemlich egal, ob sie länger oder kürzer sind, es wirken also keine Selektionskräfte auf sie."

Genau darauf wollte ich anspielen, dewegen eignen sie sich recht gut zur Bestimmung von Verwandtschaften, da sie eben nicht selektiert, sondern einfach nur vererbt werden.