Synthetische Genomik: einen halben Schritt weg vom „Element des Lebens“. Von Zellpopulationen zu einzelnen Zellen

Genomik - die Untersuchung des gesamten Genoms

Neueste Fortschritte in der Sequenzierung und Entwicklung technische Mittel zum Bearbeiten eine große Anzahl Klone in der Genbibliothek ermöglichten es Wissenschaftlern, das gesamte Genom eines Organismus auf einmal zu untersuchen. Die vollständigen Sequenzen vieler Arten wurden inzwischen bestimmt, darunter die meisten sogenannten modellgenetischen Organismen wie z E coli;Spulwurm Caenorhabditis elegans; und natürlich das klassische Objekt der Genetik, die Fruchtfliege Drosophila melanogaster. In den 1990er Jahren wurde trotz einiger Schwierigkeiten und Meinungsverschiedenheiten ein Projekt zur Erforschung des menschlichen Genoms („Human Genome“) gestartet, für das Mittel bereitgestellt wurden Nationales Institut die Gesundheit. Im Februar 2001 große Gruppe Forscher unter der Leitung von J. Craig Venter vom Privatlabor Celera Genomics gaben eine Erklärung zur vorläufigen Entschlüsselung des menschlichen Genoms ab. Das Ergebnis ihrer Arbeit wurde am 16. Februar 2001 in der Zeitschrift Science veröffentlicht.

Eine andere Version, eingereicht von einer Gruppe des International Human Genome Sequencing Consortium, wurde am 13. Februar 2001 in der Zeitschrift Nature veröffentlicht.

Als Geburtsstunde der Genomik kann die Mitte des 20. Jahrhunderts angesehen werden, als Genetiker alle Chromosomen von Modellorganismen anhand der Häufigkeit von Rekombinationen kartierten (siehe Kapitel 8). Diese Karten zeigten jedoch nur die Gene, für die mutierte Allele bekannt waren, und daher können solche Karten nicht als vollständig bezeichnet werden. Die vollständige DNA-Sequenzierung ermöglicht es Ihnen, alle Gene eines Organismus zu lokalisieren und die Abfolge der Basen zwischen ihnen festzulegen.

Die Genomik ist in strukturelle und funktionelle unterteilt. Die Strukturgenomik zielt darauf ab, herauszufinden, wo genau sich bestimmte Gene in der chromosomalen DNA befinden. Computerprogramme erkennen die typischen Anfänge und Enden von Genen und wählen diejenigen Sequenzen aus, die am wahrscheinlichsten Gene sind. Solche Sequenzen werden aufgerufen offenes Leseraster (OFR). Das Gleiche Computerprogramme kann auch typische Introns in OFR-Sequenzen erkennen. Nachdem die Introns aus dem potenziellen Gen isoliert wurden, verwendet der Computer den verbleibenden Code, um die Sequenz der Aminosäuren im Protein zu bestimmen. Anschließend werden diese potentiellen Proteine ​​mit solchen Proteinen verglichen, deren Funktionen bereits bekannt sind und deren Sequenzen bereits in die Datenbank eingetragen sind. Dank dieser Art von Programmen, den sogenannten Evolutionärer Konservatismus: dass es für die meisten Gene in verschiedenen Organismen ähnliche Gene gibt. Aus Sicht der evolutionären Entwicklung ist diese Ähnlichkeit nachvollziehbar: Wenn ein Protein einer biologischen Spezies gut an seine Funktionen angepasst ist, dann wird sein Gen in gleicher Form oder mit weitergegeben Kleine Veränderungen zu Arten, die von der Initiale abgeleitet sind. Evolutionärer Konservatismus ermöglicht die Identifizierung von Genen, die mit einem bestimmten Gen in anderen Organismen verwandt sind. Durch den Vergleich des resultierenden Gens mit bereits bekannten ist es oft möglich, seine Funktion zu bestimmen, was notwendigerweise in späteren Experimenten überprüft werden muss.

Sobald alle potenziellen Gene identifiziert wurden, beginnt die genetische Kartierung. Die genetische Karte des Menschen ist ein recht unübersichtliches und kunterbuntes Diagramm, da jedes Gen je nach Funktion mit einer bestimmten Farbe markiert ist, die im Vergleich zu anderen bekannten Genen festgelegt ist. Die meisten menschlichen Gene, wie die Gene aller Eukaryoten im Allgemeinen, haben große Introns. Nach groben Schätzungen sind unter den veröffentlichten Sequenzen etwa ein Drittel bis ein Viertel Introns. Kurioserweise enthalten nur etwa 1,5 % des gesamten menschlichen Genoms (etwa 2,9 x 10 9 Basenpaare) Sequenzen (Exons), die für Proteine ​​kodieren. Außerdem scheint diese DNA nur 35.000-45.000 Gene zu enthalten, was weniger ist als vorhergesagt. Wir müssen noch verstehen, wie eine relativ kleine Anzahl von Genen für einen so komplexen Organismus kodiert.

Anzahl der Kopien repetitiver DNA unterschiedliche Leute ist nicht gleich, sodass sie zur Feststellung der Identität, auch in der Gerichtsmedizin, herangezogen werden können.

funktionelle Genomik ist die Untersuchung der Genfunktion auf der Ebene des gesamten Genoms. Obwohl potenzielle Gene durch ihre Ähnlichkeit mit Genen identifiziert werden können, die bekannte Funktionen in anderen Organismen erfüllen, sollten alle Vermutungen gegen den untersuchten Organismus getestet werden. In einigen Modellorganismen, wie zum Beispiel Nährhefe, ist es möglich, die Funktion von Genen systematisch einzeln auszuschalten. Ausschalten des Gens tritt auf, indem seine funktionale Form durch eine gelöschte Form auf einem speziellen Vektor ersetzt wird. Besorgen Sie sich dann eine Sorte mit einem deaktivierten Gen und bewerten Sie ihren Phänotyp. In einem laufenden Programm zur Analyse des Nährhefegenoms wurden mehrere tausend Gene eines nach dem anderen ausgeschaltet.

Eine andere Methode der funktionellen Genomik besteht darin, den Mechanismus der Transkription auf der Ebene des gesamten Genoms zu untersuchen. Diese Methode basierend auf der Annahme, dass die meisten biologische Phänomene vertreten komplexe Prozesse mit vielen Genen. Von besonderem Interesse für die Forschung sind die Prozesse im Zusammenhang mit der Entwicklung des Organismus, die wir in Kap. 11. Wenn die Gentranskription untersucht wird unterschiedliche Bedingungen Wachstum, dann kann man sich ein Bild von den kompletten genetischen Bahnen der Entwicklung des Organismus machen.

Aber wie kann die Transkription auf genomweiter Ebene untersucht werden? Auch hier helfen neue Technologien Wissenschaftlern dabei. Die DNA jedes Gens im Genom oder eines Teils des Genoms wird auf der Oberfläche von kleinen Glasplatten angeordnet, die der Reihe nach angeordnet sind. Dann werden sie allen Arten von mRNA ausgesetzt, die in der Zelle vorkommen gegebenen Organismus. DNA auf Platten wird auf zwei Arten erhalten. Auf eine Weise werden alle mRNAs unterworfen umgekehrte Transkription um kurze komplementäre DNA-Moleküle zu erhalten, die einem Gen entsprechen. Auf andere Weise werden Gene (oder Teile von Genen) Base für Base in bestimmten Bereichen der Platten synthetisiert. Die Synthese wird von Robotern durchgeführt, die die Glasoberfläche in einer bestimmten Reihenfolge öffnen und schließen. Aufzeichnungen mit dem Genom vieler Organismen können von Chemieunternehmen erworben werden.

Genomik wird normalerweise als einer der Zweige bezeichnet Molekularbiologie. Seine Hauptaufgabe liegt in der sogenannten Genomsequenzierung – der Untersuchung der Nukleotidsequenzen von DNA und RNA. Verwechseln Sie die Wörter Genetik und Genomik nicht. Die Genetik befasst sich mit dem Studium der Mechanismen der Vererbung und Variabilität, und die Genomik soll die gewonnenen Erkenntnisse in die Praxis umsetzen.

Aus der Wissenschaftsgeschichte

Als Spezialgebiet wurde die Genomik in den Jahren 1980-1990 mit dem Aufkommen der ersten Projekte zur Sequenzierung (molekulare Analyse) von Genomen gebildet bestimmte Typen lebende Organismen.

Struktur der Genomik

In der modernen Genomik gibt es viele Unterabschnitte:

  • vergleichende oder evolutionäre Genomik basiert auf einem Vergleich der Organisation und des Inhalts der Genome verschiedener lebender Organismen;
  • funktionelle Genomik - Studien im Detail die Funktionen von Genen, ihre Auswirkungen auf die Genaktivität;
  • Die Strukturgenomik befasst sich mit der Sequenzierung, der molekularen Analyse von DNA, auf deren Grundlage genomische Karten erstellt und verglichen werden können.

Warum brauchen wir Genomik?

Eine große Anzahl von Genomen verschiedener Mikroorganismen (hauptsächlich pathogener) wurde entschlüsselt. Dadurch ist es möglich, hier nach Wirkstoff-Zielgenen zu suchen und neue Medikamente herzustellen.

Die Genomik wird als integraler, notwendiger Bestandteil wahrgenommen Allgemeine Biologie. Es kann einen wesentlichen Beitrag zur Entwicklung der Biotechnologie leisten, Landwirtschaft, Gesundheitspflege.

In einem Krankenhaus in Wisconsin verwirrte ein dreijähriges Kleinkind die Ärzte lange Zeit. Bei diesem Kind waren die Eingeweide ödematös und fast vollständig von Abszessen durchsetzt. Dieses Kind hatte im Alter von drei Jahren mehr als hundert Operationen überstanden. Dem Baby wurde eine vollständige Sequenz der kodierenden Regionen seiner DNA gegeben, der Übeltäter der Krankheit wurde identifiziert – das XIAP-Protein, das an den Signalketten des programmierten Zelltods beteiligt ist, spielt dabei eine große Rolle wichtige Rolle im Immunsystem. Aufgrund der Diagnose empfahlen Physiologen eine Knochenmarktransplantation. Das Baby war gerettet.

Ein weiterer Fall betraf einen atypischen Krebs bei einer 39-jährigen Frau, die an einer akuten Form von Promyelozytenleukämie litt. Bei Verwendung von Standarddiagnostikmethoden konnte die Krankheit nicht erkannt werden. Sondern bei der Entschlüsselung und Analyse des Genoms Krebszellen Es konnte festgestellt werden, dass ein großer Teil des fünfzehnten Chromosoms auf das siebzehnte wanderte, was eine bestimmte Geninteraktion provozierte. Dem Patienten wurde eine angemessene Behandlung verschrieben.

Erster Entwurf, 2003 - Abschluss des Projekts). Seine Entwicklung wurde nicht nur durch die Verbesserung der biochemischen Methoden möglich, sondern auch durch die Entstehung einer leistungsfähigeren Informatik wodurch es möglich wurde, mit riesigen Datenmengen zu arbeiten. Die Länge der Genome in lebenden Organismen wird manchmal in Milliarden von Basenpaaren gemessen. Zum Beispiel besteht das menschliche Genom aus etwa 3 Milliarden Basenpaaren. Das größte bekannte (Anfang 2010) Genom gehört zu einer der Lungenfischarten (ca. 110 Milliarden Paare).

Abschnitte der Genomik

Strukturelle Genomik

Strukturelle Genomik - der Inhalt und die Organisation genomischer Informationen. Ziel ist es, Gene mit bekannter Struktur zu untersuchen, um ihre Funktion zu verstehen, sowie zu bestimmen räumliche Struktur die maximale Anzahl von "Schlüssel"-Proteinmolekülen und deren Einfluss auf Interaktionen.

funktionelle Genomik

Funktionelle Genomik ist die Umsetzung der im Genom festgehaltenen Informationen vom Gen bis zum Merkmal.

Vergleichende Genomik

Vergleichende Genomik (evolutionär) - vergleichende Studien zum Inhalt und zur Organisation von Genomen verschiedene Organismen.

Die Gewinnung vollständiger Genomsequenzen hat Aufschluss über das Ausmaß der Unterschiede zwischen den Genomen verschiedener lebender Organismen gegeben. Die folgende Tabelle enthält vorläufige Daten zur Ähnlichkeit der Genome verschiedener Organismen mit dem menschlichen Genom. Die Ähnlichkeit wird in Prozent angegeben (was den Anteil an Basenpaaren widerspiegelt, die in den beiden verglichenen Spezies identisch sind).

Aussicht Ähnlichkeit Anmerkungen und Quellen
Menschlich 99,9 % Humangenomprojekt
100 % eineiige Zwillinge
Schimpanse 98,4 % Amerikaner für den medizinischen Fortschritt;
98,7 % Richard Mural von Celera Genomics, zitiert auf MSNBC
Bonobo oder Zwergschimpanse Dasselbe wie bei Schimpansen.
Gorilla 98,38 % Basierend auf der Untersuchung intergener nicht-repetitiver DNA (American Journal of Human Genetics, Februar 2001, 682, S. 444-456)
Maus 98 %
85 % beim Vergleich aller Sequenzen, die Proteine ​​codieren, NHGRI
Hund 95 % Jon Entine beim San Francisco Examiner
C.elegans 74 % Jon Entine beim San Francisco Examiner
Banane 50 % Amerikaner für den medizinischen Fortschritt
Narzisse 35 % Steven Rose in The Guardian vom 22. Januar

Anwendungsbeispiele der Genomik in der Medizin

In einem Krankenhaus in Wisconsin verwirrte ein dreijähriges Kind die Ärzte lange Zeit, sein Darm war geschwollen und vollständig mit Abszessen übersät. Bis zum Alter von drei Jahren hatte dieses Kind mehr als hundert verschiedene Operationen erlebt. Für ihn wurde eine vollständige Sequenz der kodierenden Regionen seiner DNA bestellt, den Ergebnissen zufolge wurde mit Hilfe improvisierter Mittel der Übeltäter der Krankheit identifiziert – das XIAP-Protein, das an den Signalketten des programmierten Zelltods beteiligt ist. Bei normale Operation es spielt eine sehr wichtige Rolle im Immunsystem. Aufgrund dieser Diagnose empfahlen die Physiologen im Juni 2010 eine Knochenmarktransplantation. Bereits Mitte Juni konnte das Kind zum ersten Mal in seinem Leben essen.

Ein weiterer Fall war mit einem atypischen assoziiert Krebs bei einer 39-jährigen Frau, die an leidet akute Form Promyelozytenleukämie. Bei Standardmethoden Diagnose, jedoch wurde die Krankheit nicht identifiziert. Doch bei der Entschlüsselung und Analyse des Genoms von Krebszellen stellte sich heraus, dass ein großer Teil des 15. Chromosoms auf das 17. wanderte, was eine bestimmte Gen-Interaktion verursachte. Als Ergebnis erhielt die Frau die Behandlung, die sie benötigte.

Anmerkungen

siehe auch

Verknüpfungen

  • Tishchenko P.D. Genomics: eine neue Art von Wissenschaft in einer neuen kulturellen Situation.
  • Complete Microbial Genomes (vollständig entschlüsselte Genome von Bakterien und Archaeen).

Wikimedia-Stiftung. 2010 .

Synonyme:

Sehen Sie, was "Genomik" in anderen Wörterbüchern ist:

    Genomik- * Genomik * Genomik ist eine neue Richtung der Genetik, die Wissenschaft der Genome, einschließlich der Untersuchung ihrer Struktur, Funktionsweise und Evolution auf molekularer, chromosomaler, biochemischer, physiologische Ebenen. Eine der Aufgaben von Struktur G. ist ... ... Genetik. Enzyklopädisches Wörterbuch

    Vorhanden, Anzahl Synonyme: 1 Genetik (11) ASIS-Synonym-Wörterbuch. VN Trischin. 2013 ... Synonymwörterbuch

    Genomik- Die Wissenschaft, die alle Gene und ihre Rolle in der Struktur des Körpers untersucht, wie in normale Vorraussetzungen, und im Krankheitsfall Themen der Biotechnologie EN Genomik … Handbuch für technische Übersetzer

    Genomik- Lesen insbesondere des Genoms einer Person und damit verbundene wissenschaftliche und technische Aktivitäten: ஐ Es ist offensichtlich, dass es einfacher war, ungestraft Richtungen in der Technobiologie zu differenzieren, da nach Plagiaten und sogar nach Verbesserungen gefragt wurde ... .. . Lems Welt - Wörterbuch und Führer

    Genomik- Genomik Genomik Die Untersuchung des gesamten Satzes von Genen, aus denen ein Organismus besteht ... Erklärendes englisch-russisches Wörterbuch der Nanotechnologie. - M.

    Genomik- genomika statusas T sritis augalininkystė apibrėžtis Nauja genetikos kryptis, kuri apima genomo individualių genų molekulių lygyje, geno sandaros, jo raiškos, aktyvumo reguliavimo mechanizmo ir genų panaudojimo genų inžinerijos tikslams… … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    Zweig der Genetik, der die Struktur und Funktionsweise der Genomzerlegung untersucht. Organismen mit Hilfe von biol., physikalisch. Chem. und ComputermethodenNaturwissenschaft. Enzyklopädisches Wörterbuch

    Genomik- Genomik und... Russisches Rechtschreibwörterbuch

    Genomik- ein Abschnitt der Genetik, dessen Gegenstand das Studium der Prinzipien des Aufbaus von Genomen und ihrer Struktur ist Funktionelle OrganisationWörterbuch der Psychogenetik

    Versucht, die dreidimensionale Struktur jedes Proteins zu beschreiben, das von einem bestimmten Genom codiert wird. Es wird eine Kombination aus experimentellen und Modellierungsansätzen verwendet. Der grundlegende Unterschied zwischen struktureller Genomik und traditioneller struktureller ... ... Wikipedia

Bücher

  • Klinische Genetik. Genomik und Proteomik der Erbpathologie. Lernprogramm. Vulture UMO über klassische Universitätsausbildung, Mutovin Gennady Romanovich. Das Buch diskutiert die wichtigsten Bestimmungen und Konzepte der klinischen Genetik unter Berücksichtigung der Ergebnisse des internationalen wissenschaftlichen Programms „Human Genome“ (1988-2005). Geschichte, Bestimmungen, …

Ende des 20. Jahrhunderts entwickelten sich die molekularen Technologien so intensiv, dass die Voraussetzungen für die systematische Erforschung der Struktur von Genomen geschaffen wurden. verschiedene Typen Lebewesen, einschließlich Menschen. Eines der wichtigsten Ziele dieser Projekte ist die Bestimmung der vollständigen Nukleotidsequenz der genomischen DNA. So wurde eine neue Wissenschaft geboren - Genomik.

Der Beginn des neuen Jahrtausends war geprägt von der größten Entdeckung auf dem Gebiet der Genomik – die Struktur des menschlichen Genoms wurde entschlüsselt. Die Nachricht erwies sich als so bedeutend, dass sie Gegenstand von Diskussionen zwischen den Präsidenten der führenden Länder der Welt wurde. Viele Menschen waren von dieser Nachricht jedoch nicht beeindruckt. Das liegt vor allem an einem mangelnden Verständnis darüber, was ein Genom ist, wie es aufgebaut ist und was seine Entschlüsselung bedeutet. Hat diese Nachricht etwas mit Medizin zu tun und kann sie jeden von uns betreffen? Was ist Molekulare Medizin und hängt ihre Entwicklung mit der Entschlüsselung der Struktur des Genoms zusammen? Darüber hinaus haben einige Leute das befürchtet wieder eine neue Entdeckung von Wissenschaftlern für die Menschheit? Werden diese Daten für militärische Zwecke verwendet? Wird danach eine allgemeine genetische Zwangsuntersuchung folgen – eine Art genetische Passportisierung der Bevölkerung? Wird unser Genom analysiert und wie vertraulich werden die gewonnenen Informationen sein? All diese Fragen werden derzeit in der wissenschaftlichen Gemeinschaft aktiv diskutiert.

Natürlich begann die Genomik nicht beim Menschen, sondern bei viel einfacher organisierten Lebewesen. Derzeit ist die Nukleotidsequenz der genomischen DNA von vielen hundert Arten von Mikroorganismen entschlüsselt, von denen die meisten pathogen sind. Für Prokaryoten erwies sich die Vollständigkeit der Analyse als absolut, das heißt, kein einziges Nukleotid bleibt unentziffert! Dabei werden nicht nur alle Gene dieser Mikroorganismen identifiziert, sondern auch die Aminosäuresequenzen der von ihnen kodierten Proteine ​​bestimmt. Wir haben wiederholt festgestellt, dass die Kenntnis der Aminosäuresequenz eines Proteins es ermöglicht, seine Struktur und Funktion ziemlich genau vorherzusagen. Es eröffnet die Möglichkeit, Antikörper gegen dieses prädiktive Protein zu erhalten, es aus dem Mikroorganismus zu isolieren und direkt biochemisch zu analysieren. Denken wir mal darüber nach, was das für die Entwicklung grundlegend neuer Methoden zur Infektionsbekämpfung bedeutet, wenn der Arzt nicht nur weiß, wie die Gene des infizierenden Mikroorganismus angeordnet sind, sondern auch, welche Struktur und Funktion all seiner Proteine ​​hat? Die Mikrobiologie durchläuft derzeit enorme Veränderungen aufgrund des Aufkommens einer großen Menge neuer Erkenntnisse, deren Bedeutung wir derzeit nicht vollständig verstehen. Es wird wahrscheinlich Jahrzehnte dauern, dies anzupassen neue Informationen für die Bedürfnisse der Menschheit, vor allem im Bereich Medizin und Landwirtschaft.

Der Übergang von Prokaryoten zu Eukaryoten in Bezug auf die Entschlüsselung der Genomstruktur ist mit großen Schwierigkeiten verbunden, und zwar nicht nur, weil die Länge der höheren DNA tausend- und manchmal hunderttausendmal länger ist, sondern ihre Struktur komplexer wird. Denken Sie daran, dass im Genom höherer Tiere eine große Anzahl nicht kodierender DNA vorkommt, von denen ein erheblicher Teil repetitive Sequenzen sind. Sie bringen erhebliche Verwirrung in das korrekte Andocken bereits entschlüsselter DNA-Fragmente. Und außerdem sind Tandem-Wiederholungen selbst schwer zu entziffern. Im Bereich der Lokalisierung solcher Wiederholungen kann DNA eine ungewöhnliche Konfiguration aufweisen, was ihre Analyse erschwert. Daher sind im Genom einer der Arten von mikroskopisch kleinen Spulwürmern (Nematoden) - dem ersten vielzelligen Organismus, für den es möglich war, die Nukleotidsequenz der DNA zu bestimmen - bereits einige dunkle Stellen vorhanden. Richtig, ihre spezifisches Gewicht beträgt weniger als ein Hundertstel Prozent der Gesamtlänge der DNA, und diese Mehrdeutigkeiten betreffen weder Gene noch regulatorische Elemente. Die Nukleotidsequenz aller 19.099 Gene dieses Wurms, verteilt auf eine Fläche von 97 Millionen Basenpaaren, wurde vollständig bestimmt. Daher sind die Arbeiten zur Entschlüsselung des Fadenwurmgenoms als sehr erfolgreich anzuerkennen.

Ein noch größerer Erfolg ist mit der Entschlüsselung des Drosophila-Genoms verbunden, das nur 2-mal kleiner als die menschliche DNA und 20-mal größer als die Nematoden-DNA ist. Trotz des hohen genetischen Wissens über Drosophila waren bis zu diesem Zeitpunkt etwa 10 % ihrer Gene unbekannt. Aber am paradoxesten ist die Tatsache, dass die Drosophila, die viel besser organisiert ist als der Fadenwurm, weniger Gene hat als der mikroskopisch kleine Spulwurm! Es ist aus modernen biologischen Positionen schwer zu erklären. Mehr Gene als in Drosophila sind auch im entschlüsselten Genom einer Pflanze aus der Familie der Kreuzblütler vorhanden - Arabidopsis, die von Genetikern als klassisches Versuchsobjekt weit verbreitet ist.

Die Entwicklung genomischer Projekte wurde von der intensiven Entwicklung vieler Bereiche von Wissenschaft und Technik begleitet. So erhielt es einen starken Impuls für seine Entwicklung Bioinformatik. Ein neuer mathematischer Apparat wurde geschaffen, um riesige Informationsmengen zu speichern und zu verarbeiten; Supercomputersysteme mit beispielloser Leistung wurden entwickelt; Tausende von Programmen wurden geschrieben, die es ermöglichen, innerhalb weniger Minuten eine vergleichende Analyse verschiedener Informationsblöcke durchzuführen, täglich neue Daten, die in verschiedenen Labors der Welt gewonnen wurden, in Computerdatenbanken einzugeben und neue Informationen an das Vorhandene anzupassen früher angesammelt. Gleichzeitig wurden Systeme zur effektiven Isolierung verschiedener Elemente des Genoms und zur automatischen Sequenzierung, also zur Bestimmung von DNA-Nukleotidsequenzen, entwickelt. Auf dieser Basis wurden leistungsstarke Roboter konzipiert, die die Sequenzierung deutlich beschleunigen und kostengünstiger machen.

Die Entwicklung der Genomik wiederum hat zur Entdeckung einer Vielzahl neuer Tatsachen geführt. Die Bedeutung vieler von ihnen muss in Zukunft noch abgeschätzt werden. Aber schon jetzt zeichnet sich ab, dass diese Entdeckungen bei vielen zum Umdenken führen werden theoretische Positionenüber die Entstehung und Entwicklung verschiedener Lebensformen auf der Erde. Sie werden Ihnen helfen, besser zu verstehen Molekulare Mechanismen die der Arbeit einzelner Zellen und ihren Wechselwirkungen zugrunde liegt; detaillierte Entschlüsselung vieler bisher unbekannter biochemischer Kreisläufe; Analyse ihrer Verbindung mit fundamental physiologische Prozesse. Damit findet ein Übergang von der strukturellen zur funktionellen Genomik statt, die wiederum die Voraussetzungen für die Forschung schafft molekulare Grundlagen die Funktion der Zelle und des Organismus als Ganzes. Die bereits gesammelten Informationen werden in den nächsten Jahrzehnten Gegenstand der Analyse sein. Aber jeder nächste Schritt zur Entschlüsselung der Struktur der Genome verschiedener Arten führt zu neuen Technologien, die den Prozess der Informationsbeschaffung erleichtern. So kann die Verwendung von Daten über die Struktur und Funktion der Gene niedriger organisierter Arten von Lebewesen die Suche nach spezifischen Genen höherer Arten erheblich beschleunigen. Und schon heute ersetzen Computeranalysemethoden zur Identifizierung neuer Gene oft recht mühsame Molekulare Methoden Suche nach Genen.

Die wichtigste Folge der Entschlüsselung der Struktur des Genoms eine bestimmte Art ist die Möglichkeit, alle ihre Gene zu identifizieren und dementsprechend die molekulare Natur der transkribierten RNA-Moleküle und aller ihrer Proteine ​​zu identifizieren und zu bestimmen. In Analogie zum Genom wurden die Konzepte geboren Transkriptom, die den Pool von RNA-Molekülen vereint, die als Ergebnis der Transkription gebildet werden, und Proteom, das viele von Genen kodierte Proteine ​​enthält. Damit schafft die Genomik die Grundlage für die intensive Entwicklung neuer Wissenschaften - Proteomik und Transkriptomik. Proteomik befasst sich mit der Untersuchung der Struktur und Funktion jedes Proteins; Analyse Proteinzusammensetzung Zellen; Bestimmung der molekularen Grundlage der Funktionsweise einer einzelnen Zelle, die das Ergebnis der koordinierten Arbeit von vielen hundert Proteinen ist, und die Untersuchung der Bildung des phänotypischen Merkmals eines Organismus, die das Ergebnis der koordinierten Arbeit von ist Milliarden von Zellen. Auch auf RNA-Ebene laufen sehr wichtige biologische Prozesse ab. Ihre Analyse ist Gegenstand der Transkriptomik.

Die größten Anstrengungen von Wissenschaftlern in vielen Ländern der Welt, die auf dem Gebiet der Genomik arbeiten, wurden auf die Lösung gerichtet internationales Projekt"Menschliches Genom". Bedeutende Fortschritte auf diesem Gebiet sind mit der Umsetzung der von J. S. Venter vorgeschlagenen Idee verbunden, exprimierte DNA-Sequenzen zu suchen und zu analysieren, die später als eine Art „Etikett“ oder Marker für bestimmte Teile des Genoms verwendet werden können. Einen weiteren eigenständigen und nicht minder fruchtbaren Ansatz verfolgte die Arbeit der Gruppe um P. Collins. Es basiert auf der primären Identifizierung von Genen für menschliche Erbkrankheiten.

Die Entschlüsselung der Struktur des menschlichen Genoms führte zu einer sensationellen Entdeckung. Es stellte sich heraus, dass das menschliche Genom nur 32.000 Gene enthält, was ein Vielfaches weniger ist als die Anzahl der Proteine. Gleichzeitig gibt es nur 24.000 proteinkodierende Gene, die Produkte der restlichen Gene sind RNA-Moleküle. Der Prozentsatz der Ähnlichkeit in DNA-Nukleotidsequenzen zwischen verschiedenen Individuen, ethnischen Gruppen und Rassen beträgt 99,9 %. Diese Ähnlichkeit macht uns zum Menschen – Homo sapiens! Unsere gesamte Variabilität auf Nukleotidebene passt in eine sehr bescheidene Zahl – 0,1 %. Daher lässt die Genetik keinen Raum für Ideen nationaler oder rassischer Überlegenheit.

Aber schaut einander an – wir sind alle verschieden. Nationale und noch mehr rassische Unterschiede sind noch deutlicher. Wie hoch ist also die Zahl der Mutationen, die die Variabilität eines Menschen nicht prozentual, sondern absolut bestimmt? Um diese Schätzung zu erhalten, müssen Sie sich merken, wie groß das Genom ist. Die Länge eines menschlichen DNA-Moleküls beträgt 3,2 x 10 9 Basenpaare. 0,1 % davon sind 3,2 Millionen Nukleotide. Denken Sie jedoch daran, dass der codierende Teil des Genoms weniger als 3 % der Gesamtlänge des DNA-Moleküls einnimmt und Mutationen außerhalb dieser Region meistens keine Auswirkungen auf die phänotypische Variabilität haben. Um also eine integrale Schätzung der Anzahl der Mutationen zu erhalten, die den Phänotyp beeinflussen, müssen Sie 3 % von 3,2 Millionen Nukleotiden nehmen, was uns eine Zahl in der Größenordnung von 100.000 ergibt, dh etwa 100.000 Mutationen bilden unseren Phänotyp Variabilität. Vergleichen wir diese Zahl mit Gesamtzahl Genen stellt sich heraus, dass es im Durchschnitt 3-4 Mutationen pro Gen gibt.

Was sind das für Mutationen? Ihre große Mehrheit (mindestens 70 %) bestimmt unsere individuelle nicht-pathologische Variabilität, was uns auszeichnet, aber nicht im Verhältnis zueinander verschlechtert. Dazu gehören Merkmale wie Augenfarbe, Haare, Haut, Körperbau, Körpergröße, Gewicht, Verhaltenstyp, der ebenfalls weitgehend genetisch bedingt ist, und vieles mehr. Etwa 5 % der Mutationen sind mit monogenen Erkrankungen assoziiert. Etwa ein Viertel der verbleibenden Mutationen gehören zur Klasse der funktionellen Polymorphismen. Sie sind an der Bildung einer erblichen Veranlagung für eine weit verbreitete multifaktorielle Pathologie beteiligt. Natürlich sind diese Schätzungen ziemlich grob, aber sie ermöglichen es, die Struktur der menschlichen erblichen Variabilität zu beurteilen.



Dies ist Teil 1 der Geschichte der Genomik, genannt "Genomic Projects". In diesem Teil werde ich versuchen, allgemein darüber zu sprechen, wie die ersten Methoden zum Lesen genetischer Sequenzen entstanden sind, woraus sie bestanden und wie sich die Genomik vom Lesen einzelner Gene zum Lesen vollständiger Genome, einschließlich vollständiger Genome, entwickelt hat bestimmte Menschen.

Kurz nach der Entdeckung von Watson und Crick (Abb. 1) wurde die Wissenschaft der Genomik geboren. Genomik ist die Wissenschaft von der Untersuchung der Genome von Organismen, die das intensive Lesen vollständiger DNA-Sequenzen (Sequenzierung) und deren Abbildung in genetische Karten beinhaltet. Diese Wissenschaft befasst sich auch mit den Wechselwirkungen zwischen Genen und Allelen von Genen und ihrer Vielfalt, Mustern in der Evolution und der Struktur von Genomen. Die Entwicklung dieses Bereichs war so schnell, dass Texteditoren wie Microsoft Word kannte das Wort "Genom" nicht und versuchte, es auf das Wort "Zwerg" zu korrigieren.

Reis. einesJames Watson (links) und Francis Crick (rechts) – Wissenschaftler, die die DNA-Doppelhelix entdeckten

Das allererste abgelesene Gen war das Shell-Gen des Bakteriophagen MS2, das 1972 im Labor von Walter Fyers untersucht wurde. 1976 wurden auch andere Bakteriophagen-Gene bekannt - ihre Replikase, das Gen, das für die Reproduktion von Viruspartikeln verantwortlich ist. Kurze RNA-Moleküle ließen sich bereits relativ gut ablesen, große DNA-Moleküle konnten jedoch noch nicht richtig gelesen werden. Beispielsweise wurde die 24-Buchstaben-Sequenz der Lactose-Operon-Gensequenz, die 1973 von Walter Gilbert und Allen Maxam erhalten wurde, als bedeutender Durchbruch in der Wissenschaft angesehen. Hier ist die Reihenfolge:

5"—TGGAATTGTGAGCGGATAACAATT 3"
3"—ACCTTAACACTCGCCTATTGTTAA 5"

Die ersten DNA-Lesetechniken waren sehr ineffizient und verwendeten radioaktive Markierungen für DNA und chemische Methoden zwischen Nukleotiden zu unterscheiden. Beispielsweise könnte man Enzyme nehmen, die die Nukleotidsequenz mit unterschiedlichen Wahrscheinlichkeiten nachschneiden verschiedene Buchstaben. Das DNA-Molekül besteht aus 4 Buchstaben (Nukleotiden) A, T, G und C, die Teil einer doppelten Antiparallel sind (zwei Stränge sind gerichtet gegenüberliegende Seiten) Spiralen. Innerhalb dieser Helix stehen sich die Nukleotide gemäß der Komplementaritätsregel gegenüber: Gegenüber A in der anderen Kette ist T, gegenüber G ist C und umgekehrt.

Gilbert und Maxam verwendeten 4 Arten von Enzymen. Ein Schnitt nach A oder G, aber besser nach A (A>G), der zweite Schnitt besser nach G (G>A), der dritte nach C und der vierte nach C oder T (C+T). Die Reaktion wurde in 4 Reagenzgläsern mit jedem Enzymtyp durchgeführt, und dann wurden die Produkte auf ein Gel gegeben. DNA ist ein geladenes Molekül und wenn der Strom eingeschaltet wird, läuft es von Minus nach Plus. Kleinere Moleküle laufen schneller, sodass sich die geschnittenen DNA-Moleküle in der Länge aneinanderreihen. Betrachtet man die 4 Bahnen des Gels, konnte man erkennen, in welcher Reihenfolge sich die Nukleotide befinden.

Ein Durchbruch auf dem Gebiet der DNA-Sequenzierung gelang 1975, als der englische Biochemiker Frederick Sanger die sogenannte „Strand Termination Method“ zum Ablesen von DNA-Sequenzen vorschlug. Bevor wir jedoch über diese Methode sprechen, müssen die Prozesse vorgestellt werden, die während der Synthese neuer DNA-Moleküle ablaufen. Für die DNA-Synthese wird ein Enzym benötigt - DNA-abhängige DNA-Polymerase, die in der Lage ist, den Aufbau eines einzelsträngigen DNA-Moleküls zu einem doppelsträngigen zu vervollständigen. Dazu benötigt das Enzym einen „Samen“ – einen Primer, eine kurze DNA-Sequenz, die an ein langes einzelsträngiges Molekül binden kann, das wir zu einem doppelsträngigen aufbauen wollen. Auch die Nukleotide selbst in Form von Nukleotidtriphosphaten und bestimmte Bedingungen, wie ein bestimmter Gehalt an Magnesiumionen im Medium und eine bestimmte Temperatur, werden benötigt. Die Synthese geht immer in eine Richtung vom Ende namens 5' zum Ende namens 3'. Um DNA abzulesen, benötigt man natürlich eine große Menge an Matrix – also Kopien der abzulesenden DNA.

1975 kam Sanger auf Folgendes. Er nahm spezielle (terminierende) Nukleotide, die, nachdem sie sich der wachsenden Kette des DNA-Moleküls angeschlossen hatten, die Anheftung nachfolgender Nukleotide störten, das heißt, sie „brachen“ die Kette. Dann nahm er 4 Reagenzgläser, in die er jeweils alle 4 Arten von Nukleotiden und eine Art von terminierenden Nukleotiden in einer kleinen Menge hinzufügte. So konnte im Reagenzglas, wo sich das terminierende Nukleotid „A“ befand, die Synthese jedes neuen DNA-Moleküls überall dort abbrechen, wo „A“ hätte stehen sollen, im Reagenzglas mit dem terminierenden „G“ – überall wo G sollte stehen usw. Weiter. Auf das Gel wurden 4 Bahnen aus 4 Röhrchen aufgetragen (Abb. 2) und wieder „liefen“ die kürzesten Moleküle nach vorne, die längsten blieben am Anfang, und an den Unterschieden in den Banden konnte man erkennen, welches Nukleotid auf welches folgt. Um die Banden zu sehen, wurde eines der vier Nukleotide (A, T, G oder C) markiert, ohne die chemischen Eigenschaften zu verändern radioaktive Isotope.

Reis. 2Sanger-Methode. Drei Serien von 4 Tracks werden gezeigt.

Unter Verwendung dieser Methode wurde das erste DNA-basierte Genom gelesen, das Genom des Bakteriophagen ϕX174, 5.386 Nukleotide lang (das zuvor gelesene MS2-Phagengenom war RNA-basiert und hatte ein Genom mit einer Länge von 3.569 Nukleotiden).

Die Sanger-Methode wurde im Labor von Leroy Hood erheblich verbessert, wo 1985 die radioaktive Markierung durch eine leuchtende, fluoreszierende Markierung ersetzt wurde. Damit war der erste automatische Sequenzer möglich: Jedes DNA-Molekül war nun farbig verschiedene Farben je nachdem, was der letzte Buchstabe war (farbmarkiertes Nukleotid, das die Kette beendet). Die Fragmente wurden auf dem Gel nach Größe getrennt, und die Maschine las automatisch das Lumineszenzspektrum der ankommenden Banden und gab die Ergebnisse an einen Computer aus. Als Ergebnis dieses Verfahrens erhält man ein Chromatogramm (Abb. 2), nach dem sich eine DNA-Sequenz mit einer Länge von bis zu 1000 Buchstaben leicht und mit einer sehr geringen Anzahl von Fehlern ermitteln lässt.



Reis. 3 Ein Beispiel für ein Chromatogramm auf einem modernen Sequenzer mit der Sanger-Kettenabbruchmethode und einem leuchtenden Etikett.

Für viele Jahre wird die verbesserte Sanger-Methode die Hauptmethode der Massengenomsequenzierung werden und für viele Gesamtgenomprojekte verwendet werden, und Sanger wird 1980 eine zweite erhalten Nobelpreis in Chemie (er erhielt den ersten 1958 für das Lesen der Aminosäuresequenz des Insulinproteins - das erste gelesene Protein). Das erste vollständige Genom zellulärer Organismus wurde das Genom eines Bakteriums, das einige Formen von Lungenentzündung und Meningitis verursacht - haemophilus influenzae im Jahr 1995. Das Genom dieses Bakteriums war 1.830.137 Nukleotide lang. 1998 erscheint das erste Genom eines vielzelligen Tieres, eines Spulwurms Caenorhabditis elegans(Abb. 4 rechts), mit 98 Millionen Nukleotiden, und dann taucht im Jahr 2000 das erste Pflanzengenom auf - Arabidopsis thaliana(Abb. 4 links), Verwandte von Meerrettich und Senf. Das Genom dieser Pflanze ist 157 Millionen Nukleotide lang. Die Geschwindigkeit und der Umfang der Sequenzierung wuchsen mit erstaunlicher Geschwindigkeit, und die entstehenden Datenbanken mit Nukleotidsequenzen wurden immer schneller aufgefüllt.


Reis. vier Arabidopsis thaliana(links) und Caenorhabditis elegans(rechts).

Schließlich war das Säugetiergenom an der Reihe: das Maus- und das menschliche Genom. Als James Watson 1990 das Projekt zum vollständigen Lesen des menschlichen Genoms an den National Institutes of Health (NIH) in den USA leitete, standen viele Wissenschaftler dieser Idee skeptisch gegenüber. Ein solches Projekt erforderte eine kolossale Investition an Geld und Zeit und war gegeben begrenzte Möglichkeiten bestehenden Maschinen zum Lesen von Genomen, schien es vielen einfach nicht machbar. Andererseits versprach das Projekt revolutionäre Veränderungen in der Medizin und im Verständnis des Geräts. menschlicher Körper aber auch hier gab es Probleme. Tatsache ist, dass es zu diesem Zeitpunkt keine genaue Schätzung der Anzahl der Gene in einer Person gab. Viele glaubten, dass die Komplexität der Struktur des menschlichen Körpers auf das Vorhandensein von Hunderttausenden von Genen hinweist, und vielleicht mehrere Millionen, und daher wäre das Aussortieren einer solchen Anzahl von Genen, selbst wenn ihre Sequenz gelesen werden könnte, ein Problem unmögliche Aufgabe. Das Vorhandensein einer großen Anzahl von Genen führte dazu, dass viele den grundlegenden Unterschied zwischen Mensch und Tier vermuteten – eine Ansicht, die später durch das Humangenomprojekt widerlegt wurde.

Die eigentliche Idee, das menschliche Genom auszulesen, entstand 1986 auf Initiative des US-Energieministeriums, das das Projekt anschließend gemeinsam mit NIH finanzierte. Die Kosten des Projekts wurden auf 3 Milliarden Dollar geschätzt, und das Projekt selbst wurde unter Beteiligung einer Reihe von Ländern am Projekt für 15 Jahre konzipiert: China, Deutschland, Frankreich, Großbritannien und Japan. Um das menschliche Genom abzulesen, wurden die sogenannten „künstlichen Bakterienchromosomen“ (BAC – Bacterial Artificial Chromosome) verwendet. Bei diesem Ansatz wird das Genom in viele Stücke geschnitten, die etwa 150.000.000 Nukleotide lang sind. Diese Fragmente werden in künstliche Ringchromosomen eingefügt, die in Bakterien eingefügt werden. Mit Hilfe von Bakterien vermehren sich diese Chromosomen, und Wissenschaftler erhalten viele Kopien desselben Fragments des DNA-Moleküls. Jedes dieser Fragmente wird dann separat gelesen, und die gelesenen Teile von 150.000 Nukleotiden werden auf einer Chromosomenkarte aufgetragen. Diese Methode ermöglicht eine recht genaue Sequenzierung des Genoms, ist aber sehr zeitaufwändig.

Aber das Humangenomprojekt bewegte sich extrem langsam. Der Wissenschaftler Craig Venter und sein 1998 gegründetes Unternehmen Celera Genomics haben in der Geschichte der Genomik etwa die gleiche Rolle gespielt wie die Sowjetunion den Flug der Amerikaner zum Mond beeinflusst. Venter sagte, sein Unternehmen werde das Humangenomprojekt abschließen, bevor das Regierungsprojekt abgeschlossen sei. Das Projekt wird nur 300 Millionen Dollar erfordern, ein Bruchteil der Kosten des Regierungsprojekts neue Technologie Sequenzierung "Whole Genome Shotgun" - Lesen zufälliger kurzer Fragmente des Genoms. Als Francis Collins, der 1993 James Watson als Leiter des Human Genome Reading Project ablöste, von Venters Absichten erfuhr, war er schockiert. „ Wir machen das menschliche Genom, und Sie können eine Maus machen schlug Venter vor. Wissenschaftsgemeinschaft Ich war aufgeregt, und dafür gab es eine Reihe von Gründen. Erstens versprach Venter, sein Projekt 2001 für 4 Jahre abzuschließen vor dem Zeitplan für das Landesprojekt geplant. Zweitens wollte Celera Genomics aus dem Projekt Kapital schlagen, indem es eine absolute Datenbank erstellte, die von kommerziellen Pharmaunternehmen bezahlt werden würde.

Im Jahr 2000 bewies Celera die Wirksamkeit ihrer Sequenzierungsmethode, indem sie zusammen mit dem Labor des Genetikers Gerald Rubin das Genom der Drosophila-Fruchtfliege veröffentlichte (früher wurde das erste Genom eines Bakteriums mit der Schrotflinte des gesamten Genoms gelesen, aber nur wenige glaubten daran diese Methode war für große Genome geeignet). Es war dieser Kick von einem Handelsunternehmen, der die Entwicklung von Verbessertem und den Einsatz von Mehr anregte moderne Methoden Lesen von Genomen im Human Genome Project. Im Jahr 2001 wurde eine vorläufige Version des Genoms vom State Genomic Project und Celera veröffentlicht. Dann war es geschafft vorläufige Schätzung die Anzahl der Gene im menschlichen Genom, 30-40 Tausend. 2004 kam die endgültige Version des Genoms heraus, fast zwei Jahre früher als geplant. Im letzten Artikel wurde gesagt, dass die Anzahl der Gene in einer Person angeblich nur 20-25.000 beträgt. Diese Zahl ist vergleichbar mit anderen Tieren, insbesondere mit einem Wurm C.elegans.

Kaum jemand ahnte, dass die Anzahl der Gene, die die Arbeit unseres Körpers sicherstellen, so gering sein kann. Später wurden weitere Details bekannt: Das menschliche Genom hat eine Länge von etwa drei Milliarden Nukleotiden, die meisten Das Genom besteht aus nichtkodierenden Sequenzen, einschließlich aller Arten von Wiederholungen. Nur ein kleiner Teil des Genoms enthält tatsächlich Gene – DNA-Abschnitte, aus denen funktionsfähige RNA-Moleküle abgelesen werden. Interessante Tatsache dass mit zunehmendem Wissen über das menschliche Genom die Zahl der mutmaßlichen Gene nur abnahm: Viele potenzielle Gene erwiesen sich als Pseudogene (nicht funktionierende Gene), in anderen Fällen erwiesen sich mehrere Gene als Teil desselben Gens.

Weitere Sequenzierungsraten stiegen exponentiell an. Im Jahr 2005 wurde das Schimpansengenom veröffentlicht, das die erstaunliche Ähnlichkeit zwischen Affen und Menschen bestätigte, die von Zoologen der Vergangenheit beobachtet wurde. Bis 2008 waren die Genome von 32 Wirbeltieren vollständig gelesen worden, darunter Katzen, Hunde, Pferde, Makaken, Orang-Utans und Elefanten, 3 Deuterostom-Genome von wirbellosen Tieren, 15 Insektengenome, 7 Wurmgenome und Hunderte von Bakteriengenomen.

Schließlich näherte sich die Menschheit im Jahr 2007 der Möglichkeit, die Genome einzelner Menschen zu sequenzieren. Die erste Person, die das Ganze gelesen hat individuelles Genom, war Craig Venter (Abb. 4). Gleichzeitig wurde das Genom so ausgelesen, dass ein Vergleich der von beiden Eltern geerbten Venter-Chromosomen möglich war. So wurde festgestellt, dass es zwischen einem und einem anderen Chromosomensatz innerhalb einer Person etwa drei Millionen Nukleotidunterschiede von einem Buchstaben gibt, wobei die große Anzahl großer variierender Regionen nicht mitgezählt wird. Ein Jahr später wurde das vollständige diploide Genom von James Watson veröffentlicht (Abb. 5). Watsons Genom enthielt im Vergleich zum annotierten menschlichen Genom 3,3 Millionen Einzelbuchstaben-Ersetzungen, von denen mehr als 10.000 zu Veränderungen in den Proteinen führten, die für seine Gene kodieren. Watsons Genom kostete 1 Million Dollar, das heißt, der Preis für das Lesen von Genomen ist in 10 Jahren um mehr als das 3.000-fache gefallen, aber das ist nicht die Grenze. Heute stehen Wissenschaftler vor der Aufgabe „1 Genom – 1000 Dollar – 1 Tag“, und mit dem Aufkommen neuer Sequenzierungstechnologien scheint dies nicht mehr unmöglich zu sein. Der nächste Teil der "Geschichte" wird von ihnen erzählen.


Reis. 5 James Watson und Craig Venter sind die ersten Menschen, die individuell Genome gelesen haben.

  1. Watson J., Crick F.: Eine Struktur für Desoxyribose-Nukleinsäure. Nature 1953(171):737-738.
  2. Min Jou W, Haegeman G, Ysebaert M, Fiers W: Nucleotide sequence of the gene encoding für die Hüllprotein des Bakteriophagen MS2. Nature 1972, 237 (5350): 82-88.
  3. Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A et al: Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase Gen. Nature 1976, 260(5551):500-507.
  4. Gilbert W, Maxam A: Die Nukleotidsequenz des lac-Operators. Proc Natl Acad Sci USA 1973, 70(12):3581–3584.
  5. Maxam AM, Gilbert W: Eine neue Methode zur DNA-Sequenzierung. Proc Natl Acad Sci USA 1977, 74(2):560-564.
  6. Sanger F, Nicklen S, Coulson AR: DNA-Sequenzierung mit kettenabbrechenden Inhibitoren. Proc Natl Acad Sci USA 1977, 74(12):5463–5467.
  7. Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, Heiner C, Kent SB, Hood LE: Fluoreszenzdetektion in der automatisierten DNA-Sequenzanalyse. Nature 1986, 321(6071):674-679.
  8. Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM et al: Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science 1995, 269(5223):496-512.
  9. Genomsequenz des Fadenwurms C. elegans: eine Plattform zur Erforschung der Biologie. Wissenschaft 1998, 282(5396):2012-2018.
  10. Analyse der Genomsequenz der Blütenpflanze Arabidopsis thaliana. Nature 2000, 408(6814):796-815.
  11. Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, Scherer SE, Li PW, Hoskins RA, Galle RF et al: The genome sequence of Drosophila melanogaster. Wissenschaft 2000, 287(5461):2185-2195.
  12. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA et al: The sequence of the human genome. Wissenschaft 2001, 291(5507):1304-1351.
  13. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al: Initial sequencing and analysis of the human genome. Nature 2001, 409(6822):860-921.
  14. Fertigstellung der euchromatischen Sequenz des menschlichen Genoms. Natur 2004, 431(7011):931-945.
  15. Anfangssequenz des Schimpansengenoms und Vergleich mit dem menschlichen Genom. Natur 2005, 437(7055):69-87.
  16. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, Walenz BP, Axelrod N, Huang J, Kirkness EF, Denisov G et al: The diploid genome sequence of an individual human. PLoS Biol 2007, 5(10):e254.
  17. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT et al: Das vollständige Genom eines Individuums durch massiv parallele DNA-Sequenzierung. Natur 2008, 452(7189):872-876.
Teil 2 - hier