Synteettinen genomiikka: puolen askeleen päässä "elämän elementistä". Solupopulaatioista yksittäisiin soluihin

Genomiikka – koko genomin tutkimus

Viimeisimmät edistysaskeleet sekvensoinnissa ja kehityksessä teknisiä keinoja käsittelyä varten suuri numero Kloonit geenikirjastossa antoivat tutkijoille mahdollisuuden tutkia organismin koko genomia kerralla. Monien lajien täydelliset sekvenssit on nyt määritetty, mukaan lukien useimmat niin sanotut malligeneettiset organismit, kuten E. coli;pyöreämato Caenorhabditis elegans; ja tietysti klassinen genetiikan kohde, hedelmäkärpäs Drosophila melanogaster. 1990-luvulla käynnistettiin monista ongelmista ja erimielisyyksistä huolimatta hanke ihmisen genomin tutkimiseksi ("Human Genome"), jolle varoja myönsi mm. Kansallinen instituutti terveys. Helmikuussa 2001 iso ryhmä yksityisen Celera Genemix -laboratorion J. Craig Venterin johtamat tutkijat antoivat lausunnon ihmisen genomin alustavasta dekoodauksesta. Heidän työnsä tulos julkaistiin 16. helmikuuta 2001 Science-lehdessä.

Toinen versio, jonka toimitti International Human Genome Sequencing Consortiumin ryhmä, julkaistiin 13. helmikuuta 2001 Nature-lehdessä.

Genomiikan syntyä voidaan pitää 1900-luvun puolivälissä, jolloin geneetikot kartoittivat mallieliöiden kaikki kromosomit rekombinaatioiden tiheyden perusteella (ks. luku 8). Nämä kartat osoittivat kuitenkin vain ne geenit, joille tiedettiin mutanttialleelit, joten tällaisia ​​karttoja ei voida kutsua täydellisiksi. Täyden DNA-sekvensoinnin avulla voit paikantaa kaikki organismin geenit sekä määrittää niiden välisen emässekvenssin.

Genomiikka on jaettu rakenteelliseen ja toiminnalliseen. Rakennegenomiikka pyrkii selvittämään tarkalleen, missä tietyt geenit sijaitsevat kromosomaalisessa DNA:ssa. Tietokoneohjelmat tunnistavat geenien tyypilliset alun ja loput ja valitsevat ne sekvenssit, jotka todennäköisimmin ovat geenejä. Tällaisia ​​sekvenssejä kutsutaan avoin lukukehys (OFR). Sama tietokoneohjelmat voi myös tunnistaa tyypillisiä introneja OFR-sekvensseistä. Kun intronit on eristetty potentiaalisesta geenistä, tietokone käyttää jäljellä olevaa koodia proteiinin aminohapposekvenssin määrittämiseen. Sitten näitä potentiaalisia proteiineja verrataan niihin proteiineihin, joiden toiminnot ovat jo tiedossa ja joiden sekvenssit on jo syötetty tietokantaan. Tällaisten ohjelmien ansiosta ns Evoluutiokonservatismi: että useimmille geeneille eri organismeissa on samanlaisia ​​geenejä. Evoluutiokehityksen näkökulmasta tämä samankaltaisuus on ymmärrettävää: jos jonkin biologisen lajin proteiini on hyvin sopeutunut toimintoihinsa, niin sen geeni välittyy samassa muodossa tai pieniä muutoksia alkukirjaimesta johdettuihin lajeihin. Evoluutiokonservatismi mahdollistaa tiettyyn geeniin liittyvien geenien tunnistamisen muissa organismeissa. Vertaamalla saatua geeniä jo tunnettuihin geeniin on usein mahdollista määrittää sen toiminta, välttämättä tarkistaa se myöhemmissä kokeissa.

Kun kaikki mahdolliset geenit on tunnistettu, geneettinen kartoitus alkaa. Ihmisen geenikartta on melko hämmentävä ja kirjava kaavio, koska jokainen geeni on merkitty tietyllä värillä sen toiminnasta riippuen, mikä on vahvistettu verrattuna muihin tunnettuihin geeneihin. Useimmissa ihmisen geeneissä, kuten kaikkien eukaryoottien geeneissä yleensä, on suuret intronit. Karkeiden arvioiden mukaan julkaistuista sekvensseistä noin kolmannes tai neljäsosa on introneja. Kummallista kyllä, vain noin 1,5 % ihmisen koko genomista (noin 2,9 x 109 emäsparia) sisältää sekvenssejä (eksoneja), jotka koodaavat proteiineja. Lisäksi tämä DNA näyttää sisältävän vain 35 000-45 000 geeniä, mikä on ennustettua vähemmän. Meidän on vielä ymmärrettävä, kuinka suhteellisen pieni määrä geenejä koodaa niin monimutkaista organismia.

Toistuvan DNA:n kopioiden lukumäärä erilaiset ihmiset ei ole sama, joten niitä voidaan käyttää henkilöllisyyden toteamiseen, myös oikeuslääketieteessä.

toiminnallinen genomiikka on geenien toiminnan tutkimus koko genomin tasolla. Vaikka potentiaaliset geenit voidaan tunnistaa niiden samankaltaisuuden perusteella kuin geenit, jotka suorittavat tunnettuja toimintoja muissa organismeissa, kaikki arvaukset tulisi testata tutkittavaa organismia vastaan. Joissakin mallieliöissä, kuten ravintohiivassa, on mahdollista järjestelmällisesti sammuttaa geenien toiminta yksi kerrallaan. Geenin sammuttaminen tapahtuu korvaamalla sen toiminnallinen muoto poistetulla muodolla erityisessä vektorissa. Hanki sitten kanta, jossa on vammainen geeni, ja arvioi sen fenotyyppi. Meneillään olevassa ravintohiivan genomin analysointiohjelmassa useita tuhansia geenejä on sammutettu yksitellen.

Toinen toiminnallisen genomiikan menetelmä on se, että ne tutkivat transkription mekanismia koko genomin tasolla. Tämä menetelmä sillä oletuksella, että useimmat biologisia ilmiöitä edustaa monimutkaisia ​​prosesseja joihin liittyy monia geenejä. Erityisen kiinnostavia tutkijoita ovat organismin kehitykseen liittyvät prosessit, jotka mainitsimme luvussa. 11. Jos geenitranskriptiota tutkitaan vuonna erilaiset olosuhteet kasvua, niin saat käsityksen organismin täydellisistä geneettisistä kehityspoluista.

Mutta kuinka transkriptiota voidaan tutkia genomin laajuisella tasolla? Jälleen uudet teknologiat auttavat tutkijoita tässä. Jokaisen genomin geenin tai jonkin genomin osan DNA asetetaan pienten lasilevyjen pinnalle järjestykseen. Sitten ne altistetaan kaiken tyyppiselle mRNA:lle, joka löytyy solusta annettu organismi. Maljoilla oleva DNA saadaan kahdella tavalla. Yhdellä tavalla kaikki mRNA:t altistetaan käänteinen transkriptio saada lyhyitä komplementaarisia DNA-molekyylejä, jotka vastaavat yhtä geeniä. Toisella tavalla geenejä (tai geenien osia) syntetisoidaan emäs kerrallaan tietyillä levyjen alueilla. Synteesiä suorittavat robotit, jotka avaavat ja sulkevat lasipinnan tietyssä järjestyksessä. Tietueita monien organismien genomista voi ostaa kemian yrityksiltä.

Genomiikkaa kutsutaan yleensä yhdeksi haaraksi molekyylibiologia. Sen päätehtävänä on niin sanottu genomin sekvensointi - DNA:n ja RNA:n nukleotidisekvenssien tutkimus. Älä sekoita sanoja genetiikka ja genomiikka. Genetiikka käsittelee perinnöllisyyden ja vaihtelevuuden mekanismien tutkimusta, ja genomiikka on suunniteltu toteuttamaan saatua tietoa käytännössä.

Tieteen historiasta

Erityisalueena genomiikka muodostui vuosina 1980-1990, kun ensimmäiset genomien sekvensointiprojektit (molekyylianalyysit) syntyivät. tietyntyyppiset eläviä organismeja.

Genomiikan rakenne

Nykyaikaisessa genomiikassa on monia alajaksoja:

  • vertaileva tai evoluutiogenomiikka, se perustuu eri elävien organismien genomien järjestyksen ja sisällön vertailuun;
  • toiminnallinen genomiikka - tutkii yksityiskohtaisesti geenien toimintoja, niiden vaikutusta geenien toimintaan;
  • Rakennegenomiikka käsittelee sekvensointia, DNA:n molekyylianalyysiä, jonka perusteella luodaan genomikartat ja niitä voidaan verrata.

Miksi tarvitsemme genomiikkaa

Suuri määrä erilaisten (pääasiassa patogeenisten) mikro-organismien genomeja on purettu. Tämä mahdollistaa lääkekohdegeenien etsimisen täältä ja uusien lääkkeiden valmistamisen.

Genomiikka nähdään olennaisena, välttämättömänä osana yleinen biologia. Se pystyy antamaan merkittävän panoksen biotekniikan kehitykseen, Maatalous, terveydenhuolto.

Wisconsinin sairaalassa kolmivuotias taapero hämmentyi lääkäreitä pitkään. Tämän lapsen suolet olivat edematoottisia, ja ne olivat lähes kokonaan täynnä paiseita. Tämä lapsi oli selvinnyt yli sadasta leikkauksesta kolmivuotiaana. Vauvolle annettiin täydellinen sekvenssi hänen DNA:nsa koodaavista alueista, taudin syyllinen tunnistettiin - ohjelmoidun solukuoleman signaaliketjuihin osallistuvalla XIAP-proteiinilla on erittäin tärkeä rooli. tärkeä rooli immuunijärjestelmässä. Diagnoosin vuoksi fysiologit suosittelivat luuytimensiirtoa. Vauva pelastui.

Toinen tapaus koski epätyypillistä syöpää 39-vuotiaalla naisella, joka kärsi promyelosyyttisen leukemian akuutista muodosta. Tavallisia diagnostisia menetelmiä käytettäessä tautia ei voitu havaita. Mutta kun puretaan ja analysoidaan genomia syöpäsoluja oli mahdollista selvittää, että suuri osa viidennestätoista kromosomista siirtyi seitsemänteentoista, mikä aiheutti tietyn geenivuorovaikutuksen. Potilaalle määrättiin riittävä hoito.

Ensimmäinen luonnos, 2003 - hankkeen valmistuminen). Sen kehittäminen tuli mahdolliseksi paitsi biokemiallisten menetelmien parantamisen, myös tehokkaamman syntymisen ansiosta. tietokone Tiede mikä mahdollisti työskentelyn valtavien tietomäärien kanssa. Elävien organismien genomien pituus mitataan joskus miljardeissa emäspareissa. Esimerkiksi ihmisen genomi on noin 3 miljardia emäsparia. Suurin tunnetuista (vuoden 2010 alussa) genomeista kuuluu yhteen keuhkokalalajeista (noin 110 miljardia paria).

Genomiikan osat

Rakennegenomiikka

Rakennegenomiikka - genomisen tiedon sisältö ja organisointi. Sen tarkoituksena on tutkia geenejä, joiden rakenne tunnetaan, niiden toiminnan ymmärtämiseksi ja määrittämiseksi tilarakenne"avain"proteiinimolekyylien enimmäismäärä ja sen vaikutus vuorovaikutuksiin.

toiminnallinen genomiikka

Funktionaalinen genomiikka on genomiin tallennetun tiedon toteuttamista geenistä ominaisuuteen.

Vertaileva genomiikka

Vertaileva genomiikka (evoluutio) - vertailevat tutkimukset genomien sisällöstä ja organisaatiosta erilaisia ​​organismeja.

Täydellisten genomisekvenssien saaminen on tuonut valoa eri elävien organismien genomien välisten erojen asteeseen. Alla oleva taulukko esittää alustavat tiedot eri organismien genomien samankaltaisuudesta ihmisen genomin kanssa. Samankaltaisuus on annettu prosentteina (heijastaen niiden emäsparien osuutta, jotka ovat identtisiä kahdessa verratussa lajissa).

Näytä samankaltaisuus Muistiinpanot ja lähteet
Mies 99,9 % Ihmisen genomiprojekti
100 % identtiset kaksoset
Simpanssi 98,4 % Americans for Medical Progress;
98,7 % MSNBC:n lainaama Richard Mural Celera Genomicsista
Bonobo tai pygmy simpanssi Sama kuin simpansseilla.
Gorilla 98,38 % Perustuu geenien välistä ei-toistuvaa DNA:ta koskevaan tutkimukseen (American Journal of Human Genetics, helmikuu 2001, 682, s. 444-456)
Hiiri 98 %
85 % kun verrataan kaikkia proteiineja koodaavia sekvenssejä, NHGRI
Koira 95 % Jon Entine San Francisco Examinerissa
C.elegans 74 % Jon Entine San Francisco Examinerissa
Banaani 50 % Amerikkalaiset lääketieteen kehityksen puolesta
Narsissi 35 % Steven Rose The Guardianissa 22. tammikuuta

Esimerkkejä genomiikan soveltamisesta lääketieteessä

Wisconsinin sairaalassa kolmivuotias lapsi hämmentyi lääkäreitä pitkään, hänen suolensa olivat turvonneet ja täynnä paiseita. Kolmen vuoden ikään mennessä tämä lapsi oli kokenut yli sata erillistä leikkausta. Hänelle tilattiin täydellinen sekvenssi hänen DNA:nsa koodaavista alueista, tulosten mukaan improvisoitujen keinojen avulla taudin syyllinen tunnistettiin - ohjelmoidun solukuoleman signaaliketjuihin osallistuva XIAP-proteiini. klo normaali operaatio sillä on erittäin tärkeä rooli immuunijärjestelmässä. Tämän diagnoosin perusteella fysiologit suosittelivat luuytimensiirtoa kesäkuussa 2010. Kesäkuun puolivälissä lapsi pystyi jo syömään ensimmäistä kertaa elämässään.

Toinen tapaus liittyi epätyypilliseen tapaukseen syöpä 39-vuotiaalla naisella, joka kärsii akuutti muoto promyelosyyttinen leukemia. klo vakiomenetelmiä sairautta ei kuitenkaan tunnistettu. Mutta kun syöpäsolujen genomia purettiin ja analysoitiin, kävi ilmi, että suuri osa 15. kromosomista siirtyi 17. kromosomiin, mikä aiheutti tietyn geenivuorovaikutuksen. Tämän seurauksena nainen sai tarvitsemaansa hoitoa.

Huomautuksia

Katso myös

Linkit

  • Tishchenko P.D. Genomiikka: uudenlainen tiede uudessa kulttuuritilanteessa.
  • Täydelliset mikrobigenomit (bakteerien ja arkkien täysin dekoodatut genomit).

Wikimedia Foundation. 2010 .

Synonyymit:

Katso, mitä "genomiikka" on muissa sanakirjoissa:

    genomiikka- * genomiikka * genomiikka on uusi genetiikan suunta, genomitiede, mukaan lukien niiden rakenteen, toiminnan ja evoluution tutkiminen molekyylien, kromosomaalisten, biokemiallisten, fysiologiset tasot. Yksi rakenteellisen G:n tehtävistä on ... ... Genetiikka. tietosanakirja

    Olemassa., synonyymien määrä: 1 genetiikka (11) ASIS-synonyymisanakirja. V.N. Trishin. 2013... Synonyymien sanakirja

    genomiikka- Tiede, joka tutkii kaikkia geenejä ja niiden roolia kehon rakenteessa, kuten esim normaali kunto, ja sairauden sattuessa Biotekniikan aineet FI genomiikka … Teknisen kääntäjän käsikirja

    Genomiikka- erityisesti henkilön genomin lukeminen ja siihen liittyvä tieteellinen ja tekninen toiminta: ஐ On selvää, että oli helpompi keksiä rankaisematta erottaa teknologiabiologian suunnat, koska plagiointiin ja jopa parantamiseen vaadittiin ... .. . Lemin maailma - sanakirja ja opas

    genomiikka- Genomiikka Genomiikka Tutkimus koko geenijoukosta, jotka muodostavat organismin ... Selittävä englanti-venäläinen nanoteknologian sanakirja. - M.

    genomiikka- genomika statusas T ala kasviininkystė definis Nauja genetikos kryptis, kuri sisältää genomo individualių genų molekulių lygyje, geno sandaros, jo raiškos, aktyvumo säätömekanismi ir genų panaudojimo genų inžinerijos tikslams… … Maatalouden kasvivalinnan ja kasvitalouden terminų žodynas

    Genetiikan ala, joka tutkii genomin hajoamisen rakennetta ja toimintaa. eliöt biol.:n avulla, fyysinen. chem. ja tietokonemenetelmiäLuonnontiede. tietosanakirja

    genomiikka- geeniomiikka ja... Venäjän oikeinkirjoitussanakirja

    Genomiikka- genetiikan osa, jonka aiheena on genomien rakentamisen periaatteiden ja niiden rakenteiden tutkimus toimiva organisaatioPsykogenetiikan sanakirja

    Pyrkii kuvaamaan kunkin tietyn genomin koodaaman proteiinin kolmiulotteista rakennetta. Käytetään kokeellisten ja mallintavien lähestymistapojen yhdistelmää. Perimmäinen ero rakenteellisen genomiikan ja perinteisen rakenteellisen ... ... Wikipedia

Kirjat

  • Kliininen genetiikka. Perinnöllisen patologian genomiikka ja proteomiikka. Opetusohjelma. Vulture UMO klassisesta yliopistokoulutuksesta, Mutovin Gennady Romanovich. Kirjassa käsitellään kliinisen genetiikan keskeisiä säännöksiä ja käsitteitä ottaen huomioon kansainvälisen tieteellisen ohjelman "Human Genome" (1988-2005) tulokset. Historiaa, säännöksiä,…

1900-luvun lopulla molekyyliteknologiat kehittyivät niin intensiivisesti, että luotiin edellytykset genomien rakenteen systemaattiselle tutkimukselle. eri tyyppejä eläviä olentoja, mukaan lukien ihmiset. Yksi näiden hankkeiden merkittävimmistä tavoitteista on määrittää genomisen DNA:n täydellinen nukleotidisekvenssi. Näin syntyi uusi tiede - genomiikka.

Uuden vuosituhannen alkua leimasi genomiikan alan suurin löytö - ihmisen genomin rakenne selvitettiin. Uutinen osoittautui niin merkittäväksi, että siitä käytiin keskustelua maailman johtavien maiden presidenttien kesken. Tämä viesti ei kuitenkaan vaikuttanut moniin ihmisiin. Ensinnäkin tämä johtuu siitä, että ei ymmärretä, mitä genomi on, mikä on sen rakenne ja mitä sen dekoodaus tarkoittaa? Onko tällä uutisella mitään tekemistä lääketieteen kanssa ja voiko se vaikuttaa meihin jokaiseen? Mitä on molekyylilääketiede ja liittyykö sen kehittäminen genomin rakenteen purkamiseen? Lisäksi jotkut ihmiset pelkäävät sitä vielä kerran uusi tiedemiesten löytö ihmiskunnalle? Käytetäänkö näitä tietoja sotilaallisiin tarkoituksiin? Seuraako tätä yleinen pakollinen geneettinen tutkimus - eräänlainen väestön geneettinen passisointi? Onko genomimme analyysin kohteena ja kuinka luottamuksellisia saadut tiedot ovat? Kaikista näistä asioista keskustellaan tällä hetkellä aktiivisesti tiedeyhteisössä.

Genomiikka ei tietenkään alkanut ihmisistä, vaan paljon yksinkertaisemmista organisoiduista elävistä olennoista. Tällä hetkellä monien satojen mikro-organismilajien genomisen DNA:n nukleotidisekvenssi on purettu, ja useimmat niistä ovat patogeenisiä. Prokaryooteille analyysin täydellisyys osoittautui absoluuttiseksi, eli yksikään nukleotidi ei jää salaamatta! Tämän seurauksena ei vain tunnisteta näiden mikro-organismien kaikkia geenejä, vaan myös määritetään niiden koodaamien proteiinien aminohapposekvenssit. Olemme toistuvasti todenneet, että proteiinin aminohapposekvenssin tunteminen mahdollistaa sen rakenteen ja toiminnan melko tarkasti ennustamisen. Se avaa mahdollisuuden saada vasta-aineita tälle ennustavalle proteiinille, eristää se mikro-organismista ja suorittaa suoran biokemiallisen analyysin. Ajatellaanpa, mitä tämä tarkoittaa pohjimmiltaan uusien infektioiden torjuntamenetelmien kehittämiselle, jos lääkäri ei vain tiedä, kuinka tartunnan aiheuttavan mikro-organismin geenit on järjestetty, vaan myös mikä on kaikkien sen proteiinien rakenne ja toiminta? Mikrobiologia käy nyt läpi valtavia muutoksia, koska ilmaantuu valtava määrä uutta tietoa, jonka merkitystä emme tällä hetkellä täysin ymmärrä. Tämän korjaaminen vie todennäköisesti vuosikymmeniä uusi tieto ihmiskunnan tarpeisiin ensisijaisesti lääketieteen ja maatalouden alalla.

Siirtymiseen prokaryooteista eukaryooteihin genomin rakenteen tulkitsemisessa liittyy suuria vaikeuksia, eikä vain siksi, että korkeamman DNA:n pituus on tuhansia ja joskus satoja tuhansia kertoja pidempi, vaan sen rakenteesta tulee monimutkaisempi. Muista, että korkeampien eläinten genomissa esiintyy suuri määrä ei-koodaavaa DNA:ta, josta merkittävä osa on toistuvia sekvenssejä. Ne aiheuttavat merkittävää sekaannusta jo purettujen DNA-fragmenttien oikeaan telakointiin. Ja lisäksi itse tandemtoistoja on vaikea tulkita. Tällaisten toistojen lokalisoinnin alueella DNA:lla voi olla epätavallinen konfiguraatio, mikä tekee sen analysoinnista vaikeaa. Siksi yhden mikroskooppisen pyöreän madon (sukkulamadon) - ensimmäisen monisoluisen organismin, jonka DNA:n nukleotidisekvenssi oli mahdollista määrittää - genomissa on jo jäljellä useita epäselviä paikkoja. Totta, heidän tietty painovoima on alle prosentin sadasosa DNA:n kokonaispituudesta, eivätkä nämä epäselvyydet koske geenejä tai säätelyelementtejä. Tämän madon kaikkien 19 099 geenin nukleotidisekvenssit, jotka jakautuivat 97 miljoonan emäsparin alueelle, määritettiin täysin. Siksi työ sukkulamatojen genomin tulkitsemiseksi olisi tunnustettava erittäin onnistuneeksi.

Vielä suurempi menestys liittyy Drosophilan genomin purkamiseen, joka on vain 2 kertaa pienempi kuin ihmisen DNA ja 20 kertaa suurempi kuin sukkulamatojen DNA. Huolimatta Drosophilan korkeasta geneettisestä tiedosta, noin 10% sen geeneistä oli tuntemattomia siihen asti. Mutta paradoksaalisin on se tosiasia, että Drosophilassa, joka on paljon paremmin organisoitunut kuin sukkulamadot, osoittautui olevan vähemmän geenejä kuin mikroskooppisella sukkulamatolla! Sitä on vaikea selittää nykyajan biologisista kannoista. Enemmän geenejä kuin Drosophilassa on myös ristikukkaisten heimoon kuuluvan kasvin - Arabidopsiksen - dekoodatussa genomissa, jota geneetikot käyttävät laajasti klassisena koekohteena.

Genomiprojektien kehitystä seurasi monien tieteen ja teknologian alueiden intensiivinen kehitys. Joten voimakas sysäys sen kehittämiseen sai bioinformatiikka. Valtavien tietomäärien tallentamiseen ja käsittelyyn luotiin uusi matemaattinen laite; on suunniteltu ennennäkemättömän tehoisia supertietokonejärjestelmiä; On kirjoitettu tuhansia ohjelmia, joiden avulla on mahdollista suorittaa muutamassa minuutissa vertaileva analyysi erilaisista tietolohkoista, syöttää päivittäin maailman eri laboratorioissa saatua uutta tietoa tietokoneen tietokantoihin ja mukauttaa uutta tietoa siihen, mitä kertynyt aikaisemmin. Samalla kehitettiin järjestelmiä genomin eri elementtien tehokkaaseen eristämiseen ja automaattiseen sekvensointiin eli DNA-nukleotidisekvenssien määrittämiseen. Tältä pohjalta on suunniteltu tehokkaita robotteja, jotka nopeuttavat huomattavasti sekvensointia ja tekevät siitä halvempaa.

Genomiikan kehitys on puolestaan ​​johtanut valtavan määrän uusien tosiasioiden löytämiseen. Monien niistä merkitystä ei ole vielä arvioitava tulevaisuudessa. Mutta jo nyt on selvää, että nämä löydöt johtavat monien uudelleen ajattelemiseen teoreettisia kantoja eri elämänmuotojen alkuperästä ja kehityksestä maapallolla. Ne auttavat sinua ymmärtämään paremmin molekyylimekanismit yksittäisten solujen työn ja niiden vuorovaikutuksen taustalla; monien tähän asti tuntemattomien biokemiallisten syklien yksityiskohtainen purkaminen; analyysi niiden yhteydestä perusasioihin fysiologiset prosessit. Siten siirtyy rakenteellisesta genomiikasta toiminnalliseen genomiikkaan, mikä puolestaan ​​luo edellytyksiä tutkimukselle molekyyliemäkset solun ja koko organismin toimintaan. Jo kerättyä tietoa analysoidaan seuraavien vuosikymmenten aikana. Mutta jokainen seuraava askel kohti eri lajien genomien rakenteen purkamista synnyttää uusia teknologioita, jotka helpottavat tiedonhankintaprosessia. Näin ollen alempien elollisten olentojen geenien rakennetta ja toimintaa koskevien tietojen käyttö voi merkittävästi nopeuttaa korkeampien lajien tiettyjen geenien etsintää. Ja vielä nykyäänkin uusien geenien tunnistamiseen käytetyt tietokoneanalyysimenetelmät korvaavat usein melko työläitä molekyylimenetelmiä etsi geenejä.

Tärkein seuraus genomin rakenteen purkamisesta tietynlaista on mahdollisuus tunnistaa kaikki sen geenit ja vastaavasti tunnistaa ja määrittää transkriptoitujen RNA-molekyylien ja kaikkien sen proteiinien molekyylinen luonne. Analogisesti genomin kanssa käsitteet syntyivät transkriptio, joka yhdistää transkription tuloksena muodostuneen RNA-molekyylin poolin ja proteomi, joka sisältää monia geenien koodaamia proteiineja. Siten genomiikka luo pohjan uusien tieteiden intensiiviselle kehitykselle - proteomiikkaa ja transkriptomiikka. Proteomiikka käsittelee kunkin proteiinin rakenteen ja toiminnan tutkimusta; analyysi proteiinikoostumus solut; yksittäisen solun toiminnan molekyyliperustan määrittäminen, joka on monien satojen proteiinien koordinoidun työn tulos, ja organismin fenotyyppisen ominaisuuden muodostumisen tutkimus, joka on seurausta koordinoidusta työstä. miljardeja soluja. RNA-tasolla tapahtuu myös erittäin tärkeitä biologisia prosesseja. Niiden analyysi on transkriptomiikan aihe.

Monissa maailman maissa genomiikan parissa työskentelevien tutkijoiden suurimmat ponnistelut on suunnattu ratkaisemaan kansainvälinen hanke"Ihmisen genomi". Merkittävä edistys tällä alalla liittyy J.S. Venterin ehdottaman idean toteuttamiseen etsiä ja analysoida ilmentyneitä DNA-sekvenssejä, joita voidaan myöhemmin käyttää eräänlaisina "leimoina" tai markkereina tietyille genomin osille. Toisen itsenäisen ja yhtä hedelmällisen lähestymistavan omaksui Fr.:n johtaman ryhmän työ. Collins. Se perustuu ihmisen perinnöllisten sairauksien geenien ensisijaiseen tunnistamiseen.

Ihmisen genomin rakenteen selvittäminen johti sensaatiomaiseen löytöyn. Kävi ilmi, että ihmisen genomi sisältää vain 32 000 geeniä, mikä on useita kertoja vähemmän kuin proteiinien määrä. Samaan aikaan proteiinia koodaavia geenejä on vain 24 000, loput geenit ovat RNA-molekyylejä. DNA-nukleotidisekvenssien samankaltaisuusprosentti eri yksilöiden, etnisten ryhmien ja rotujen välillä on 99,9 %. Tämä samankaltaisuus tekee meistä ihmisiä - Homo sapiens! Kaikki vaihtelumme nukleotiditasolla mahtuu hyvin vaatimattomaan lukuun - 0,1 %. Siten genetiikka ei jätä tilaa ajatuksille kansallisesta tai rodullisesta paremmuudesta.

Mutta katsokaa toisianne - olemme kaikki erilaisia. Kansalliset ja varsinkin rodulliset erot ovat vieläkin havaittavissa. Kuinka monta mutaatiota määrää henkilön vaihtelevuuden ei prosentteina, vaan absoluuttisesti? Tämän arvion saamiseksi sinun on muistettava genomin koko. Ihmisen DNA-molekyylin pituus on 3,2 x 109 emäsparia. 0,1 % tästä on 3,2 miljoonaa nukleotidia. Mutta muista, että genomin koodaava osa vie alle 3 % DNA-molekyylin kokonaispituudesta, ja tämän alueen ulkopuolella olevilla mutaatioilla ei useimmiten ole mitään vaikutusta fenotyyppiseen vaihteluun. Siten saadaksesi kokonaisarvion fenotyyppiin vaikuttavien mutaatioiden lukumäärästä, sinun on otettava 3 % 3,2 miljoonasta nukleotidistä, mikä antaa meille luvun noin 100 000. Eli noin 100 tuhatta mutaatiota muodostaa fenotyyppisen vaihtelumme. Jos vertaamme tätä lukua kokonaismäärä geenejä, käy ilmi, että geeniä kohden on keskimäärin 3-4 mutaatiota.

Mitä nämä mutaatiot ovat? Suurin osa niistä (vähintään 70 %) määrittää yksilöllisen ei-patologisen vaihtelumme, mikä erottaa meidät, mutta ei tee meistä huonompia toisiimme nähden. Tämä sisältää sellaisia ​​ominaisuuksia kuin silmien väri, hiukset, iho, vartalotyyppi, pituus, paino, käyttäytymistyyppi, joka on myös suurelta osin geneettisesti määrätty, ja paljon muuta. Noin 5 % mutaatioista liittyy monogeenisiin sairauksiin. Noin neljännes jäljellä olevista mutaatioista kuuluu funktionaalisten polymorfismien luokkaan. Ne osallistuvat perinnöllisen alttiuden muodostumiseen laajalle levinneelle monitekijäiselle patologialle. Nämä arviot ovat tietysti melko karkeita, mutta niiden avulla voidaan arvioida ihmisen perinnöllisen vaihtelun rakennetta.



Tämä on osa 1 genomiikan historiaa, nimeltään "Genomic Projects". Tässä osassa yritän puhua kansanomaisesti siitä, kuinka ensimmäiset menetelmät geneettisten sekvenssien lukemiseen ilmestyivät, mistä ne koostuivat ja kuinka genomiikka siirtyi yksittäisten geenien lukemisesta kokonaisten genomien lukemiseen, mukaan lukien kokonaiset genomit. tietyt ihmiset.

Pian Watsonin ja Crickin löytämisen jälkeen (kuva 1) syntyi genomiikan tiede. Genomiikka on organismien genomien tutkimista koskeva tiede, johon kuuluu täydellisten DNA-sekvenssien intensiivinen lukeminen (sekvensointi) ja niiden kartoittaminen geneettisiksi kartoiksi. Tämä tiede käsittelee myös geenien ja geenien alleelien välisiä vuorovaikutuksia ja niiden monimuotoisuutta, evoluutiomalleja ja genomien rakennetta. Tämän alueen kehitys on ollut niin nopeaa, että aivan viime aikoina tekstieditorit pitävät siitä Microsoft Word eivät tunteneet sanaa "genomi" ja yrittivät korjata sen sanaksi "kääpiö".

Riisi. yksiJames Watson (vasemmalla) ja Francis Crick (oikealla) - tutkijat, jotka löysivät DNA:n kaksoiskierteen

Ensimmäinen luettu geeni oli bakteriofagin MS2 kuorigeeni, jota tutkittiin Walter Fyersin laboratoriossa vuonna 1972. Vuonna 1976 tunnettiin myös muita bakteriofagigeenejä - sen replikaasi, geeni, joka vastaa viruspartikkelien lisääntymisestä. Lyhyet RNA-molekyylit olivat jo suhteellisen helposti luettavissa, mutta suuret DNA-molekyylit eivät vielä pystyneet lukemaan kunnolla. Esimerkiksi Walter Gilbertin ja Allen Maxamin vuonna 1973 hankkimaa laktoosioperonigeenisekvenssin 24-kirjaimista sekvenssiä pidettiin merkittävänä tieteen läpimurtona. Tässä on järjestys:

5" – TGGAATTGTGAGCGGATAACAATT 3"
3"—ACCTTAACACTCGCCTATTGTTAA 5"

Ensimmäiset DNA-lukutekniikat olivat erittäin tehottomia ja käyttivät radioaktiivisia leimoja DNA:lle ja kemiallisia menetelmiä erottamaan nukleotidit toisistaan. Voidaan esimerkiksi ottaa entsyymejä, jotka leikkaavat nukleotidisekvenssin eri todennäköisyyksillä jälkeenpäin erilaisia ​​kirjaimia. DNA-molekyyli koostuu 4 kirjaimesta (nukleotidistä) A, T, G ja C, jotka ovat osa kaksinkertaista anti-rinnakkaista (kaksi juostetta on suunnattu vastakkaiset puolet) spiraaleja. Tämän kierteen sisällä nukleotidit ovat vastakkain komplementaarisuussäännön mukaisesti: vastapäätä A toisessa ketjussa on T, vastapäätä G on C ja päinvastoin.

Gilbert ja Maxam käyttivät 4 tyyppistä entsyymiä. Yksi leikkaus A:n tai G:n jälkeen, mutta parempi A:n jälkeen (A>G), toinen leikkaus paremmin G:n jälkeen (G>A), kolmas C:n jälkeen ja neljäs C:n tai T:n jälkeen (C+T). Reaktio suoritettiin 4 koeputkessa kullakin entsyymityypillä, ja sitten tuotteet asetettiin geelille. DNA on varautunut molekyyli ja kun virta kytketään päälle, se kulkee miinuksesta plussaan. Pienemmät molekyylit juoksevat nopeammin, joten leikatut DNA-molekyylit asettuvat pituudeltaan riviin. Tarkasteltaessa geelin 4 kaistaa voisi päätellä, missä järjestyksessä nukleotidit sijaitsevat.

Läpimurto DNA-sekvensoinnin alalla tapahtui, kun englantilainen biokemisti Frederick Sanger ehdotti vuonna 1975 niin sanottua "säikeen lopetusmenetelmää" DNA-sekvenssien lukemiseen. Mutta ennen kuin puhumme tästä menetelmästä, on tarpeen esitellä uusien DNA-molekyylien synteesin aikana tapahtuvat prosessit. DNA-synteesiä varten tarvitaan entsyymi - DNA-riippuvainen DNA-polymeraasi, joka pystyy saattamaan loppuun yksijuosteisen DNA-molekyylin rakentamisen kaksijuosteiseksi. Tätä varten entsyymi tarvitsee "siemenen" - alukkeen, lyhyen DNA-sekvenssin, joka voi sitoutua pitkään yksijuosteiseen molekyyliin, jonka haluamme rakentaa kaksijuosteiseksi. Itse nukleotideja tarvitaan myös nukleotiditrifosfaattien muodossa ja tietyissä olosuhteissa, kuten tietty magnesiumionipitoisuus väliaineessa ja tietty lämpötila. Synteesi kulkee aina yhteen suuntaan päästä nimeltä 5' päähän nimeltä 3'. Tietenkin DNA:n lukemiseen tarvitaan suuri määrä matriisia - toisin sanoen kopioita luettavasta DNA:sta.

Vuonna 1975 Sanger keksi seuraavan. Hän otti erityisiä (päättäviä) nukleotideja, jotka liittyessään DNA-molekyylin kasvavaan ketjuun häiritsivät seuraavien nukleotidien kiinnittymistä, eli ne "katkaisivat" ketjun. Sitten hän otti 4 koeputkea, joihin jokaiseen hän lisäsi kaikki 4 nukleotidityyppiä ja yhden tyypin lopettavia nukleotideja pienessä määrin. Siten koeputkessa, jossa päättävä nukleotidi "A" sijaitsi, jokaisen uuden DNA-molekyylin synteesi saattoi katketa ​​missä tahansa paikassa, jossa "A" olisi pitänyt seisoa, koeputkessa, jossa pääte "G" - missä tahansa G:n pitäisi seisoa ja niin edelleen. Geeliin laitettiin 4 kaistaa 4 putkesta (kuva 2) ja taas lyhyimmät molekyylit "juoksivat" eteenpäin ja pisin jäi alkuun ja vyöhykkeiden eroista oli mahdollista päätellä, mikä nukleotidi seuraa kumpaa. Juovien näkemiseksi yksi neljästä nukleotidistä (A, T, G tai C) leimattiin muuttamatta kemiallisia ominaisuuksia käyttämällä radioaktiiviset isotoopit.

Riisi. 2Sangerin menetelmä. Näytössä on kolme neljän kappaleen sarjaa.

Tällä menetelmällä luettiin ensimmäinen DNA-pohjainen genomi, 5,386 nukleotidin pituinen bakteriofagin ϕX174 genomi (aiemmin luettu MS2-faagigenomi oli RNA-pohjainen ja sen genomi oli 3,569 nukleotidia pitkä).

Sangerin menetelmää parannettiin merkittävästi Leroy Hoodin laboratoriossa, jossa vuonna 1985 radioaktiivinen leima korvattiin valovoimaisella, fluoresoivalla leimalla. Tämä mahdollisti ensimmäisen automaattisen sekvensserin luomisen: jokainen DNA-molekyyli oli nyt värillinen eri väriä riippuen siitä, mikä oli viimeinen kirjain (värileimattu nukleotidi, joka päätti ketjun). Fragmentit erotettiin koon mukaan geelillä, ja kone luki automaattisesti saapuvien vyöhykkeiden luminesenssispektrin ja tulostaa tulokset tietokoneelle. Tämän menettelyn tuloksena saadaan kromatogrammi (kuvio 2), josta on helppo muodostaa jopa 1000 kirjainta pitkä DNA-sekvenssi erittäin pienellä virhemäärällä.



Riisi. 3 Esimerkki kromatogrammista nykyaikaisella sekvensserillä, jossa on käytetty Sanger-ketjun lopetusmenetelmää ja hehkuvaa etikettiä.

Parannetusta Sanger-menetelmästä tulee monen vuoden ajan massagenomin sekvensoinnin päämenetelmä ja sitä käytetään monissa koko genomiprojekteissa, ja Sanger vuonna 1980 saa toisen Nobel palkinto kemiassa (hän ​​sai ensimmäisen jo vuonna 1958 insuliiniproteiinin aminohapposekvenssin lukemisesta - ensimmäinen proteiini luettu). Ensimmäinen täydellinen genomi soluorganismi siitä tuli bakteerin genomi, joka aiheuttaa joitakin keuhkokuumeen ja aivokalvontulehduksen muotoja - haemophilus influenzae vuonna 1995. Tämän bakteerin genomi oli 1 830 137 nukleotidia pitkä. Vuonna 1998 ilmestyy ensimmäinen monisoluisen eläimen, pyöreän madon, genomi Caenorhabditis elegans(Kuva 4 oikealla), 98 miljoonalla nukleotidilla, ja sitten vuonna 2000 ilmestyy ensimmäinen kasvigenomi - Arabidopsis thaliana(kuva 4 vasemmalla), piparjuuren ja sinapin sukulaisia. Tämän kasvin genomi on 157 miljoonaa nukleotidia pitkä. Sekvensoinnin nopeus ja laajuus kasvoivat hämmästyttävää vauhtia, ja esiin nousevat nukleotidisekvenssien tietokannat täydentyivät yhä nopeammin.


Riisi. 4 Arabidopsis thaliana(vasemmalla) ja Caenorhabditis elegans(oikealla).

Lopulta oli vuorossa nisäkäsgenomi: hiiren ja ihmisen genomit. Kun James Watson johti vuonna 1990 koko ihmisen genomin lukuprojektia National Institutes of Healthissa (NIH) Yhdysvalloissa, monet tutkijat suhtautuivat ajatukseen skeptisesti. Tällainen projekti vaati valtavan rahan ja ajan investoinnin ja sen vuoksi rajalliset mahdollisuudet olemassa olevia genomien lukukoneita, se tuntui monista mahdottomalta. Toisaalta projekti lupasi vallankumouksellisia muutoksia lääketieteessä ja laitteen ymmärtämisessä. ihmiskehon mutta ongelmia oli täälläkin. Tosiasia on, että sillä hetkellä ei ollut tarkkaa arviota geenien määrästä henkilössä. Monet uskoivat, että ihmiskehon rakenteen monimutkaisuus viittaa satojen tuhansien ja ehkä useiden miljoonien geenien olemassaoloon, ja siksi tällaisen geenimäärän selvittäminen, vaikka niiden sekvenssi voitaisiin lukea, olisi vaikeaa. mahdoton tehtävä. Juuri suuren määrän geenejä läsnä ollessa monet olettivat perustavanlaatuisen eron ihmisen ja muiden eläinten välillä - näkemyksen, joka myöhemmin kumosi ihmisen genomiprojektissa.

Ajatus ihmisen genomin lukemisesta syntyi vuonna 1986 Yhdysvaltain energiaministeriön aloitteesta, joka myöhemmin rahoitti projektia yhdessä NIH:n kanssa. Hankkeen kustannuksiksi arvioitiin 3 miljardia dollaria, ja itse hanke suunniteltiin 15 vuodeksi useiden maiden osallistuessa hankkeeseen: Kiina, Saksa, Ranska, Iso-Britannia ja Japani. Ihmisen genomin lukemiseen käytettiin niin sanottuja "keinotekoisia bakteerikromosomeja" (BAC - bakteerin keinotekoinen kromosomi). Tässä lähestymistavassa genomi leikataan useiksi paloiksi, noin 150 000 tuhannen nukleotidin pituisiksi. Nämä fragmentit lisätään keinotekoisiin rengaskromosomeihin, jotka liitetään bakteereihin. Bakteerien avulla nämä kromosomit lisääntyvät, ja tutkijat saavat useita kopioita samasta DNA-molekyylin fragmentista. Jokainen tällainen fragmentti luetaan sitten erikseen ja luetut 150 000 nukleotidin palat piirretään kromosomikartalle. Tämä menetelmä mahdollistaa melko tarkan genomin sekvensoinnin, mutta se on hyvin aikaa vievää.

Mutta ihmisen genomiprojekti eteni erittäin paljon hitaasti. Tiedemies Craig Venter ja hänen vuonna 1998 perustettu yritys Celera Genomics ovat näytelleet genomiikan historiassa suunnilleen samaa roolia kuin Neuvostoliitto vaikutti amerikkalaisten lentoon kuuhun. Venter sanoi, että hänen yrityksensä saattaisi ihmisen genomiprojektin päätökseen ennen kuin hallitusprojekti valmistuu. Hanke vaatii vain 300 miljoonaa dollaria, murto-osan valtion hankkeen kustannuksista uusi teknologia"koko genomin haulikko" sekvensointi - genomin satunnaisten lyhyiden fragmenttien lukeminen. Kun Francis Collins, joka korvasi James Watsonin Human Genome Reading Projectin johtajana vuonna 1993, sai tietää Venterin aikeista, hän oli järkyttynyt. " Teemme ihmisen genomin, ja sinä voit tehdä hiiren Venter ehdotti. Tiedeyhteisö Olin innoissani, ja siihen oli useita syitä. Ensinnäkin Venter lupasi saada projektinsa valmiiksi vuonna 2001, neljäksi vuodeksi edellä aikaansa suunniteltu valtion hankkeeseen. Toiseksi Celera Genomics aikoi hyödyntää hanketta luomalla absoluuttisen tietokannan, jonka kaupalliset lääkeyhtiöt maksaisivat.

Vuonna 2000 Celera osoitti sekvensointimenetelmänsä tehokkuuden julkaisemalla Drosophila-hedelmäkärpäsen genomin yhdessä geneetikko Gerald Rubinin laboratorion kanssa (aiemmin koko genomin haulikkoa käytettiin bakteerin ensimmäisen genomin lukemiseen, mutta harvat uskoivat, että tämä menetelmä soveltui suurille genomeille). Juuri tämä kaupallisen yrityksen potku kannusti kehittämään parannettua ja käyttämään enemmän nykyaikaisia ​​menetelmiä genomien lukeminen Human Genome Projectissa. Vuonna 2001 valtion genomiprojekti ja Celera julkaisivat alustavan version genomista. Sitten tehtiin alustava arvio geenien määrä ihmisen genomissa, 30-40 tuhatta. Vuonna 2004 genomin lopullinen versio julkaistiin, lähes kaksi vuotta etuajassa. Edellisessä artikkelissa sanottiin, että geenien määrä ihmisessä on oletettavasti vain 20-25 tuhatta. Tämä luku on verrattavissa muihin eläimiin, erityisesti matoon C.elegans.

Melkein kukaan ei arvannut, että kehomme toiminnan varmistavien geenien määrä voi olla niin pieni. Myöhemmin tunnettiin muita yksityiskohtia: ihmisen genomin pituus on noin kolme miljardia nukleotidia, suurin osa Genomi koostuu ei-koodaavista sekvensseistä, mukaan lukien kaikenlaiset toistot. Vain pieni osa genomista sisältää todella geenejä - DNA:n osia, joista luetaan toiminnalliset RNA-molekyylit. Mielenkiintoinen fakta että kun tietämys ihmisen genomista lisääntyi, oletettujen geenien määrä vain väheni: monet potentiaaliset geenit osoittautuivat pseudogeeneiksi (ei-toimiviksi geeneiksi), muissa tapauksissa useat geenit osoittautuivat osaksi samaa geeniä.

Sekvensointinopeudet lisääntyivät eksponentiaalisesti. Vuonna 2005 julkaistiin simpanssin genomi, joka vahvisti apinoiden ja ihmisten hämmästyttävän samankaltaisuuden, jonka menneisyyden eläintieteilijät näkivät. Vuoteen 2008 mennessä 32 selkärankaisen genomit oli luettu kokonaan, mukaan lukien kissan, koiran, hevosen, makakin, orangutanin ja norsun, 3 selkärangattomien deuterostomin genomia, 15 hyönteisgenomia, 7 madon genomia ja satoja bakteerigenomeja.

Lopulta vuonna 2007 ihmiskunta lähestyi mahdollisuutta sekvensoida yksittäisten ihmisten genomit. Ensimmäinen henkilö, joka lukee koko tekstin yksilöllinen genomi, oli Craig Venter (kuva 4). Samalla genomi luettiin siten, että oli mahdollista verrata Venterin molemmilta vanhemmilta perittyjä kromosomeja. Siten havaittiin, että yhden ihmisen kromosomijoukon välillä on noin kolme miljoonaa yhden kirjaimen nukleotidieroa, kun ei oteta huomioon suurta määrää suuria vaihtelevia alueita. Vuotta myöhemmin James Watsonin täydellinen diploidigenomi julkaistiin (kuva 5). Watsonin genomi sisälsi 3,3 miljoonaa yksikirjaimista substituutiota annotoituun ihmisen genomiin verrattuna, joista yli 10 000 johti muutoksiin hänen geenejä koodaavissa proteiineissa. Watsonin genomi maksoi miljoona dollaria, eli genomien lukemisen hinta on laskenut yli 3000 kertaa 10 vuodessa, mutta tämä ei ole rajana. Nykyään tutkijoiden edessä on tehtävä "1 genomi - 1 000 dollaria - 1 päivä", eikä se enää näytä mahdottomalta uusien sekvensointitekniikoiden myötä. "Tarinan" seuraava osa kertoo heistä.


Riisi. 5 James Watson ja Craig Venter ovat ensimmäiset ihmiset, jotka ovat lukeneet yksilöllisesti genomit.

  1. Watson J, Crick F: Deoksiriboosin nukleiinihapon rakenne. Nature 1953(171):737-738.
  2. Min Jou W, Haegeman G, Ysebaert M, Fiers W: Koodaavan geenin nukleotidisekvenssi varten bakteriofagin MS2 vaippaproteiini. Nature 1972, 237(5350):82-88.
  3. Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A et al: Bakteriofagin MS2 RNA:n täydellinen nukleotidisekvenssi: replikaasin primääri- ja sekundaarinen rakenne geeni. Nature 1976, 260(5551):500-507.
  4. Gilbert W, Maxam A: lac-operaattorin nukleotidisekvenssi. Proc Natl Acad Sci USA 1973, 70(12):3581-3584.
  5. Maxam AM, Gilbert W: Uusi menetelmä DNA-sekvensointiin. Proc Natl Acad Sci USA 1977, 74(2):560-564.
  6. Sanger F, Nicklen S, Coulson AR: DNA-sekvensointi ketjun päättävien estäjien kanssa. Proc Natl Acad Sci USA 1977, 74(12):5463-5467.
  7. Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, Heiner C, Kent SB, Hood LE: Fluoresenssin havaitseminen automatisoidussa DNA-sekvenssianalyysissä. Nature 1986, 321(6071):674-679.
  8. Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM et ai.: Haemophilus influenzae Rd:n koko genomin satunnaissekvensointi ja kokoonpano. Science 1995, 269(5223):496-512.
  9. Sukkulamato C. elegansin genomisekvenssi: alusta biologian tutkimiseen. Science 1998, 282(5396):2012-2018.
  10. Kukkivan Arabidopsis thaliana -kasvin genomisekvenssin analyysi. Nature 2000, 408(6814):796-815.
  11. Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, Scherer SE, Li PW, Hoskins RA, Galle RF et ai.: Drosophila melanogasterin genomisekvenssi. Science 2000, 287(5461):2185-2195.
  12. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA et ai.: Ihmisen genomin sekvenssi. Science 2001, 291(5507):1304-1351.
  13. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et ai.: Ihmisen genomin alkusekvensointi ja analyysi. Nature 2001, 409(6822):860-921.
  14. Ihmisen genomin eukromaattisen sekvenssin viimeistely. Nature 2004, 431 (7011): 931-945.
  15. Simpanssin genomin alkusekvenssi ja vertailu ihmisen genomiin. Nature 2005, 437(7055):69-87.
  16. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, Walenz BP, Axelrod N, Huang J, Kirkness EF, Denisov G et ai.: Yksittäisen ihmisen diploidi genomisekvenssi. PLoS Biol 2007, 5(10):e254.
  17. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT et ai.: Yksilön täydellinen genomi massiivisesti rinnakkaisella DNA-sekvensoinnilla. Nature 2008, 452(7189):872-876.
Osa 2 - tästä