Sintetikong genomics: kalahating hakbang ang layo mula sa “elemento ng buhay. Mula sa mga populasyon ng cell hanggang sa mga indibidwal na selula

Genomics - ang pag-aaral ng buong genome

Pinakabagong pag-unlad sa pagkakasunud-sunod at pag-unlad teknikal na paraan para sa pagpoproseso isang malaking bilang Ang mga clone sa gene library ay nagpapahintulot sa mga siyentipiko na pag-aralan ang buong genome ng isang organismo nang sabay-sabay. Ang kumpletong pagkakasunud-sunod ng maraming mga species ay natukoy na ngayon, kabilang ang karamihan sa mga tinatawag na modelo ng mga genetic na organismo tulad ng E. coli;roundworm Caenorhabditis elegans; at, siyempre, ang klasikong bagay ng genetika, ang langaw ng prutas Drosophila melanogaster. Noong 1990s, sa kabila ng maraming problema at hindi pagkakasundo, isang proyekto ang inilunsad upang pag-aralan ang genome ng tao (“Human Genome”), kung saan ang mga pondo ay inilalaan ng National Institute kalusugan. Noong Pebrero 2001 malaking grupo Ang mga mananaliksik na pinamumunuan ni J. Craig Venter ng pribadong laboratoryo na Celera Genomics ay gumawa ng pahayag tungkol sa paunang pag-decode ng genome ng tao. Ang resulta ng kanilang trabaho ay nai-publish noong Pebrero 16, 2001 sa journal Science.

Ang isa pang bersyon, na isinumite ng isang grupo mula sa International Human Genome Sequencing Consortium, ay inilathala noong Pebrero 13, 2001 sa journal Nature.

Ang pagsilang ng genomics ay maaaring ituring sa kalagitnaan ng ika-20 siglo, nang ang mga geneticist ay nagmapa ng lahat ng chromosome ng mga modelong organismo batay sa dalas ng mga recombinations (tingnan ang Kabanata 8). Gayunpaman, ang mga mapa na ito ay nagpakita lamang ng mga gene kung saan kilala ang mga mutant alleles, at samakatuwid ang mga naturang mapa ay hindi matatawag na kumpleto. Binibigyang-daan ka ng buong DNA sequencing na mahanap ang lahat ng mga gene ng isang organismo, pati na rin itatag ang pagkakasunud-sunod ng mga base sa pagitan ng mga ito.

Ang genomics ay nahahati sa istruktura at functional. Nilalayon ng structural genomics na alamin kung saan eksakto ang ilang mga gene sa chromosomal DNA. Kinikilala ng mga computer program ang karaniwang simula at pagtatapos ng mga gene, pinipili ang mga sequence na malamang na mga gene. Ang ganitong mga pagkakasunud-sunod ay tinatawag bukas na reading frame (OFR). Pareho programa ng Computer maaari ding makilala ang mga tipikal na intron sa mga OFR sequence. Matapos ihiwalay ang mga intron sa potensyal na gene, ginagamit ng computer ang natitirang code upang matukoy ang pagkakasunud-sunod ng mga amino acid sa protina. Pagkatapos ang mga potensyal na protinang ito ay inihahambing sa mga protina na ang mga function ay kilala na at ang mga pagkakasunud-sunod ay naipasok na sa database. Salamat sa ganitong uri ng mga programa, ang tinatawag na evolutionary conservatism: na para sa karamihan ng mga gene sa iba't ibang organismo ay may magkatulad na mga gene. Mula sa pananaw ng ebolusyonaryong pag-unlad, ang pagkakatulad na ito ay naiintindihan: kung ang isang protina ng isang biological species ay mahusay na inangkop para sa mga pag-andar nito, kung gayon ang gene nito ay ipinadala sa parehong anyo o may maliliit na pagbabago sa mga species na nagmula sa inisyal. Ang evolutionary conservatism ay nagpapahintulot sa pagkilala sa mga gene na nauugnay sa isang naibigay na gene sa ibang mga organismo. Sa pamamagitan ng paghahambing ng nagresultang gene sa mga kilala na, kadalasan ay posible na matukoy ang pag-andar nito, kinakailangang suriin ito sa mga susunod na eksperimento.

Kapag natukoy na ang lahat ng potensyal na gene, magsisimula ang genetic mapping. Ang genetic map ng tao ay medyo nakakalito at motley diagram, dahil ang bawat gene ay minarkahan ng isang tiyak na kulay depende sa function nito, na itinatag kung ihahambing sa iba pang mga kilalang gene. Karamihan sa mga gene ng tao, tulad ng mga gene ng lahat ng eukaryotes sa pangkalahatan, ay may malalaking intron. Ayon sa magaspang na mga pagtatantya, kabilang sa mga nai-publish na pagkakasunud-sunod, humigit-kumulang isang ikatlo o isang quarter ang mga intron. Nakapagtataka, halos 1.5% lamang ng buong genome ng tao (mga 2.9 x 10 9 na pares ng base) ang naglalaman ng mga sequence (exon) na nagko-code para sa mga protina. Gayundin, ang DNA na ito ay tila naglalaman lamang ng 35,000-45,000 na mga gene, na mas mababa kaysa sa hinulaang. Hindi pa namin nauunawaan kung paano ang isang medyo maliit na bilang ng mga gene ay nag-code para sa isang kumplikadong organismo.

Bilang ng mga kopya ng paulit-ulit na DNA iba't ibang tao ay hindi pareho, kaya magagamit ang mga ito upang maitatag ang pagkakakilanlan, kabilang ang sa forensic medicine.

functional genomics ay ang pag-aaral ng gene function sa antas ng buong genome. Bagama't maaaring makilala ang mga potensyal na gene sa pamamagitan ng kanilang pagkakapareho sa mga gene na gumaganap ng mga kilalang function sa ibang mga organismo, ang lahat ng hula ay dapat na masuri laban sa organismo na pinag-aaralan. Sa ilang mga modelong organismo, tulad ng nutritional yeast, posible na sistematikong patayin ang pag-andar ng mga gene nang paisa-isa. Pinapatay ang gene nangyayari sa pamamagitan ng pagpapalit ng functional form nito ng nabura na form sa isang espesyal na vector. Pagkatapos ay kumuha ng strain na may kapansanan na gene at suriin ang phenotype nito. Sa isang patuloy na programa upang pag-aralan ang nutritional yeast genome, ilang libong mga gene ang isa-isang pinatay.

Ang isa pang paraan ng functional genomics ay ang pag-aaral nila ng mekanismo ng transkripsyon sa antas ng buong genome. Ang pamamaraang ito batay sa palagay na karamihan biological phenomena kumatawan kumplikadong proseso kinasasangkutan ng maraming gene. Ang partikular na interes ng mga mananaliksik ay ang mga proseso na nauugnay sa pag-unlad ng organismo, na binanggit namin sa Chap. 11. Kung pinag-aaralan ang gene transcription sa iba't ibang kondisyon paglago, pagkatapos ay makakakuha ka ng ideya ng kumpletong genetic pathway ng pag-unlad ng organismo.

Ngunit paano mapag-aaralan ang transkripsyon sa antas ng genome-wide? Muli, nakakatulong ang mga bagong teknolohiya sa mga siyentipiko dito. Ang DNA ng bawat gene sa genome o ilang bahagi ng genome ay inilalagay sa ibabaw ng maliliit na glass plate na nakaayos sa pagkakasunud-sunod. Pagkatapos ay nalantad sila sa lahat ng uri ng mRNA na matatagpuan sa cell ibinigay na organismo. Ang DNA sa mga plato ay nakuha sa dalawang paraan. Sa isang paraan, ang lahat ng mRNA ay napapailalim sa baligtad na transkripsyon upang makakuha ng mga maiikling komplementaryong molekula ng DNA na tumutugma sa isang gene. Sa ibang paraan, ang mga gene (o mga bahagi ng mga gene) ay na-synthesize ng isang base sa isang pagkakataon sa ilang bahagi ng mga plate. Ang synthesis ay isinasagawa ng mga robot na nagbubukas at nagsasara ng ibabaw ng salamin sa isang tiyak na pagkakasunud-sunod. Ang mga rekord na may genome ng maraming organismo ay maaaring mabili mula sa mga kumpanya ng kemikal.

Ang genomics ay karaniwang tinatawag na isa sa mga sangay molecular biology. Ang pangunahing gawain nito ay nakasalalay sa tinatawag na genome sequencing - ang pag-aaral ng mga nucleotide sequence ng DNA at RNA. Huwag malito ang mga salitang genetics at genomics. Ang genetika ay tumatalakay sa pag-aaral ng mga mekanismo ng pagmamana at pagkakaiba-iba, at ang genomics ay idinisenyo upang isabuhay ang kaalamang natamo.

Mula sa kasaysayan ng agham

Bilang isang espesyal na lugar, nabuo ang genomics noong 1980-1990 kasama ang paglitaw ng mga unang proyekto para sa sequencing (pagsusuri ng molekular) ng mga genome ibang mga klase mga buhay na organismo.

Istraktura ng genomics

Sa modernong genomics, maraming mga subsection:

  • comparative o evolutionary genomics, ito ay batay sa isang paghahambing ng organisasyon at nilalaman ng mga genome ng iba't ibang mga buhay na organismo;
  • functional genomics - pag-aaral nang detalyado ang mga function ng mga gene, ang epekto nito sa aktibidad ng gene;
  • Ang istrukturang genomics ay tumatalakay sa pagkakasunud-sunod, ang molecular analysis ng DNA, sa batayan kung saan ang mga genomic na mapa ay nilikha at maihahambing.

Bakit kailangan natin ng genomics

Ang isang malaking bilang ng mga genome ng iba't ibang mga microorganism (pangunahin na pathogenic) ay na-decipher. Ginagawa nitong posible na maghanap ng mga gene na target ng gamot dito at gumawa ng mga bagong gamot.

Ang genomics ay itinuturing bilang isang mahalagang bahagi, kinakailangang bahagi pangkalahatang biology. Nagagawa nitong gumawa ng malaking kontribusyon sa pagpapaunlad ng biotechnology, Agrikultura, Pangangalaga sa kalusugan.

Sa isang ospital sa Wisconsin, isang tatlong-taong-gulang na paslit ang naguguluhan sa mga doktor sa mahabang panahon. Sa batang ito, ang mga bituka ay edematous, at halos ganap na puno ng mga abscesses. Ang batang ito ay nakaligtas sa mahigit isang daang operasyon sa edad na tatlo. Ang sanggol ay binigyan ng kumpletong pagkakasunud-sunod ng mga rehiyon ng coding ng kanyang DNA, natukoy ang salarin ng sakit - ang protina ng XIAP, na kasangkot sa mga signal chain ng programmed cell death, ay gumaganap ng isang napaka mahalagang papel sa immune system. Dahil sa diagnosis, inirerekomenda ng mga physiologist ang bone marrow transplant. Nailigtas ang sanggol.

Ang isa pang kaso ay nagsasangkot ng isang hindi tipikal na kanser sa isang tatlumpu't siyam na taong gulang na babae na nagdusa mula sa isang talamak na anyo ng promyelocytic leukemia. Kapag gumagamit ng mga karaniwang pamamaraan ng diagnostic, hindi matukoy ang sakit. Ngunit kapag nag-decipher at sinusuri ang genome mga selula ng kanser posible na malaman na ang isang malaking seksyon ng ikalabinlimang chromosome ay lumipat sa ikalabimpito, na nagdulot ng isang tiyak na pakikipag-ugnayan ng gene. Ang pasyente ay inireseta ng sapat na paggamot.

Unang draft, 2003 - pagkumpleto ng proyekto). Ang pag-unlad nito ay naging posible hindi lamang dahil sa pagpapabuti ng mga biochemical na pamamaraan, kundi dahil din sa paglitaw ng isang mas malakas na computer science na naging posible upang gumana sa malaking halaga ng data. Ang haba ng mga genome sa mga buhay na organismo ay minsan sinusukat sa bilyun-bilyong mga pares ng base. Halimbawa, ang genome ng tao ay humigit-kumulang 3 bilyong pares ng base. Ang pinakamalaking kilala (sa simula ng 2010) na mga genome ay kabilang sa isa sa mga species ng lungfish (humigit-kumulang 110 bilyong pares).

Mga seksyon ng genomics

Structural genomics

Structural genomics - ang nilalaman at organisasyon ng genomic na impormasyon. Nilalayon nitong pag-aralan ang mga gene na may kilalang istraktura upang maunawaan ang kanilang paggana, gayundin upang matukoy spatial na istraktura ang maximum na bilang ng mga "susi" na molekula ng protina at ang impluwensya nito sa mga pakikipag-ugnayan.

functional genomics

Ang functional genomics ay ang pagpapatupad ng impormasyong naitala sa genome mula sa gene hanggang sa katangian.

Comparative genomics

Comparative genomics (evolutionary) - comparative studies ng nilalaman at organisasyon ng mga genome iba't ibang organismo.

Ang pagkuha ng kumpletong genome sequence ay nagbigay-liwanag sa antas ng pagkakaiba sa pagitan ng mga genome ng iba't ibang nabubuhay na organismo. Ang talahanayan sa ibaba ay nagpapakita ng paunang data sa pagkakatulad ng mga genome ng iba't ibang organismo sa genome ng tao. Ang pagkakatulad ay ibinibigay bilang isang porsyento (na sumasalamin sa proporsyon ng mga pares ng base na magkapareho sa dalawang pinaghahambing na species).

Tingnan pagkakatulad Mga tala at mapagkukunan
Lalaki 99,9 % Proyekto ng Human Genome
100 % kambal
Chimpanzee 98,4 % Mga Amerikano para sa Pag-unlad ng Medikal;
98,7 % Richard Mural ng Celera Genomics, sinipi sa MSNBC
Bonobo, o pygmy chimpanzee Kapareho ng para sa mga chimpanzee.
Gorilya 98,38 % Batay sa pag-aaral ng intergenic na hindi paulit-ulit na DNA (American Journal of Human Genetics, Pebrero 2001, 682, pp. 444-456)
Daga 98 %
85 % kapag inihambing ang lahat ng mga pagkakasunud-sunod na pag-encode ng mga protina, NHGRI
aso 95 % Jon Entine sa San Francisco Examiner
C.elegans 74 % Jon Entine sa San Francisco Examiner
saging 50 % Mga Amerikano para sa Pag-unlad ng Medikal
Narcissus 35 % Steven Rose sa The Guardian noong Enero 22

Mga halimbawa ng aplikasyon ng genomics sa medisina

Sa isang ospital sa Wisconsin, isang tatlong taong gulang na bata ang naguguluhan sa mga doktor sa mahabang panahon, ang kanyang mga bituka ay namamaga at ganap na puno ng mga abscesses. Sa edad na tatlo, ang batang ito ay nakaranas ng higit sa isang daang magkakahiwalay na operasyon. Para sa kanya, ang isang buong pagkakasunud-sunod ng mga rehiyon ng coding ng kanyang DNA ay iniutos, ayon sa mga resulta, sa tulong ng mga improvised na paraan, ang salarin ng sakit ay nakilala - ang protina ng XIAP na kasangkot sa mga signal chain ng programmed cell death. Sa normal na operasyon ito ay gumaganap ng isang napakahalagang papel sa immune system. Batay sa diagnosis na ito, inirerekomenda ng mga physiologist ang bone marrow transplant noong Hunyo 2010. Noong kalagitnaan ng Hunyo, ang bata ay nakakain na sa unang pagkakataon sa kanyang buhay.

Ang isa pang kaso ay nauugnay sa isang hindi tipikal kanser sa isang 39 taong gulang na babae na naghihirap mula sa talamak na anyo promyelocytic leukemia. Sa karaniwang pamamaraan diagnosis, gayunpaman, ang sakit ay hindi natukoy. Ngunit nang i-decipher at pinag-aaralan ang genome ng mga selula ng kanser, lumabas na ang isang malaking seksyon ng ika-15 na kromosoma ay lumipat sa ika-17, na nagdulot ng isang tiyak na pakikipag-ugnayan ng gene. Dahil dito, natanggap ng babae ang paggamot na kailangan niya.

Mga Tala

Tingnan din

Mga link

  • Tishchenko P.D. Genomics: isang bagong uri ng agham sa isang bagong sitwasyong pangkultura.
  • Kumpletong Microbial Genomes (kumpletong na-decode na genome ng bacteria at archaea).

Wikimedia Foundation. 2010 .

Mga kasingkahulugan:

Tingnan kung ano ang "Genomics" sa ibang mga diksyunaryo:

    genomics- * genomics * genomics ay isang bagong direksyon ng genetics, ang agham ng mga genome, kabilang ang pag-aaral ng kanilang istraktura, paggana at ebolusyon sa molecular, chromosomal, biochemical, mga antas ng pisyolohikal. Isa sa mga gawain ng structural G. ay ... ... Genetics. encyclopedic Dictionary

    Umiiral., bilang ng mga kasingkahulugan: 1 genetics (11) diksyunaryo ng kasingkahulugan ng ASIS. V.N. Trishin. 2013... diksyunaryo ng kasingkahulugan

    genomics- Ang agham na nag-aaral ng lahat ng mga gene at ang kanilang papel sa istruktura ng katawan, tulad ng sa normal na kondisyon, at sa kaso ng sakit Mga Paksa ng biotechnology EN genomics ... Handbook ng Teknikal na Tagasalin

    Genomics- pagbabasa ng genome, sa partikular, ng isang tao, at mga kaugnay na aktibidad na pang-agham at teknikal: ஐ Malinaw na mas madaling makabuo ng impunity upang pag-iba-ibahin ang mga direksyon sa technobiology, dahil nanawagan ng plagiarism at kahit na pagpapabuti ... .. . Mundo ni Lem - diksyunaryo at gabay

    genomics- Genomics Genomics Ang pag-aaral ng buong hanay ng mga gene na bumubuo sa isang organismo ... Paliwanag English-Russian Dictionary of Nanotechnology. - M.

    genomics- genomika statusas T sritis augalininkystė apibrėžtis Nauja geneticos kryptis, ku apima genomo individualių genų molekulių lygyje, geno sandaros, jo raiškos, aktyvumo reguliavimo mechanizmo ir genų panaudojimo genų inžinerijos … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    Sangay ng genetics na nag-aaral sa istraktura at paggana ng genome decomp. mga organismo sa tulong ng biol., pisikal. chem. at mga pamamaraan sa kompyuterLikas na agham. encyclopedic Dictionary

    genomics- gene omics, at... Diksyonaryo ng spelling ng Ruso

    Genomics- isang seksyon ng genetika, ang paksa kung saan ay ang pag-aaral ng mga prinsipyo ng pagbuo ng mga genome at ang kanilang istruktura functional na organisasyonDiksyunaryo ng Psychogenetics

    Naglalayong ilarawan ang tatlong-dimensional na istraktura ng bawat protina na naka-encode ng isang ibinigay na genome. Isang kumbinasyon ng mga pang-eksperimentong at pagmomodelo ang ginagamit. Ang pangunahing pagkakaiba sa pagitan ng structural genomics at tradisyunal na istruktura ... ... Wikipedia

Mga libro

  • Klinikal na genetika. Genomics at proteomics ng namamana na patolohiya. Pagtuturo. Vulture UMO sa classical university education, Mutovin Gennady Romanovich. Tinatalakay ng aklat ang mga pangunahing probisyon at konsepto ng klinikal na genetika, na isinasaalang-alang ang mga resulta ng internasyonal na programang pang-agham na `Human Genome` (1988-2005). Kasaysayan, probisyon,…

Sa pagtatapos ng ika-20 siglo, ang mga teknolohiyang molekular ay binuo nang labis na ang mga kinakailangan ay nilikha para sa sistematikong pag-aaral ng istraktura ng mga genome. iba't ibang uri mga buhay na nilalang, kabilang ang mga tao. Isa sa pinakamahalagang layunin ng mga proyektong ito ay upang matukoy ang kumpletong pagkakasunud-sunod ng nucleotide ng genomic DNA. Kaya, ipinanganak ang isang bagong agham - genomics.

Ang simula ng bagong milenyo ay minarkahan ng pinakamalaking pagtuklas sa larangan ng genomics - ang istraktura ng genome ng tao ay natukoy. Ang balita ay naging napakahalaga na naging paksa ng talakayan sa pagitan ng mga pangulo ng mga nangungunang bansa sa mundo. Gayunpaman, maraming tao ang hindi humanga sa mensaheng ito. Una sa lahat, ito ay dahil sa kakulangan ng pag-unawa sa kung ano ang isang genome, ano ang istraktura nito at ano ang ibig sabihin ng pag-decode nito? May kinalaman ba ang balitang ito sa gamot at makakaapekto ba ito sa bawat isa sa atin? Ano ang molecular medicine at ang pag-unlad nito ay nauugnay sa pag-decipher ng istruktura ng genome? Bukod dito, ang ilang mga tao ay may takot na isa pa isang bagong pagtuklas ng mga siyentipiko sa sangkatauhan? Gagamitin ba ang data na ito para sa mga layuning militar? Susundan ba ito ng pangkalahatang compulsory genetic examination - isang uri ng genetic passportization ng populasyon? Magiging paksa ba ng pagsusuri ang ating genome at gaano magiging kumpidensyal ang impormasyong makukuha? Ang lahat ng mga isyung ito ay kasalukuyang aktibong tinatalakay sa komunidad na pang-agham.

Siyempre, ang genomics ay hindi nagsimula sa mga tao, ngunit sa mas simpleng organisadong mga nabubuhay na nilalang. Sa kasalukuyan, ang pagkakasunud-sunod ng nucleotide ng genomic DNA ng maraming daan-daang species ng mga microorganism ay natukoy na, karamihan sa mga ito ay pathogenic. Para sa mga prokaryote, ang pagkakumpleto ng pagsusuri ay naging ganap, iyon ay, walang isang nucleotide ang nananatiling undeciphered! Bilang isang resulta, hindi lamang ang lahat ng mga gene ng mga microorganism na ito ay natukoy, kundi pati na rin ang mga pagkakasunud-sunod ng amino acid ng mga protina na naka-encode ng mga ito ay tinutukoy. Paulit-ulit naming nabanggit na ang kaalaman sa pagkakasunud-sunod ng amino acid ng isang protina ay ginagawang posible na medyo tumpak na mahulaan ang istraktura at pag-andar nito. Binubuksan nito ang posibilidad na makakuha ng mga antibodies sa predictive na protina na ito, ang paghihiwalay nito mula sa microorganism at direktang biochemical analysis. Pag-isipan natin kung ano ang ibig sabihin nito para sa pagbuo ng panimula ng mga bagong pamamaraan ng paglaban sa mga impeksyon, kung hindi lamang alam ng doktor kung paano nakaayos ang mga gene ng nakakahawang mikroorganismo, kundi pati na rin ano ang istraktura at pag-andar ng lahat ng mga protina nito? Ang mikrobiyolohiya ay sumasailalim na ngayon sa napakalaking pagbabago dahil sa paglitaw ng isang malaking halaga ng bagong kaalaman, ang kahalagahan na hindi natin lubos na nauunawaan sa kasalukuyan. Malamang na aabutin ng mga dekada para ayusin ito bagong impormasyon sa mga pangangailangan ng sangkatauhan, pangunahin sa larangan ng medisina at agrikultura.

Ang paglipat mula sa mga prokaryotes hanggang sa eukaryotes sa mga tuntunin ng pag-decipher ng istraktura ng genome ay sinamahan ng malalaking paghihirap, at hindi lamang dahil ang haba ng mas mataas na DNA ay libu-libo, at kung minsan ay daan-daang libong beses na mas mahaba, ngunit ang istraktura nito ay nagiging mas kumplikado. Alalahanin na ang isang malaking bilang ng non-coding DNA ay lumilitaw sa genome ng mas matataas na hayop, isang mahalagang bahagi nito ay mga paulit-ulit na pagkakasunud-sunod. Ipinakilala nila ang makabuluhang pagkalito sa tamang pag-dock ng mga na-decipher na fragment ng DNA. At, bukod sa, ang mga pag-uulit ng tandem mismo ay mahirap maintindihan. Sa lugar ng lokalisasyon ng naturang mga pag-uulit, ang DNA ay maaaring magkaroon ng hindi pangkaraniwang pagsasaayos, na nagpapahirap sa pagsusuri nito. Samakatuwid, sa genome ng isa sa mga uri ng microscopic roundworm (nematode) - ang unang multicellular na organismo kung saan posible na matukoy ang pagkakasunud-sunod ng nucleotide ng DNA - isang bilang ng mga hindi kilalang lugar ang nananatili. Totoo, ang kanilang tiyak na gravity ay mas mababa sa isang daan ng isang porsyento ng kabuuang haba ng DNA, at ang mga kalabuan na ito ay walang kinalaman sa mga gene o mga elemento ng regulasyon. Ang nucleotide sequence ng lahat ng 19,099 genes ng worm na ito, na ipinamahagi sa isang lugar na 97 milyong base pairs, ay ganap na natukoy. Samakatuwid, ang gawain sa pag-decipher ng nematode genome ay dapat kilalanin bilang napaka-matagumpay.

Ang mas malaking tagumpay ay nauugnay sa pag-decipher ng Drosophila genome, na 2 beses na mas maliit kaysa sa DNA ng tao at 20 beses na mas malaki kaysa sa nematode DNA. Sa kabila ng mataas na antas ng genetic na kaalaman ng Drosophila, humigit-kumulang 10% ng mga gene nito ay hindi alam hanggang sa sandaling iyon. Ngunit ang pinaka-kabalintunaan ay ang katotohanan na ang Drosophila, na mas organisado kaysa sa nematode, ay may mas kaunting mga gene kaysa sa microscopic roundworm! Mahirap ipaliwanag mula sa mga modernong biological na posisyon. Higit pang mga gene kaysa sa Drosophila ang naroroon din sa decoded genome ng isang halaman mula sa cruciferous family - Arabidopsis, na malawakang ginagamit ng mga geneticist bilang isang klasikong eksperimentong bagay.

Ang pagbuo ng mga genomic na proyekto ay sinamahan ng masinsinang pag-unlad ng maraming mga lugar ng agham at teknolohiya. Kaya, isang malakas na impetus para sa pag-unlad nito ang natanggap bioinformatics. Ang isang bagong mathematical apparatus ay nilikha para sa pag-iimbak at pagproseso ng malaking halaga ng impormasyon; Ang mga supercomputer system na may hindi pa nagagawang kapangyarihan ay idinisenyo; Libu-libong mga programa ang naisulat na ginagawang posible sa loob ng ilang minuto upang magsagawa ng isang paghahambing na pagsusuri ng iba't ibang mga bloke ng impormasyon, araw-araw na pumasok sa mga database ng computer ng mga bagong data na nakuha sa iba't ibang mga laboratoryo sa buong mundo, at iangkop ang bagong impormasyon sa naipon. kanina. Kasabay nito, ang mga sistema ay binuo para sa mahusay na paghihiwalay ng iba't ibang mga elemento ng genome at awtomatikong pagkakasunud-sunod, iyon ay, ang pagpapasiya ng DNA nucleotide sequence. Sa batayan na ito, ang mga makapangyarihang robot ay idinisenyo na makabuluhang nagpapabilis sa pagkakasunud-sunod at ginagawa itong mas mura.

Ang pag-unlad ng genomics, sa turn, ay humantong sa pagtuklas ng isang malaking bilang ng mga bagong katotohanan. Ang kahalagahan ng marami sa kanila ay hindi pa natatasa sa hinaharap. Ngunit kahit ngayon ay malinaw na ang mga pagtuklas na ito ay hahantong sa muling pag-iisip ng marami teoretikal na mga probisyon tungkol sa pinagmulan at ebolusyon ng iba't ibang anyo ng buhay sa Earth. Tutulungan ka nilang mas maunawaan mga mekanismo ng molekular pinagbabatayan ang gawain ng mga indibidwal na mga cell at ang kanilang mga pakikipag-ugnayan; detalyadong pag-decipher ng marami hanggang ngayon ay hindi kilalang biochemical cycle; pagsusuri ng kanilang koneksyon sa pundamental mga prosesong pisyolohikal. Kaya, mayroong isang paglipat mula sa istruktura hanggang sa functional genomics, na lumilikha ng mga kinakailangan para sa pananaliksik. mga baseng molekular ang paggana ng cell at ng organismo sa kabuuan. Ang impormasyong naipon na ay magiging paksa ng pagsusuri sa susunod na ilang dekada. Ngunit ang bawat susunod na hakbang patungo sa pag-decipher ng istruktura ng mga genome ng iba't ibang species ay nagbibigay ng mga bagong teknolohiya na nagpapadali sa proseso ng pagkuha ng impormasyon. Kaya, ang paggamit ng data sa istraktura at pag-andar ng mga gene ng mas mababang organisadong species ng mga nabubuhay na nilalang ay maaaring makabuluhang mapabilis ang paghahanap para sa mga partikular na gene ng mas mataas. At kahit ngayon, ang mga pamamaraan ng pagsusuri sa computer na ginagamit upang makilala ang mga bagong gene ay kadalasang pinapalitan ang medyo matrabaho mga pamamaraan ng molekular maghanap ng mga gene.

Ang pinakamahalagang kinahinatnan ng pag-decipher ng istraktura ng genome isang tiyak na uri ay ang posibilidad ng pagtukoy sa lahat ng mga gene nito at, nang naaayon, pagtukoy at pagtukoy sa likas na molekular ng mga na-transcribe na molekula ng RNA at lahat ng mga protina nito. Sa pamamagitan ng pagkakatulad sa genome, ang mga konsepto ay ipinanganak transcriptome, na pinag-iisa ang pool ng mga molekula ng RNA na nabuo bilang resulta ng transkripsyon, at proteome, na kinabibilangan ng maraming protina na naka-encode ng mga gene. Kaya, ang genomics ay lumilikha ng pundasyon para sa masinsinang pag-unlad ng mga bagong agham - proteomics at transcriptomics. Ang Proteomics ay tumatalakay sa pag-aaral ng istraktura at paggana ng bawat protina; pagsusuri komposisyon ng protina mga selula; pagpapasiya ng molecular na batayan ng paggana ng isang cell, na resulta ng coordinated work ng maraming daan-daang protina, at ang pag-aaral ng pagbuo ng phenotypic trait ng isang organismo, na resulta ng coordinated work ng bilyun-bilyong selula. Ang napakahalagang biological na proseso ay nagaganap din sa antas ng RNA. Ang kanilang pagsusuri ay ang paksa ng transcriptomics.

Ang pinakadakilang pagsisikap ng mga siyentipiko sa maraming bansa sa mundo na nagtatrabaho sa larangan ng genomics ay nakadirekta sa paglutas internasyonal na proyekto"Human Genome". Ang makabuluhang pag-unlad sa lugar na ito ay nauugnay sa pagpapatupad ng ideya na iminungkahi ni J.S. Venter, upang maghanap at magsuri ng mga ipinahayag na pagkakasunud-sunod ng DNA, na maaaring magamit sa ibang pagkakataon bilang isang uri ng "mga label" o mga marker para sa ilang bahagi ng genome. Isa pang independyente at walang gaanong mabungang diskarte ang ginawa ng gawain ng grupo na pinamumunuan ni Fr. Collins. Ito ay batay sa pangunahing pagkakakilanlan ng mga gene para sa mga namamana na sakit ng tao.

Ang pag-decipher sa istraktura ng genome ng tao ay humantong sa isang kahindik-hindik na pagtuklas. Ito ay lumabas na ang genome ng tao ay naglalaman lamang ng 32,000 mga gene, na ilang beses na mas mababa kaysa sa bilang ng mga protina. Kasabay nito, mayroon lamang 24,000 na protina-coding na mga gene; ang mga produkto ng natitirang mga gene ay mga molekula ng RNA. Ang porsyento ng pagkakapareho sa mga pagkakasunud-sunod ng DNA nucleotide sa pagitan ng iba't ibang indibidwal, grupong etniko at lahi ay 99.9%. Ang pagkakatulad na ito ang dahilan kung bakit tayo nagiging tao - Homo sapiens! Ang lahat ng aming pagkakaiba-iba sa antas ng nucleotide ay umaangkop sa isang napaka-katamtamang figure - 0.1%. Kaya, ang genetika ay hindi nag-iiwan ng puwang para sa mga ideya ng pambansa o lahi.

Ngunit, tingnan ang bawat isa - lahat tayo ay magkakaiba. Pambansa, at higit pa, ang mga pagkakaiba sa lahi ay higit na kapansin-pansin. Kaya gaano karaming mga mutasyon ang tumutukoy sa pagkakaiba-iba ng isang tao hindi sa mga termino ng porsyento, ngunit sa mga ganap na termino? Upang makuha ang pagtatantya na ito, kailangan mong tandaan kung ano ang laki ng genome. Ang haba ng molekula ng DNA ng tao ay 3.2 x 10 9 na pares ng base. 0.1% nito ay 3.2 milyong nucleotides. Ngunit tandaan na ang bahagi ng coding ng genome ay sumasakop ng mas mababa sa 3% ng kabuuang haba ng molekula ng DNA, at ang mga mutasyon sa labas ng rehiyong ito, kadalasan, ay walang anumang epekto sa pagkakaiba-iba ng phenotypic. Kaya, upang makakuha ng isang mahalagang pagtatantya ng bilang ng mga mutasyon na nakakaapekto sa phenotype, kailangan mong kumuha ng 3% ng 3.2 milyong nucleotides, na magbibigay sa amin ng isang figure ng pagkakasunud-sunod ng 100,000. Iyon ay, humigit-kumulang 100 libong mutasyon ang bumubuo sa aming phenotypic pagkakaiba-iba. Kung ihahambing natin ang figure na ito sa kabuuang bilang genes, lumalabas na sa karaniwan ay mayroong 3-4 mutations bawat gene.

Ano ang mga mutasyon na ito? Ang kanilang karamihan (hindi bababa sa 70%) ay tumutukoy sa ating indibidwal na di-pathological na pagkakaiba-iba, kung ano ang nagpapakilala sa atin, ngunit hindi nagpapalala sa atin na may kaugnayan sa isa't isa. Kabilang dito ang mga feature gaya ng kulay ng mata, buhok, balat, uri ng katawan, taas, timbang, uri ng pag-uugali, na higit na tinutukoy ay genetically, at marami pang iba. Humigit-kumulang 5% ng mga mutasyon ay nauugnay sa mga monogenic na sakit. Humigit-kumulang isang-kapat ng natitirang mutasyon ay nabibilang sa klase ng mga functional polymorphism. Ang mga ito ay kasangkot sa pagbuo ng namamana na predisposisyon sa malawak na multifactorial na patolohiya. Siyempre, ang mga pagtatantya na ito ay medyo magaspang, ngunit ginagawa nilang posible na hatulan ang istraktura ng namamana na pagkakaiba-iba ng tao.



Ito ay bahagi 1 ng kasaysayan ng genomics, na tinatawag na "Genomic Projects". Sa bahaging ito, susubukan kong pag-usapan nang tanyag ang tungkol sa kung paano lumitaw ang mga unang paraan ng pagbabasa ng mga genetic sequence, kung ano ang binubuo ng mga ito, at kung paano lumipat ang genomics mula sa pagbabasa ng mga indibidwal na gene hanggang sa pagbabasa ng mga kumpletong genome, kabilang ang mga kumpletong genome. tiyak na mga tao.

Di-nagtagal pagkatapos ng pagtuklas ng Watson at Crick (Larawan 1), ang agham ng genomics ay ipinanganak. Ang genomics ay ang agham ng pag-aaral ng mga genome ng mga organismo, na kinabibilangan ng masinsinang pagbabasa ng kumpletong mga sequence ng DNA (sequencing) at ang kanilang pagmamapa sa mga genetic na mapa. Isinasaalang-alang din ng agham na ito ang mga pakikipag-ugnayan sa pagitan ng mga gene at alleles ng mga gene at kanilang pagkakaiba-iba, mga pattern sa ebolusyon at ang istraktura ng mga genome. Ang pag-unlad ng lugar na ito ay napakabilis na, kamakailan lamang, nagustuhan ng mga text editor Microsoft Word hindi alam ang salitang "genome" at sinubukang itama ito sa salitang "dwarf".

kanin. isaJames Watson (kaliwa) at Francis Crick (kanan) - mga siyentipiko na nakatuklas ng DNA double helix

Ang pinakaunang nabasang gene ay ang shell gene ng bacteriophage MS2, na pinag-aralan sa laboratoryo ng Walter Fyers noong 1972. Noong 1976, kilala rin ang iba pang mga bacteriophage genes - ang replicase nito, ang gene na responsable para sa pagpaparami ng mga viral particle. Ang mga maikling molekula ng RNA ay nabasa nang medyo madali, ngunit ang malalaking molekula ng DNA ay hindi pa nakakabasa nang maayos. Halimbawa, ang 24-titik na pagkakasunud-sunod ng lactose operon gene sequence na nakuha noong 1973 nina Walter Gilbert at Allen Maxam ay itinuturing na isang makabuluhang tagumpay sa agham. Narito ang pagkakasunod-sunod:

5"—TGGAATTGTGAGGGATAACAATT 3"
3"—ACCTTAACACTCGCCTATTGTTAA 5"

Ang unang mga diskarte sa pagbabasa ng DNA ay napaka hindi mahusay at gumamit ng mga radioactive na label para sa DNA at mga pamamaraan ng kemikal upang makilala ang pagitan ng mga nucleotides. Halimbawa, ang isa ay maaaring kumuha ng mga enzyme na pumuputol sa nucleotide sequence na may iba't ibang probabilidad pagkatapos iba't ibang titik. Ang molekula ng DNA ay binubuo ng 4 na letra (nucleotides) A, T, G at C, na bahagi ng double anti-parallel (dalawang hibla ay nakadirekta sa magkabilang panig) mga spiral. Sa loob ng helix na ito, ang mga nucleotide ay kabaligtaran ng isa't isa alinsunod sa tuntunin ng complementarity: ang kabaligtaran ng A sa kabilang kadena ay T, ang kabaligtaran ng G ay C at kabaliktaran.

Gumamit sina Gilbert at Maxam ng 4 na uri ng enzymes. Isang cut pagkatapos ng A o G, ngunit mas mahusay pagkatapos ng A (A>G), ang pangalawang cut ay mas mahusay pagkatapos ng G (G>A), ang pangatlo pagkatapos ng C, at ang pang-apat pagkatapos ng C o T (C+T). Ang reaksyon ay isinasagawa sa 4 na mga tubo ng pagsubok sa bawat uri ng enzyme, at pagkatapos ay inilagay ang mga produkto sa isang gel. Ang DNA ay isang sisingilin na molekula at kapag ang kasalukuyang ay nakabukas ito ay tumatakbo mula minus hanggang plus. Ang mas maliliit na molekula ay tumatakbo nang mas mabilis, kaya ang mga putol na molekula ng DNA ay nakahanay sa haba. Sa pagtingin sa 4 na linya ng gel, masasabi ng isa kung anong pagkakasunud-sunod ang mga nucleotide.

Ang isang pambihirang tagumpay sa larangan ng DNA sequencing ay dumating nang ang English biochemist na si Frederick Sanger noong 1975 ay iminungkahi ang tinatawag na "strand termination method" para sa pagbabasa ng mga sequence ng DNA. Ngunit bago pag-usapan ang pamamaraang ito, kinakailangan na ipakilala ang mga prosesong nagaganap sa panahon ng synthesis ng mga bagong molekula ng DNA. Para sa synthesis ng DNA, kailangan ang isang enzyme - DNA-dependent DNA polymerase, na kayang kumpletuhin ang pagbuo ng isang solong-stranded na molekula ng DNA sa isang double-stranded na molekula. Upang gawin ito, ang enzyme ay nangangailangan ng isang "binhi" - isang panimulang aklat, isang maikling DNA sequence na maaaring magbigkis sa isang mahabang solong-stranded na molekula, na gusto nating buuin hanggang sa isang double-stranded. Ang mga nucleotide mismo ay kinakailangan din sa anyo ng mga nucleotide triphosphate at ilang mga kundisyon, tulad ng isang tiyak na nilalaman ng mga magnesium ions sa daluyan at isang tiyak na temperatura. Palaging napupunta ang synthesis sa isang direksyon mula sa dulo na tinatawag na 5' hanggang sa dulo na tinatawag na 3'. Siyempre, para mabasa ang DNA, kailangan mo ng malaking halaga ng matrix - iyon ay, mga kopya ng DNA na babasahin.

Noong 1975, naisip ni Sanger ang mga sumusunod. Kumuha siya ng mga espesyal na (pagwawakas) na mga nucleotide, na, na sumali sa lumalagong kadena ng molekula ng DNA, ay nakagambala sa pag-attach ng kasunod na mga nucleotide, iyon ay, "sinira" nila ang kadena. Pagkatapos ay kumuha siya ng 4 na test tubes, sa bawat isa ay idinagdag niya ang lahat ng 4 na uri ng nucleotides at isang uri ng terminating nucleotides sa isang maliit na halaga. Kaya, sa test tube kung saan matatagpuan ang terminating nucleotide "A", ang synthesis ng bawat bagong molekula ng DNA ay maaaring masira sa anumang lugar kung saan dapat tumayo ang "A", sa test tube na may nagtatapos na "G" - kahit saan kung saan. Dapat tumayo si G, at iba pa. Dagdag pa. Ang 4 na linya mula sa 4 na tubo ay inilapat sa gel (Larawan 2) at muli ang pinakamaikling mga molekula ay "tumakbo" pasulong, at ang pinakamahabang nanatili sa simula, at sa pamamagitan ng mga pagkakaiba sa mga banda posible na sabihin kung aling nucleotide ang sumusunod kung alin. Upang makita ang mga banda, nilagyan ng label ang isa sa apat na nucleotides (A, T, G, o C), nang hindi binabago ang mga katangian ng kemikal, gamit ang radioactive isotopes.

kanin. 2Paraan ng Sanger. Tatlong serye ng 4 na track ang ipinapakita.

Gamit ang pamamaraang ito, binasa ang unang genome na nakabatay sa DNA, ang bacteriophage ϕX174 genome, 5.386 nucleotides ang haba (ang MS2 phage genome na nabasa kanina ay RNA-based at may genome na 3.569 nucleotides ang haba).

Ang pamamaraan ng Sanger ay makabuluhang napabuti sa laboratoryo ng Leroy Hood, kung saan noong 1985 ang radioactive label ay pinalitan ng isang makinang, fluorescent na label. Ginawa nitong posible na lumikha ng unang awtomatikong sequencer: ang bawat molekula ng DNA ay may kulay na ngayon magkaibang kulay depende sa kung ano ang huling titik (nucleotide na may label na kulay na nagtatapos sa kadena). Ang mga fragment ay pinaghiwalay ayon sa laki sa gel, at awtomatikong binabasa ng makina ang luminescence spectrum ng mga papasok na banda, na naglalabas ng mga resulta sa isang computer. Bilang resulta ng pamamaraang ito, ang isang chromatogram ay nakuha (Larawan 2), ayon sa kung saan madaling magtatag ng isang pagkakasunud-sunod ng DNA hanggang sa 1000 mga titik ang haba, na may napakaliit na bilang ng mga pagkakamali.



kanin. 3 Isang halimbawa ng isang chromatogram, sa isang modernong sequencer, gamit ang Sanger chain termination method at isang kumikinang na label.

Sa loob ng maraming taon, ang pinahusay na paraan ng Sanger ay magiging pangunahing paraan ng mass genome sequencing at gagamitin para sa maraming buong genome na proyekto, at si Sanger noong 1980 ay makakatanggap ng isang segundo. premyong nobela sa kimika (natanggap niya ang unang pabalik noong 1958 para sa pagbabasa ng pagkakasunud-sunod ng amino acid ng protina ng insulin - ang unang binasa ng protina). Ang unang kumpletong genome cellular na organismo naging genome ng isang bacterium na nagdudulot ng ilang uri ng pneumonia at meningitis - haemophilus influenzae noong 1995. Ang genome ng bacterium na ito ay 1,830,137 nucleotides ang haba. Noong 1998, lumilitaw ang unang genome ng isang multicellular na hayop, isang roundworm Caenorhabditis elegans(Larawan 4 sa kanan), na may 98 milyong nucleotides, at pagkatapos ay sa taong 2000 ang unang genome ng halaman ay lilitaw - Arabidopsis thaliana(Larawan 4 sa kaliwa), mga kamag-anak ng malunggay at mustasa. Ang genome ng halaman na ito ay 157 milyong nucleotides ang haba. Ang bilis at sukat ng pagkakasunud-sunod ay lumago sa isang kamangha-manghang bilis, at ang mga umuusbong na database ng mga pagkakasunud-sunod ng nucleotide ay napunan nang mas mabilis at mas mabilis.


kanin. 4 Arabidopsis thaliana(kaliwa) at Caenorhabditis elegans(sa kanan).

Sa wakas, ito na ang turn ng mammalian genome: ang mouse at human genome. Noong, noong 1990, pinangunahan ni James Watson ang buong proyekto ng pagbabasa ng genome ng tao sa National Institutes of Health (NIH) sa US, maraming mga siyentipiko ang nag-aalinlangan sa ideya. Ang nasabing proyekto ay nangangailangan ng malaking pamumuhunan ng pera at oras at, ibinigay limitadong pagkakataon umiiral na mga makina para sa pagbabasa ng mga genome, tila sa marami ay hindi magagawa. Sa kabilang banda, ang proyekto ay nangako ng mga rebolusyonaryong pagbabago sa medisina at pag-unawa sa device. katawan ng tao ngunit may mga problema din dito. Ang katotohanan ay sa sandaling iyon ay walang eksaktong pagtatantya ng bilang ng mga gene sa isang tao. Marami ang naniniwala na ang pagiging kumplikado ng istraktura ng katawan ng tao ay nagpapahiwatig ng pagkakaroon ng daan-daang libong mga gene, at marahil ilang milyon, at, samakatuwid, ang pag-uuri ng ganoong bilang ng mga gene, kahit na mababasa ang kanilang pagkakasunud-sunod, ay magiging isang imposibleng gawain. Ito ay sa pagkakaroon ng isang malaking bilang ng mga gene na ipinapalagay ng marami ang pangunahing pagkakaiba sa pagitan ng tao at iba pang mga hayop - isang pananaw na kasunod na pinabulaanan ng proyekto ng genome ng tao.

Ang mismong ideya ng pagbabasa ng genome ng tao ay ipinanganak noong 1986 sa inisyatiba ng Kagawaran ng Enerhiya ng US, na kasunod na pinondohan ang proyekto kasama ang NIH. Ang halaga ng proyekto ay tinatantya sa 3 bilyong dolyar, at ang proyekto mismo ay dinisenyo para sa 15 taon na may partisipasyon ng ilang mga bansa sa proyekto: China, Germany, France, Great Britain at Japan. Upang basahin ang genome ng tao, ginamit ang tinatawag na "artificial bacterial chromosome" (BAC - bacterial artificial chromosome). Sa pamamaraang ito, ang genome ay pinutol sa maraming piraso, mga 150,000 libong nucleotide ang haba. Ang mga fragment na ito ay ipinasok sa mga artipisyal na chromosome ng singsing na ipinasok sa bakterya. Sa tulong ng bakterya, ang mga chromosome na ito ay dumarami, at ang mga siyentipiko ay nakakakuha ng maraming kopya ng parehong fragment ng molekula ng DNA. Ang bawat naturang fragment ay binasa nang hiwalay, at ang mga nabasang piraso ng 150,000 nucleotides ay naka-plot sa isang chromosome map. Ang pamamaraang ito ay nagbibigay-daan sa medyo tumpak na pagkakasunud-sunod ng genome, ngunit ito ay napakatagal.

Ngunit ang proyekto ng genome ng tao ay lubos na gumagalaw dahan-dahan. Ang scientist na si Craig Venter at ang kanyang kumpanyang Celera Genomics, na itinatag noong 1998, ay gumanap ng halos parehong papel sa kasaysayan ng genomics bilang Uniong Sobyet nakaimpluwensya sa paglipad ng mga Amerikano sa buwan. Sinabi ni Venter na kukumpletuhin ng kanyang kumpanya ang proyekto ng human genome bago matapos ang proyekto ng gobyerno. Ang proyekto ay mangangailangan lamang ng $300 milyon, isang bahagi ng halaga ng proyekto ng gobyerno, gamit bagong teknolohiya sequencing "whole genome shotgun" - pagbabasa ng mga random na maikling fragment ng genome. Nang malaman ni Francis Collins, na pumalit kay James Watson bilang pinuno ng Human Genome Reading Project noong 1993, ang mga intensyon ni Venter, nagulat siya. “ Gagawin namin ang genome ng tao, at maaari kang gumawa ng mouse Iminungkahi ni Venter. komunidad ng agham Ako ay nasasabik, at may ilang mga dahilan para doon. Una, nangako si Venter na tatapusin ang kanyang proyekto noong 2001, sa loob ng 4 na taon maaga binalak para sa proyekto ng estado. Pangalawa, gagamitin ng Celera Genomics ang proyekto sa pamamagitan ng paglikha ng isang ganap na database na babayaran ng mga komersyal na kumpanya ng parmasyutiko.

Noong 2000, pinatunayan ni Celera ang bisa ng kanyang sequencing method sa pamamagitan ng pag-publish ng genome ng Drosophila fruit fly, kasama ang laboratoryo ng geneticist na si Gerald Rubin (noong una, ang buong genome shotgun ay ginamit upang basahin ang unang genome ng isang bacterium, ngunit kakaunti ang naniniwala na ang pamamaraang ito ay angkop para sa malalaking genome). Ito ay ang sipa mula sa isang komersyal na kumpanya na stimulated ang pag-unlad ng pinabuting at ang paggamit ng higit pa makabagong pamamaraan pagbabasa ng mga genome sa Human Genome Project. Noong 2001, isang paunang bersyon ng genome ang inilathala ng State Genomic Project at Celera. Pagkatapos ay ginawa paunang pagtatantya ang bilang ng mga gene sa genome ng tao, 30-40 thousand. Noong 2004, ang huling bersyon ng genome ay lumabas, halos dalawang taon nang mas maaga sa iskedyul. Sa huling artikulo, sinabi na ang bilang ng mga gene sa isang tao ay 20-25 libo lamang. Ang bilang na ito ay maihahambing sa ibang mga hayop, partikular sa isang uod C.elegans.

Halos walang nahulaan na ang bilang ng mga gene na tumitiyak sa gawain ng ating katawan ay maaaring napakaliit. Nang maglaon, nalaman ang iba pang mga detalye: ang genome ng tao ay may haba na humigit-kumulang tatlong bilyong nucleotides, karamihan Ang genome ay binubuo ng mga non-coding sequence, kasama ang lahat ng uri ng pag-uulit. Isang maliit na bahagi lamang ng genome ang aktwal na naglalaman ng mga gene - mga seksyon ng DNA kung saan binabasa ang mga functional na molekula ng RNA. Kawili-wiling katotohanan na habang dumarami ang kaalaman sa genome ng tao, bumaba lang ang bilang ng mga putative genes: maraming potensyal na gene ang naging pseudogenes (non-working genes), sa ibang mga kaso, ilang gene ang naging bahagi ng parehong gene.

Ang mga karagdagang sequencing rate ay tumaas nang husto. Noong 2005, nai-publish ang chimpanzee genome, na nakumpirma ang kamangha-manghang pagkakatulad sa pagitan ng mga unggoy at mga tao, na nakita ng mga zoologist ng nakaraan. Noong 2008, ganap nang nabasa ang mga genome ng 32 vertebrates, kabilang ang pusa, aso, kabayo, macaque, orangutan at elepante, 3 invertebrate deuterostome genome, 15 insect genome, 7 worm genome, at daan-daang bacterial genome.

Sa wakas, noong 2007, nilapitan ng sangkatauhan ang posibilidad ng pagkakasunud-sunod ng mga genome ng mga indibidwal na tao. Ang unang taong nakabasa ng kumpleto indibidwal na genome, ay si Craig Venter (Larawan 4). Kasabay nito, binasa ang genome sa paraang posible na ihambing ang mga chromosome ni Venter, na minana mula sa parehong mga magulang. Kaya, napag-alaman na sa pagitan ng isa at isa pang hanay ng mga chromosome sa loob ng isang tao ay may humigit-kumulang tatlong milyong isang letrang pagkakaiba ng nucleotide, hindi binibilang ang malaking bilang ng malalaking iba't ibang rehiyon. Pagkalipas ng isang taon, ang kumpletong diploid genome ni James Watson ay nai-publish (Larawan 5). Ang genome ni Watson ay naglalaman ng 3.3 milyong solong-titik na pagpapalit kumpara sa annotated na genome ng tao, kung saan higit sa 10,000 ang nagresulta sa mga pagbabago sa mga protina na nagko-code para sa kanyang mga gene. Ang genome ni Watson ay nagkakahalaga ng $1 milyon, iyon ay, ang presyo ng pagbabasa ng mga genome ay bumagsak ng higit sa 3,000 beses sa loob ng 10 taon, ngunit hindi ito ang limitasyon. Ngayon, ang mga siyentipiko ay nahaharap sa gawain ng '1 genome - $1000 - 1 araw', at tila hindi na ito imposible sa pagdating ng mga bagong teknolohiya sa pagkakasunud-sunod. Ang susunod na bahagi ng "kuwento" ay magsasabi tungkol sa kanila.


kanin. 5 Sina James Watson at Craig Venter ang mga unang tao na indibidwal na nagbasa ng mga genome.

  1. Watson J, Crick F: Isang Istraktura para sa Deoxyribose Nucleic Acid. Kalikasan 1953(171):737-738.
  2. Min Jou W, Haegeman G, Ysebaert M, Fiers W: Nucleotide sequence ng gene coding para sa bacteriophage MS2 coat protein. Kalikasan 1972, 237(5350):82-88.
  3. Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A et al: Kumpletong nucleotide sequence ng bacteriophage MS2 RNA: pangunahin at pangalawang istraktura ng replicase gene. Kalikasan 1976, 260(5551):500-507.
  4. Gilbert W, Maxam A: Ang nucleotide sequence ng lac operator. Proc Natl Acad Sci U S A 1973, 70(12):3581-3584.
  5. Maxam AM, Gilbert W: Isang bagong paraan para sa DNA sequencing. Proc Natl Acad Sci U S A 1977, 74(2):560-564.
  6. Sanger F, Nicklen S, Coulson AR: DNA sequencing na may chain-terminating inhibitors. Proc Natl Acad Sci U S A 1977, 74(12):5463-5467.
  7. Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, Heiner C, Kent SB, Hood LE: Fluorescence detection sa automated DNA sequence analysis. Kalikasan 1986, 321(6071):674-679.
  8. Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM et al: Whole-genome random sequencing at assembly ng Haemophilus influenzae Rd. Agham 1995, 269(5223):496-512.
  9. Genome sequence ng nematode C. elegans: isang plataporma para sa pagsisiyasat ng biology. Science 1998, 282(5396):2012-2018.
  10. Pagsusuri ng genome sequence ng namumulaklak na halaman na Arabidopsis thaliana. Kalikasan 2000, 408(6814):796-815.
  11. Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, Scherer SE, Li PW, Hoskins RA, Galle RF et al: Ang genome sequence ng Drosophila melanogaster. Science 2000, 287(5461):2185-2195.
  12. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA et al: Ang pagkakasunud-sunod ng genome ng tao. Science 2001, 291(5507):1304-1351.
  13. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al: Paunang pagkakasunud-sunod at pagsusuri ng genome ng tao. Kalikasan 2001, 409(6822):860-921.
  14. Tinatapos ang euchromatic sequence ng genome ng tao. Kalikasan 2004, 431(7011):931-945.
  15. Paunang pagkakasunud-sunod ng genome ng chimpanzee at paghahambing sa genome ng tao. Kalikasan 2005, 437(7055):69-87.
  16. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, Walenz BP, Axelrod N, Huang J, Kirkness EF, Denisov G et al: Ang diploid genome sequence ng isang indibidwal na tao. PLoS Biol 2007, 5(10):e254.
  17. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT et al: Ang kumpletong genome ng isang indibidwal sa pamamagitan ng napakalaking parallel na DNA sequencing. Kalikasan 2008, 452(7189):872-876.
Part 2 - dito