Синтетическая геномика: в полушаге от «элемента жизни. От клеточных популяций к индивидуальным клеткам

Геномика - изучение всего генома

Последние достижения в области секвенирова-ния и развитие технических средств для обработки большого количества клонов в библиотеке генов позволили ученым исследовать сразу весь геном организма. Сейчас определены полные последовательности многих видов, в том числе большинства так называемых модельных генетических организмов, таких как Е. coli; круглого червя Caenorhabditis elegans; и, конечно, классического объекта генетики, плодовой мушки Drosophila melanogaster. В 1990-х годах, несмотря на ряд неурядиц и разногласий, был начат проект по исследованию человеческого генома («Геном человека»), средства на который выделил Национальный институт здоровья. В феврале 2001 года большая группа исследователей во главе с Дж. Крэй-гом Вентером из частной лаборатории «Селера Дже-номикс» сделали заявление о предварительной расшифровке человеческого генома. Результат их работы был опубликован 16 февраля 2001 года в журнале «Science».

Другая версия, которую представила группа из Международного консорциума по секвенированию человеческого генома, была напечатана 13 февраля 2001 года в журнале «Nature».

Временем зарождения геномики можно считать середину XX века, когда генетики составили карты всех хромосом модельных организмов, основываясь на частоте рекомбинаций (см. гл. 8). Однако на этих картах были показаны лишь те гены, для которых были известны мутантные аллели, и поэтому полными такие карты назвать нельзя. Полное сек-венирование ДНК позволяет выявить местонахождение всех генов организма, а также установить последовательность оснований между ними.

Геномика делится на структурную и функциональную. Структурная геномика ставит целью выяснить, где именно в хромосомной ДНК расположены те или иные гены. Компьютерные программы распознают типичные для генов начала и концы, отбирая те последовательности, которые, вероятнее всего, и являются генами. Такие последовательности называют открытой рамкой считывания (open reading frame, OFR). Те же компьютерные программы могут опознавать и типичные интроны в OFR-nocледовательностях. После того как интроны из потенциального гена вычленены, по оставшемуся коду компьютер определяет последовательность аминокислот в белке. Затем эти потенциальные белки сравнивают с теми белками, функции которых уже известны и последовательности которых уже занесены в базу данных. Благодаря такому роду программ был установлен так называемый эволюционный консерватизм: то, что для большинства генов в разных организмах имеются схожие гены. С позиций эволюционного развития такое сходство объяснимо: если белок какого-то одного биологического вида хорошо приспособлен для своих функций, то его ген передается в том же виде или с небольшими изменениями к видам, происходящим от начального. Эволюционный консерватизм позволяет опознавать гены, родственные данному гену в других организмах. Сравнив полученный ген с уже известными, зачастую можно определить и его функцию, обязательно проверив ее в последующих экспериментах.

После определения всех потенциальных генов приступают к составлению генетической карты. Генетическая карта человека - довольно запутанная и пестрая диаграмма, так как каждый ген отмечают определенным цветом в зависимости от его функции, устанавливаемой в сравнении с другими известными генами. Большинство генов человека, как и вообще гены всех эукариот, имеют большие интроны. По приблизительным оценкам, среди опубликованных последовательностей около трети или четверти приходится на интроны. Любопытно, что только около 1,5% всего генома человека (около 2,9 х 10 9 пар оснований) содержат последовательности (экзоны), кодирующие белки. Кроме того, похоже, что эта ДНК содержит только 35 000-45 000 генов, а это меньше предсказанного. Нам еще предстоит понять, как относительно малое количество генов кодирует такой сложный организм.

Количество копий повторяющейся ДНК у разных людей неодинаково, поэтому их можно использовать для установления личности, в том числе и в судебной медицине.

Функциональная геномика - это исследование функций генов на уровне всего генома. Хотя потенциальные гены можно определить по сходству с генами, выполняющими известные функции в других организмах, все догадки следует проверять на примере изучаемого организма. В некоторых модельных организмах, например в пищевых дрожжах, можно систематически отключать функцию генов по очереди. Выключение гена происходит посредством замены его функциональной формы стертой формой на особом векторе. Затем получают штамм с выключенным геном и оценивают его фенотип. В ходе продолжающейся программы по анализу генома пищевых дрожжей по очереди было выключено несколько тысяч генов.

Другой метод функциональной геномики заключается в том, что изучают механизм транскрипции на уровне всего генома. Данный метод основан на предположении, что большинство биологических явлений представляют собой сложные процессы с участием многих генов. Особый интерес у исследователей вызывают процессы, связанные с развитием организма, о которых мы упоминали в гл. 11. Если транскрипцию генов изучать в разных условиях роста, то можно составить представление о полных генетических путях развития организма.

Но как можно изучать транскрипцию на уровне всего генома? Опять-таки в этом ученым помогают новые технологии. ДНК каждого гена в геноме или некоторой части генома помещают на поверхности небольших стеклянных пластин, расположенных по порядку. Потом их подвергают воздействию со стороны всех видов мРНК, обнаруженных в клетке данного организма. ДНК на пластинках получают двумя способами. При одном способе все мРНК подвергаются обратной транскрипции, чтобы получить короткие комплементарные молекулы ДНК, соответствующие одному гену. При другом способе гены (или части генов) синтезируются по одному основанию за раз на определенных участках пластин. Синтез осуществляют роботы, открывающие и закрывающие поверхность стекла в определенном порядке. Пластинки с геномом многих организмов можно приобрести в химических компаниях.

Геномикой принято называть одну из ветвей молекулярной биологии. Ее основная задача заключена в так называемом секвенировании геномов - изучении нуклеотидных последовательностей ДНК и РНК. Не нужно путать слова генетика и геномика. Генетика занимается изучением механизмов наследственности и изменчивости и, а геномика призвана применять на практике полученные знания.

Из истории науки

Как особое направление, геномика сформировалась в 1980-1990 годах наряду с появлением первых проектов по секвенированию (молекулярного анализа) геномов отдельных видов живых организмов.

Структура геномики

В современной геномике бытует множество подразделов:

  • сравнительная или эволюционная геномика, она основывается на сравнении организации и содержимого геномов всевозможных живых организмов;
  • функциональная геномика - детально изучает функции генов, их воздействие на активность генов;
  • структурная геномика занимается секвенированием, молекулярным анализом ДНК, на основе которого создаются и могут сравниваться геномные карты.

Зачем нужна геномика

Большое количество геномов разнообразных микроорганизмов (в основном, патогенных) удалось расшифровать. Это позволяет изыскивать здесь гены-мишени лекарств и изготовлять новые лекарственные препараты.

Геномику воспринимают, как необъемлемую, необходимую часть общей биологии. Она способна вносить свой немалый вклад в развитие биотехнологии, сельского хозяйства, здравоохранения.

В одной из больниц Висконсина малыш в возрасте трех лет длительное время ставил врачей в тупик. У этого ребенка кишечник отек, был практически полностью пронизан абсцессами. Этот ребенок к трем годам пережил больше ста хирургических операций. Малышу привели полный сиквенс кодирующих участков его ДНК, выявили виновника заболевания – белок XIAP, который участвует в сигнальных цепях запрограммированной клеточной смерти, играет очень важную роль в иммунной системе. Благодаря постановке диагноза физиологи рекомендовали провести трансплантацию костного мозга. Малыша удалось спасти.

Еще один случай был связан с нетипичной раковой болезнью у тридцати девятилетней женщины, которая страдала от острой формы промиелоцитарной лейкемии. При проведении стандартных методов диагностики заболевание выявить не удавалось. Но при выполнении расшифровки и анализа генома раковых клеток удалось выяснить, что крупный участок пятнадцатой хромосомы переместился на семнадцатую, что провоцировало определенное генное взаимодействие. Больной назначили адекватное лечение.

Первый черновой вариант, 2003 год - завершение проекта). Её развитие стало возможно не только благодаря совершенствованию биохимических методик, но и благодаря появлению более мощной вычислительной техники, которая позволила работать с огромными массивами данных. Протяженность геномов у живых организмов подчас измеряется миллиардами пар оснований . Например, объём генома человека составляет порядка 3 млрд пар оснований. Самый крупный из известных (на начало 2010 года) геномов принадлежит одному из видов двоякодышаших рыб (примерно 110 млрд пар).

Разделы геномики

Структурная геномика

Структурная геномика - содержание и организация геномной информации. Имеет целью изучение генов с известной структурой для понимания их функции, а также определение пространственного строения максимального числа «ключевых» белковых молекул и его влияния на взаимодействия .

Функциональная геномика

Функциональная геномика - реализация информации, записанной в геноме, от гена - к признаку.

Сравнительная геномика

Сравнительная геномика (эволюционная) - сравнительные исследования содержания и организации геномов разных организмов.

Получение полных последовательностей геномов позволило пролить свет на степень различий между геномами разных живых организмов. Ниже в таблице представлены предварительные данные о сходстве геномов разных организмов с геномом человека. Сходство дано в процентах (отражает долю пар оснований , идентичных у двух сравниваемых видов).

Вид Сходство Примечания и источники
Человек 99,9 % Human Genome Project
100 % Однояйцевые близнецы
Шимпанзе 98,4 % Americans for Medical Progress;
98,7 % Richard Mural из Celera Genomics, цитируется в MSNBC
Бонобо , или карликовый шимпанзе То же, что и для шимпанзе.
Горилла 98,38 % Основано на изучении интергенной неповторяющейся ДНК (American Journal of Human Genetics, февраль 2001, 682, стр. 444-456)
Мышь 98 %
85 % при сравнении всех последовательностей, кодирующих белки, NHGRI
Собака 95 % Jon Entine в San Francisco Examiner
C. elegans 74 % Jon Entine в San Francisco Examiner
Банан 50 % Americans for Medical Progress
Нарцисс 35 % Steven Rose в The Guardian от 22 января

Примеры применения геномики в медицине

В больнице Висконсина ребёнок в возрасте трёх лет долгое время ставил врачей в тупик, его кишечник отёк и был полностью пронизан абсцессами. К своим трем годам этот ребёнок пережил более ста отдельных хирургических операций. Для него был заказан полный сиквенс кодирующих участков его ДНК, по результатам с помощью подручных средств был выявлен виновник заболевания – белок XIAP, участвующий в сигнальных цепях запрограммированной клеточной смерти. При нормальной работе он играет очень важную роль в иммунной системы. На основе такого диагноза физиологами была рекомендована трансплантация костного мозга в июне 2010. К середине июня ребёнок уже смог впервые в своей жизни поесть.

Другой случай связан был с нетипичным раковым заболеванием у 39ти летней женщины, страдающей острой формой промиелоцитарной лейкемии. При стандартных методах диагностики, однако, заболевание не было выявлено. А вот при расшифровке и анализе генома раковых клеток выяснилось, что крупный участок 15ой хромосомы переместился на 17ю, что вызвало определённое генное взаимодействие. В результате женщина получила необходимое ей лечение.

Примечания

См. также

Ссылки

  • Тищенко П. Д. Геномика: новый тип науки в новой культурной ситуации .
  • Complete Microbial Genomes (полностью расшифрованные геномы бактерий и архей).

Wikimedia Foundation . 2010 .

Синонимы :

Смотреть что такое "Геномика" в других словарях:

    геномика - * геноміка * genomics новое направление генетики, наука о геномах, включающая изучение их структуры, функционирования и эволюции на молекулярном, хромосомном, биохимическом, физиологическом уровнях. Одной из задач структурной Г. является… … Генетика. Энциклопедический словарь

    Сущ., кол во синонимов: 1 генетика (11) Словарь синонимов ASIS. В.Н. Тришин. 2013 … Словарь синонимов

    геномика - Наука, изучающая все гены и их роль в структуре организма, как в нормальном состоянии, так и при заболевании Тематики биотехнологии EN genomics … Справочник технического переводчика

    Геномика - прочтение генома, в частности, человека, и сопутствующая научная и техническая деятельность: ஐ Очевидно то, что легче было безнаказанно придумать дифференциацию направлений в технобиологии, поскольку призывая к плагиату и даже к улучшению… … Мир Лема - словарь и путеводитель

    геномика - Genomics Геномика Исследование всей совокупности генов, составляющих организм … Толковый англо-русский словарь по нанотехнологии. - М.

    геномика - genomika statusas T sritis augalininkystė apibrėžtis Nauja genetikos kryptis, kuri apima genomo individualių genų molekulių lygyje, geno sandaros, jo raiškos, aktyvumo reguliavimo mechanizmo ir genų panaudojimo genų inžinerijos tikslams… … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    Раздел генетики, изучающий структуру и функционирование генома разл. организмов с помощью биол., физ. хим. и компьютерных методовЕстествознание. Энциклопедический словарь

    геномика - ген омика, и … Русский орфографический словарь

    Геномика - раздел генетики, предметом которого является изучение принципов построения геномов и их структурно функциональной организацииСловарь по психогенетике

    Стремится описать трехмерную структуру каждого белка, закодированного данным геномом. Используется комбинация экспериментальных и моделирующих подходов. Принципиальное различие между структурной геномикой и традиционным структурным… … Википедия

Книги

  • Клиническая генетика. Геномика и протеомика наследственной патологии. Учебное пособие. Гриф УМО по классическому университетскому образованию , Мутовин Геннадий Романович. В книге рассмотрены основные положения и понятия клинической генетики с учетом результатов международной научной программы`Геном человека` (1988-2005 гг.). Представлены история, положения,…

В конце ХХ векамолекулярные технологии развивались настолько интенсивно, что были созданы предпосылки для планомерного изучения структуры геномов разных видов живых существ, включая человека. Одной из наиболее значимых целей этих проектов является определение полной нуклеотидной последовательности геномных ДНК. Таким образом, родилась новая наука - геномика .

Начало нового тысячелетия ознаменовалось крупнейшим открытием в области геномики – расшифрована структура генома человека. Новость оказалась настолько значимой, что стала предметом обсуждения между президентами ведущих стран мира. Однако на многих людей это сообщение не произвело впечатления. В первую очередь это связано с недостаточным пониманием того, что такое геном, какова его структура и что значит ее расшифровка? Имеет ли эта новость отношение к медицине и может ли коснуться каждого из нас? Что такое молекулярная медицина и связана ли ее развитие с расшифровкой структуры генома? Более того, у некоторых людей возникли опасения, не грозит ли в очередной раз новое открытие ученых человечеству? Не будут ли использованы эти данные в военных целях? Не последует ли за этим всеобщее принудительное генетическое обследование - своеобразная генетическая паспортизация населения? Не явится ли наш геном предметом анализа и насколько конфиденциальна будет полученная информация? Все эти вопросы в настоящее время активно обсуждаются в научном сообществе.

Конечно, геномика начиналась не с человека, а с гораздо более просто организованных живых существ. В настоящее время расшифрована нуклеотидная последовательность геномной ДНК многих сотен видов микроорганизмов, большинство из которых являются болезнетворными. Для прокариот полнота анализа оказалась абсолютной, то есть не остается не расшифрованным ни одного нуклеотида! В результате идентифицируются не только все гены этих микроорганизмов, но и определяются аминокислотные последовательности кодируемых ими белков. Мы уже неоднократно отмечали, что знание аминокислотной последовательности белка позволяет довольно точно прогнозировать его структуру и функции. Открывается возможность получения антител к этому прогнозируемому белку, его изоляции из микроорганизма и прямого биохимического анализа. Давайте задумаемся, что это означает для разработки принципиально новых методов борьбы с инфекциями, если врач не только знает, как устроены гены инфицирующего микроорганизма, но и какова структура и функции всех его белков? Сейчас в микробиологии происходят грандиозные изменения в связи с появлением огромного количества новых знаний, значение которых в настоящее время мы не до конца понимаем. По-видимому, понадобятся еще десятилетия, для того чтобы приспособить эту новую информацию к нуждам человечества, в первую очередь, в области медицины и сельского хозяйства.

Переход от прокариот к эукариотам в плане расшифровки структуры генома сопровождается большими трудностями и не только потому, что длина ДНК высших в тысячи, а иногда в сотни тысяч раз больше, но и структура ее становится более сложной. Вспомним, что в геноме высших появляется большое количество некодирующих ДНК, значительную часть которых составляют повторяющиеся последовательности. Они вносят значительную путаницу в правильную стыковку уже расшифрованных фрагментов ДНК. А, кроме того, тандемные повторы сами трудно поддаются подобной расшифровке. В области локализации таких повторов ДНК может иметь необычную конфигурацию, что затрудняет ее анализ. Поэтому в геноме одного из видов микроскопического круглого червя (нематоды) - первого многоклеточного организма, для которого удалось определить нуклеотидную последовательность ДНК, - уже осталось некоторое число неясных мест. Правда, их удельный вес составляет менее сотой процента от общей длины ДНК, и эти неясности не касаются генов или регуляторных элементов. Нуклеотидная же последовательность всех 19 099 генов этого червя, распределенных на площади в 97 миллионов пар оснований, была определена полностью. Поэтому работу по расшифровке генома нематоды следует признать весьма успешной.

Еще больший успех связан с расшифровкой генома дрозофилы, лишь в 2 раза уступающего по размеру ДНК человека и в 20 раз превосходящего ДНК нематоды. Несмотря на высокую степень генетической изученности дрозофилы, около 10% ее генов были до этого момента неизвестны. Но самым парадоксальным является тот факт, что у гораздо более высоко организованной по сравнению с нематодой дрозофилы количество генов оказалось меньше, чем у микроскопического круглого червя! С современных биологических позиций это трудно объяснить. Больше генов, чем у дрозофилы, присутствует и в расшифрованном геноме растения из семейства крестоцветных - арабидопсиса, широко используемого генетиками в качестве классического экспериментального объекта.

Разработка геномных проектов сопровождалась интенсивным развитием многих областей науки и техники. Так, мощный импульс для своего развития получила биоинформатика . Был создан новый математический аппарат для хранения и обработки огромных массивов информации; сконструированы системы суперкомпьютеров, обладающие невиданной мощностью; написаны тысячи программ, позволяющих в считанные минуты проводить сопоставительный анализ различных блоков информации, ежедневно вводить в компьютерные базы новые данные, получаемые в различных лабораториях мира, и адаптировать новую информацию к той, которая была накоплена ранее. Одновременно были разработаны системы для эффективной изоляции различных элементов генома и автоматического секвенирования, то есть определения нуклеотидных последовательностей ДНК. На этой базе были сконструированы мощные роботы, значительно ускоряющие секвенирование и делающие его менее дорогостоящим.

Развитие геномики, в свою очередь, привило к открытию огромного количества новых фактов. Значение многих из них еще предстоит оценить в будущем. Но и сейчас очевидно, что эти открытия приведут к переосмыслению многих теоретических положений, касающихся возникновения и эволюции различных форм жизни на Земле. Они будут способствовать лучшему пониманию молекулярных механизмов, лежащих в основе работы отдельных клеток и их взаимодействий; детальной расшифровке многих до сих пор неизвестных биохимических циклов; анализу их связи с фундаментальными физиологическими процессами. Таким образом, происходит переход от структурной геномики к функциональной, которая в свою очередь создает предпосылки для исследования молекулярных основ работы клетки и организма в целом. Накопленная уже сейчас информация будет предметом анализа в течение нескольких ближайших десятилетий. Но каждый следующий шаг в направлении расшифровки структуры геномов разных видов, порождает новые технологии, облегчающие процесс получения информации. Так, использование данных о структуре и функции генов более низко организованных видов живых существ может значительно ускорить поиск специфических генов высших. И уже сейчас методы компьютерного анализа, используемые для идентификации новых генов, зачастую вытесняют достаточно трудоемкие молекулярные методы поиска генов.

Наиболее важным следствием расшифровки структуры генома определенного вида является возможность идентификации всех его генов и, соответственно, идентификации и определения молекулярной природы транскрибируемых молекул РНК и всех его белков. По аналогии с геномом родились понятия транскриптома , объединяющего пул образовавшихся в результате транскрипции молекул РНК, и протеома , включающего множество кодируемых генами белков. Таким образом, геномика создает фундамент для интенсивного развития новых наук – протеомики и транскриптомики . Протеомика занимается изучением структуры и функции каждого белка; анализом белкового состава клетки; определением молекулярных основ функционирования отдельной клетки, являющегося результатом координированной работы многих сотен белков, и исследованием формирования фенотипического признака организма, являющегося результатом координированной работы миллиардов клеток. Очень важные биологические процессы происходят и на уровне РНК. Их анализ является предметом транскриптомики.

Наибольшие усилия ученых многих стран мира, работающих в области геномики, были направлены на решение международного проекта «Геном человека». Значительный прогресс в этой области связан с реализацией идеи, предложенной Дж. С. Вентером, заняться поиском и анализом экспрессирующихся последовательностей ДНК, которые в дальнейшем могут быть использованы в качестве своеобразных «ярлыков» или маркеров определенных участков генома. Другой независимый и не менее плодотворный подход, был использован в работе группы, возглавляемой Фр. Коллинзом. Он основан на первоочередной идентификации генов наследственных болезней человека.

Расшифровка структуры генома человека привела к сенсационному открытию. Оказалось, что в геноме человека только 32 000 генов, что в несколько раз меньше количества белков. При этом белок-кодирующих генов только 24 000, продуктами остальных генов являются молекулы РНК. Процент сходства по нуклеотидным последовательностям ДНК между разными индивидуумами, этническими группами и расами составляет 99,9%. Это сходство и делает нас людьми – Homo sapiens! Вся наша изменчивость на нуклеотидном уровне укладывается в очень скромную цифру – 0,1%. Таким образом, генетика не оставляет места для идей национального или расового превосходства.

Но, посмотрим друг на друга – мы все разные. Еще более заметны национальные, а тем более, расовые различия. Так какое же количество мутаций определяют изменчивость человека не в процентном, а в абсолютном выражении? Для того чтобы получить эту оценку, нужно вспомнить, каков размер генома. Длина молекулы ДНК человека составляет 3,2х10 9 пар оснований. 0,1% от этого – 3,2 миллиона нуклеотидов. Но вспомним, что кодирующая часть генома занимает менее 3% от общей длины молекулы ДНК, а мутации вне этой области, чаще всего, не оказывают никакого влияния на фенотипическую изменчивость. Таким образом, для получения интегральной оценки числа мутаций, оказывающих влияние на фенотип, нужно взять 3% от 3,2 миллионов нуклеотидов, что и даст нам цифру порядка 100 000. То есть, около 100 тысяч мутаций формируют нашу фенотипическую изменчивость. Если мы сопоставим эту цифру с общим числом генов, то получится, что в среднем на ген приходится 3-4 мутации.

Что это за мутации? Их подавляющее большинство (не менее 70%) определяет нашу индивидуальную непатологическую изменчивость, то, что нас отличает, но не делает хуже по отношению друг к другу. Сюда входят такие признаки, как цвет глаз, волос, кожи, характер телосложения, рост, вес, тип поведения, который тоже в значительной степени генетически детерминирован, и многое другое. Около 5% мутаций ассоциированы с моногенными заболевания. Около четверти оставшихся мутаций относятся к классу функциональных полиморфизмов. Они участвуют в формировании наследственной предрасположенности к широко распространенной мультифакториальной патологии. Конечно, эти оценки достаточно грубые, но они позволяют судить о структуре наследственной изменчивости человека.



Это часть 1 истории геномики, которая называется "геномные проекты". В этой части я постараюсь научно-популярно рассказывать о том, как появились первые методы чтения генетических последовательностей, в чем они заключались и как геномика двигалась от чтения отдельных генов к чтению полных геномов, в том числе полных геномов конкретных людей.

Вскоре после открытия Уотсона и Крика (Рис.1) рождается наука геномика. Геномика - это наука об исследовании геномов организмов, которая включает интенсивное чтение полных последовательностей ДНК (секвенирование) и их нанесение на генетические карты. Это наука так же рассматривает взаимодействия между генами и аллелями генов и их разнообразие, закономерности в эволюции и устройства геномов. Развитие этой области происходило так стремительно, что еще совсем недавно текстовые редакторы вроде Microsoft Word не знали слова “геном” и пытались исправить его на слово “гном”.

Рис. 1 Джеймс Уотсон (слева) и Френсис Крик (справа) - ученые открывшие двойную спираль ДНК

Самый первый прочтенный ген был ген оболочки бактериофага MS2, изученный в лаборатории Валтера Файерса в 1972-ом году . В 1976-ом были известны и другие гены бактериофага - его репликаза, ген отвечающий за размножение вирусных частиц . Короткие молекулы РНК тогда уже читались сравнительно легко, но крупные молекулы ДНК читать толком еще не умели. К примеру, полученная в 1973-ем году Вальтером Гилбертом и Алленом Максам последовательность участка гена лактозного оперона, длинной в 24 буквы, рассматривалась как существенный прорыв в науке. Вот эта последовательность:

5"—TGGAATTGTGAGCGGATAACAATT 3"
3"—ACCTTAACACTCGCCTATTGTTAA 5"

Первые техники чтения ДНК были очень неэффективными и использовали радиоактивные метки для ДНК и химические методы, чтобы различить нуклеотиды. Например, можно было взять ферменты, которые разрезают нуклеотидную последовательность с разной вероятностью после разных букв. Молекула ДНК состоит из 4-ех букв (нуклеотидов) A, T, G и С, которые входят в состав двойной анти-параллельной (две цепи направлены в противоположные стороны) спирали. Внутри этой спирали нуклеотиды находятся друг напротив друга в соответствии с правилом комплементарности: напротив А в другой цепи стоит T, напротив G стоит С и наоборот.

Гилберт и Максам использовали 4 типа ферментов. Один разрезал после А или G, но лучше после A (A>G), второй разрезал лучше после G (G>A), третий после C, а четвертый после С или T (С+T) . Реакция проводилась в 4-ех пробирках с каждым типом ферментов, а затем продукты помещали на гель. ДНК - заряженная молекула и при включении тока бежит от минуса к плюсу. Маленькие молекулы бегут быстрее, поэтому разрезанные молекулы ДНК выстраиваются по длине. Глядя на 4 дорожки геля, можно было сказать в какой последовательности расположены нуклеотиды.

Прорыв в области секвенирования ДНК случился, когда английский биохимик Фредерик Сенгер в 1975-ом году предложил, так называемый “метод терминации цепи” для чтения последовательностей ДНК. Но прежде чем рассказать об этом методе, необходимо ввести в курс процессов происходящих при синтезе новых молекул ДНК. Для синтеза ДНК необходим фермент - ДНК-зависимая ДНК полимераза, которая способен достраивать одноцепочечную молекулу ДНК до двухцепочечной. Для этого ферменту необходима “затравка” - праймер, короткая последовательность ДНК, способная связаться с длинной одноцепочечной молекулой, которую мы хотим достроить до двухцепочечной. Так же необходимы сами нуклеотиды в форме нуклеотидтрифосфатов и некоторые условия, такие как определенное содержание ионов магния в среде и определенная температура. Синтез всегда идет в одном направлении от конца называемого 5’ к концу называемому 3’. Разумеется, для чтения ДНК необходимо большое количество матрицы - то есть копий той ДНК, которую собираются читать.

В 1975-ом году Сенгер придумал следующее. Он брал специальные (терминирующие) нуклеотиды, которые, присоединившись к растущей цепи молекулы ДНК, мешали присоединению последующих нуклеотидов, то есть “обрывали” цепь. Далее он брал 4 пробирки, в каждую из которых добавлял все 4 типа нуклеотидов и один тип терминирующих нуклеотидов в небольшом количестве . Таким образом, в пробирке, где находился терминирующий нуклеотид “А” синтез каждой новой молекулы ДНК мог оборваться в любом месте, где должна была встать “А”, в пробирке с терминирующей “G” - в любом месте, где должна встать G и так далее. На гель наносились 4 дорожки из 4-ех пробирок (Рис. 2) и снова самые коротки молекулы “убегали” вперед, а самые длинные оставались в начале, а по отличиям в полосах можно было сказать, какой нуклеотид следует за каким. Чтобы увидеть полосы, один из четырех нуклеотидов (A, T, G или C) метился, без изменения химических свойств, с использованием радиоактивных изотопов.

Рис. 2 Метод Сангера. Показаны три серии из 4-ех дорожек.

С помощью этого метода был прочитан первый геном, основанный на ДНК - геном бактериофага ϕX174, длинной 5,386 нуклеотидов (геном фага MS2, прочитанный ранее был на основе РНК и имел геном длинной 3,569 нуклеотидов).

Метод Сенгера был существенно улучшен в лаборатории Лероя Худа, где в 1985-ом году радиоактивную метку смогли заменить светящейся, флюрисцентной меткой . Это дало возможность создать первый автоматический секвенатор: каждая молекула ДНК теперь была покрашена разным цветом в зависимости от того, какой была последняя буква (меченый цветом нуклеотид, обрывающий цепь). Фрагменты разделялись на геле по размерам и машина автоматически считывала спектр свечения поступающих полос, выдавая результаты на компьютер. В результате такой процедуры получается хроматограмма (Рис. 2), по которой легко установить последовательность ДНК длинной до 1000 букв, с очень небольшим количеством ошибок.



Рис. 3 Пример хроматограммы, на современном секвенторе, использующий метод обрывания цепи Сангера и светящуюся метку.

На многие годы улучшенный метод Сенгера станет основным методом массового секвенирования геномов и будет использован для многих проектов полных геномов, а Сенгер в 1980-ом получит вторую нобелевскую премию по химии (первую он получил еще в 1958-ом за прочтение аминокислотной последовательности белка инсулина - первого прочитанного белка). Первым полным геномом клеточного организма стал геном бактерии, вызывающей некоторые формы пневмонии и менингита - Haemophilus influenzae в 1995-ом году. Геном этой бактерии имел длину 1,830,137 нуклеотидов. В 1998-ом году появляется первый геном многоклеточного животного, круглого червяка Caenorhabditis elegans (Рис. 4 справа), с 98 миллионами нуклеотидов, а затем в 2000-ом году появляется первый растительный геном - Arabidopsis thaliana (Рис. 4 слева), родственницы хрена и горчицы. Геном этого растения имеет длину 157 миллионов нуклеотидов. Скорость и масштабы секвенирования росли с изумительной скоростью и появляющиеся базы данных нуклеотидных последовательностей пополнялись все быстрее и быстрее.


Рис. 4 Arabidopsis thaliana (слева) и Caenorhabditis elegans (справа).

Наконец, настал черед генома млекопитающих: геномы мыши и человека. Когда в 1990-ом году Джеймс Уотсон возглавил проект чтения полного генома человека в Институте Национального Здоровья (NIH) в США многие ученые скептически относились к этой идее. Подобный проект требовал колоссальных вложений денег и времени и, учитывая ограниченные возможности существовавших машин для чтения геномов, многим казался просто не выполнимым. С другой стороны проект обещал революционные изменения в медицине и понимании устройства человеческого организма, но и здесь были свои проблемы. Дело в том, что в тот момент не существовало какой-либо точной оценки количества генов у человека. Многие полагали, что сложность устройства человеческого организма указывает на наличие у него сотен тысяч генов, а может и несколько миллионов, а, следовательно, разобраться в таком количестве генов, даже если их последовательности удастся прочитать, будет непосильной задачей. Именно в наличии большого количества генов многие предполагали принципиальное отличие человека от других животных - представление, впоследствии опровергнутое проектом генома человека.

Сама идея прочитать геном человека родилась в 1986-ом году по инициативе Департамента Энергии США, который впоследствии финансировал проект вместе с NIH. Стоимость проекта была оценена в 3 миллиарда долларов, а сам проект был рассчитан на 15 лет при участии в проекте целого ряда стран: Китай, Германия, Франция, Великобритания и Япония. Для чтения генома человека использовались так называемые “искусственные бактериальные хромосомы” (BAC - bacterial artificial chromosome). При этом подходе геном разрезаются на множество частей, длинной примерно в 150000 тысяч нуклеотидов. Эти фрагменты встраивают в искусственные кольцевые хромосомы, которые встраиваются в бактерии. С помощью бактерий эти хромосомы размножаются, и ученые получают множество копий одного и того же фрагмента молекулы ДНК. Каждый такой фрагмент затем читается отдельно, а прочитанные куски по 150000 нуклеотидов наносятся на карту хромосомы. Данный метод позволяет довольно точно секвенировать геном, однако требует очень больших затрат времени.

Но проект генома человека двигался крайне медленными темпами. Ученый Крейг Вентер и его компания Celera Genomics, основанная в 1998-ом году, сыграли примерно такую же роль в истории геномики, как Советский Союз повлиял на полет американцев на луну. Вентер заявил, что его компания закончит проект генома человека раньше, чем завершится государственный проект. На проект потребуется всего 300 миллионов долларов - лишь малую фракцию от затрат государственного проекта, используя новую технологию секвенирования “whole genome shotgun” - чтение случайных коротких фрагментов генома. Когда Френсис Коллинс, сменивший в 1993-ем году Джеймса Уотсона на посту руководителя проекта по чтению генома человека, узнал о намерениях Вентера, он был шокирован. “Мы сделаем геном человека, а вы можете сделать мышку ” - предложил Вентер. Научное сообщество всполошилось, и на то был ряд причин. Во-первых, Вентер обещал закончить свой проект в 2001-ом году, на 4 года раньше срока, намеченного для государственного проекта. Во-вторых, компания Celera Genomics собиралась заработать на проекте, создав абсолютную базу данных, которая была бы платной для коммерческих фармоцевтических компаний.

В 2000-ом году Селера доказала эффективность своего метода секвенирования, опубликовав геном плодовой мушки дрозофилы вместе с лабораторией генетика Джеральда Рубина (ранее whole genome shotgun использовался для прочтения первого генома бактерии, но мало кто верил, что этот метод пригоден для крупных геномов). Именно такой пинок со стороны коммерческой компании стимулировал разработку улучшенных и применение более современных методов чтения геномов в проекте генома человека. В 2001-ом году был опубликован предварительный вариант генома со стороны государственного геномного проекта и Селеры . Тогда была сделана предварительная оценка количества генов в геноме человека, 30-40 тысяч. В 2004-ом году вышла окончательная версия генома , почти на два года раньше, чем следовало по плану. В последней статье было сказано, что количества генов у человека предположительно составляет лишь 20-25 тысяч. Это число сравнимо с другими животными, в частности с червяком C. elegans .

Практически никто не угадал, что количество генов, обеспечивающих работу нашего организма, может быть столь мало. Позже стали известны и другие подробности: геном человека имеет длину около трех миллиардов нуклеотидов, большую часть генома составляют не кодирующие последовательности, в том числе всевозможные повторы. Лишь небольшая часть генома действительно содержит гены - участки ДНК, с которых считываются функциональные молекулы РНК. Интересный факт, что по мере увеличения знаний о геноме человека, число предполагаемых генов только сокращалось: многие потенциальные гены оказывались псевдогенами (не работающими генами), в других случаях несколько генов оказывались частью одного и того же гена.

Дальнейшие темпы секвенирования возрастали экспоненциально. В 2005-ом году опубликован геном Шимпанзе , который подтвердил потрясающее сходство между обезьянами и человеком, которое видели еще зоологи прошлого. К 2008-ому году были полностью прочитаны геномы 32-ух позвоночных, включая кошку, собаку, лошадь, макаку, орангутанга и слона, 3 генома беспозвоночных вторичноротых, 15 геномов насекомых, 7 геномов червяков и сотни геномов бактерий.

Наконец в 2007-ом человечество приблизилась к возможности секвенирования геномов индивидуальных людей. Первым человеком, для которого прочитали полный индивидуальный геном, стал Крейг Вентер (Рис. 4). При этом геном был прочитан так, что можно было сравнить хромосомы Вентера, доставшиеся ему от обоих родителей. Так было выяснено, что между одним и другим набором хромосом внутри одного человека существует около трех миллионов однобуквенных нуклеотидных отличий, не считая огромного количества крупных варьирующих участков. Год спустя опубликован полный диплоидный геном Джеймса Уотсона (Рис. 5). Геном Уотсона содержал 3.3 миллиона однобуквенных замен по сравнению с аннотированным геномом человека, из которых более 10000 вели к изменением в белках, которые кодируют его гены. Геном Уотсона обошелся в 1 миллион долларов, то есть цена на чтение геномов упала более чем в 3000 раз за 10 лет, но и это не предел. Сегодня перед учеными стоит задача ‘1 геном - 1000 $ - 1 день” и она уже не кажется невыполнимой с появлением новых технологий секвенирования. О них расскажет следующая часть "истории".


Рис. 5 Джеймс Уотсон и Крейг Вентер - первые люди с индивидуальными прочитанными геномами.

  1. Watson J, Crick F: A Structure for Deoxyribose Nucleic Acid . Nature 1953(171):737-738.
  2. Min Jou W, Haegeman G, Ysebaert M, Fiers W: Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein. Nature 1972, 237(5350):82-88.
  3. Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A et al: Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene. Nature 1976, 260(5551):500-507.
  4. Gilbert W, Maxam A: The nucleotide sequence of the lac operator. Proc Natl Acad Sci U S A 1973, 70(12):3581-3584.
  5. Maxam AM, Gilbert W: A new method for sequencing DNA. Proc Natl Acad Sci U S A 1977, 74(2):560-564.
  6. Sanger F, Nicklen S, Coulson AR: DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A 1977, 74(12):5463-5467.
  7. Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, Heiner C, Kent SB, Hood LE: Fluorescence detection in automated DNA sequence analysis. Nature 1986, 321(6071):674-679.
  8. Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM et al: Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science 1995, 269(5223):496-512.
  9. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science 1998, 282(5396):2012-2018.
  10. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 2000, 408(6814):796-815.
  11. Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, Scherer SE, Li PW, Hoskins RA, Galle RF et al: The genome sequence of Drosophila melanogaster. Science 2000, 287(5461):2185-2195.
  12. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA et al: The sequence of the human genome. Science 2001, 291(5507):1304-1351.
  13. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al: Initial sequencing and analysis of the human genome. Nature 2001, 409(6822):860-921.
  14. Finishing the euchromatic sequence of the human genome. Nature 2004, 431(7011):931-945.
  15. Initial sequence of the chimpanzee genome and comparison with the human genome. Nature 2005, 437(7055):69-87.
  16. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, Walenz BP, Axelrod N, Huang J, Kirkness EF, Denisov G et al: The diploid genome sequence of an individual human. PLoS Biol 2007, 5(10):e254.
  17. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT et al: The complete genome of an individual by massively parallel DNA sequencing. Nature 2008, 452(7189):872-876.
Часть 2 - здесь