Исследования генома. Изучение генома человека. Стабильность и прогресс

Геном человека

Расшифровка генома человека – событие столь же важное в истории человечества, как открытие электричества, изобретение радио или создание компьютеров.

Немного истории. В 1988 году Национальный институт здоровья США начал проект «Геном человека» , возглавил который нобелевский лауреат Джеймс Уотсон . Основная цель проекта – выяснить последовательность нуклеотидных оснований во всех молекулах ДНК человека и установить локализацию, т.е. полностью картировать все гены человека.

Планировалось, что работа но определению нуклеотидной последовательности ДНК человека (секвенирование ДНК ) должна окончиться в 2005-м году . Однако после первого года работы стало ясно, что скорости секвениронания ДНК очень низкие и для полного завершения работы такими темпами потребуется около 100 лет .

Стало очевидно, что необходим поиск новых технологий секвенирования, создание новой вычислительной техники и оригинальных компьютерных программ. Это было невыполнимо в рамках отдельно взятого государства , и к программе подключились другие страны.

Широкомасштабные координированные исследования стали проводиться под эгидой международной организации ^ Human Genom Organisation (HUGO). С 1989 г. в проект включилась и Россия. Все хромосомы человека были поделены между странами-участницами, и России для исследования достались 3-, 13- и 19-я хромосомы . В проекте оказались задействованы несколько тысяч ученых из 20 стран .

В 1996 были созданы всемирные банки данных по ДНК человека. Любая вновь определенная последовательность нуклеотидов размером более 1 тыс. оснований должна была быть обнародована через Интернет в течение суток после ее расшифровки, в противном случае статьи с этими данными в научные журналы не принимались. Любой специалист в мире мог воспользоваться этой информацией.

К началу 1998 г. было секвенировано всего около ^ 3% генома . В это время к работе неожиданно подключилась частная американская компания из штата Мериленд «Celera Genomics» под руководством Крега Вентера , которая объявила, что закончит свою работу на 4 года раньше международного консорциума.

Началась беспримерная в науке гонка. Два коллектива работали независимо, не жалея сил, чтобы придти к финишу первыми. В ходе выполнения проекта «Геном человека» было разработано много новых методов исследования, большинство из которых значительно ускоряет и удешевляет работу по расшифровке ДНК. Эти методы анализа сейчас используются в медицине, криминалистике и т.д.

В июне 2000 года два конкурирующих коллектива объединили свои данные, официально объявив о завершении работ. А в феврале 2001 года появились научные публикации чернового варианта структуры генома человека. Качество секвенирования достаточно высокое и предполагает всего 1 ошибку на 50 тыс.п.н .

«Геном человека» вошел в историю как один из самых трудоемких и дорогостоящих проектов. На него было потрачено в сумме более ^ 6 миллиардов долларов.

Возникает естественный вопрос: геном какого же человека определен в результате этих титанических усилий, кто этот конкретный человек? Согласно имеющимся данным, фирма Celera в основном ориентировалась на геном одного человека, о котором известно лишь, что это белый мужчина среднего возраста. Скорее всего, это был сам глава корпорации Крег Вентер. Международный консорциум использовал в своей работе материал не менее семи различных людей.

Геном человека состоит из 24 хромосом и 3,2 млрд. п.н. Хромосомы человека были пронумерованы согласно размеру : наибольший - у хромосомы 1, наименьший - у хромосомы 22. Со временем выяснилось, что хромосома 22 содержит больше ДНК, чем хромосома 21, но порядок нумерации не стали менять, чтобы не вносить путаницу. Отдельно идут две половые хромосомы: X и Y (условно их можно назвать томами № 23 и № 24 Энциклопедии человеческого генома).

^ В геноме женщин содержится лишь 23 хромосомы из 24-х , и все они представлены в соматических клетках двумя экземплярами. У мужчин в клетках содержится полная Энциклопедия человека, все 24 хромосомы, но две из них (хромосомы X и Y) существуют в единичных экземплярах.

Разные хромосомы сильно отличаются друг от друга по числу и свойствам генов (в первой, самой большой, хромосоме содержится 263 млн. п.н., составляющих 2237 гена, а в 21 хромосоме – 50 млн.п.н. и 82 гена). www . ensembl . org

Также отличаются хромосомы и по важности записанной в них информации. Число генов, ассоциируемых с различными болезнями больше всего в Х хромосоме – 208; в 1 хмс – 157; и в 11 хмс – 135. Меньше всего таких генов в Y хмс – всего 3. Тем не менее, только совокупность всех хромосом обеспечивает клетки полной информацией, позволяющей человеку нормально развиваться и жить. В отсутствие любой из пар хромосом жизнь конкретного индивидуума становится невозможной.

При потере по каким-либо причинам только одной из пары хромосом состояние человека сильно отличается от нормы. Например, частичная моносомия 5-ой хромосомы приводит к синдрому кошачьего крика . У детей с этой аномалией отмечается необычный плач, что обусловлено изменением гортани, а также черепа и лица.

В клетках человека также имеется ДНК , расположенная не в хромосомах, а в митохонд-риях. Это тоже часть генома человека, называемая М-хромосомой . В отличие от ядерного генома митохондриальные гены располагаются компактно, как в геноме бактерий, и имеют свой собственный генетический код (своеобразный «генетический жаргон»). МитДНК ответственна в клетке за синтез всего лишь нескольких белков. Но эти белки очень важны для клетки, поскольку участвуют в обеспечении клетки энергией.

Предполагают, что митохондрии появились в клетках эукариот в результате симбиоза высших организмов с аэробными бактериями.

МитДНК передается из поколения в поколение только по женской линии . При оплодотворении в яйцо проникает сперматозоид с набором отцовских хромосом, но без отцовских митохондрий. Только яйцеклетка предоставляет зароды-шу свою митДНК. Поэтому митДНК удобно использовать для определения степени родства как внутри вида, так и между различными таксонами.

Одной из целей исследования генома человека являлось построение точной и подробной карты всех хромосом. Генетическая карта представляет собой схему, описывающую порядок расположения на хромосоме генов и других генетических элементов. (снипсы-повторы-гены ).

В кодировании белков принимает участие не более 1,5 % хромосомной ДНК человека (т.е. генетические инструкции по формированию человеческого индивидуума занимают лишь 3 см на двухметровой молекуле ДНК человека ).

Анализ генома человека позволил выявить у него порядка ^ 40 тыс . генов (на сегодня). Самые короткие гены содержат всего 20 п.н. (гены эндорфинов , вызывающих ощущение удовольствия). Самый длинный ген, кодирующий один из белков мышц (миодистрофин), содержит порядка 2,5 млн. п.н.

^ Плотность расположения генов в хромосомах сильно различается. Средняя плотности составляет около 10 генов на 1 млн.п.н. Однако в хромосоме 19 плотность составляет 20 генов , а в Y-хромосоме - всего 1,5 гена на млн. Если сравнить плотность генов с плотностью расселения людей, то Y-хромосома напоминает нашу Сибирь, а хромосома 19 - Европейскую часть России. Плотность расположения генов падает по мере эволюционного усложнения организмов. Для сравнения: в геноме бактерий содержится свыше 1000 генов на 1,0 млн. и. н., у дрожжей около 450 генов на 1,0 млн. п. н., а у червя С. elegans - около 200 .

Как у людей имеются семьи, так и гены объединяют в семейства по их схожести. В геноме человека присутствуют около 1,5 тыс. таких семейств. Причем только около сотни из них специфичны для человека и позвоночных животных. Основная же масса генных семейств имеется как у человека, так и у дождевого червя.

Разные гены одного семейства возникали в ходе эволюции из одного гена-предшественника как следствие мутаций. «Родственные» гены чаще всего выполняют сходную функцию. Например, геном человека имеет около 1 000 генов-рецепторов обоняния.

В семействах генов иногда встречаются псевдогены . Это гены, утратившие способность к экспрессии. Перед их названием ставят греческую букву . He совсем ясно, зачем геному нужны такие гены, почему он сохранил их в эволюции и не избавился от них. В геноме человека имеется около 20 000 таких псевдогенов . В частности, в огромной семействе генов обоняния около 60% являются псевдогенами. Считается, что массивная потеря функциональных генов произошла за последние 10 млн. лет в связи со снижением роли обоняния у человека по сравнению с другими млекопитающими.

Около 20 % генов человека функционируют во всех типах клеток человека. Остальные же гены работают только в определенных тканях и органах. Например, глобиновые гены экспрессируются только в клетках крови, поскольку основная их функция – обеспечивать перенос кислорода.

Примером высочайшей специализации генов служат обонятельные гены . В каждой клетке органа обоняния человека – обонятельной луковице - работает только 1 ген из 1000 возможных. Сильнейшее недоумение ученых вызвал тот факт, что некоторые из этих генов, кроме обонятельной луковицы, активизируются еще в одном типе клеток – сперматозоидах . Как это связано с восприятием запаха, пока не совсем ясно.

Картирование хромосом также позволило выявить локализацию участков, отвечающих за некоторые болезни человека.

Например, в первой хромосоме гены связанны с раком протоков молочной железы. Во второй – с ожирением. В третьей – с шизофренией. В четвертой хромосоме обнаружен ген, мутации которого приводят к развитию алкоголизма. Мутации в концевом участке Х -хромосомы вызывают предрасположенность к гомосекесуализму.

Внимание специалистов также привлекли гены, связанные с некоторыми особенностями поведения человека . Эти гены кодируют белки, участвующие в передаче сигналов между нервными клетками (например, белок серотонин). Ген, кодирующий рецептор серотонина, ученые назвали «геном самоубийства». Мутации по этому гену вызывают у людей склонностью к отрицательным эмоциям и суицидные наклонности.

Другой передатчик сигналов в нервной системе - дофамин – вещество, играющего ключевую роль в работе центров удовольствия мозга. Избыток дофамина вызывает у животных исследовательскую гиперактивность.. Было обнаружено, что один из генов, кодирующих белки-рецепторы дофамина, может существовать в разных аллельных формах (длинной и короткой). Люди с длинной аллелью больше склонны к поиску новых впечатлений, поэтому обнаруженный ген так и назвали «геном поиска новизны». У американцев длинная аллель гена рецептора дофамина встречается в 25 раз чаще, чем, скажем, у жителей Южной и Восточной Азии. Из истории мы знаем, как заселялась Америка европейцами. В первую очередь, это были энергичные люди, склонные к авантюризму, любопытные и импульсивные. Вот они то и внесли длинную аллель «гена поиска новизны» в современную американскую популяцию.

Недавно обнаружены два гена, которые отвечают за материнские инстинкты (эти гены так и были названы генами «материнского инстинкта» ). При этом, ко всеобщему удивлению, выяснилось, что оба гена дочки получают от отцов. Животные, у которых гены «материнского инстинкта» отсутствовали, не заботились о новорожденных.

Необходимо подчеркнуть, что, в отличие от генов, ответственных за физические параметры, наличие «больных» генов, формирующих психику и поведение, еще не означает стопроцентную обреченность человека па определенные отрицательные проявления. Во-первых, как правило, не один, а совокупность генов отвечает за душевные характеристики. Между ними существует очень сложное и порой весьма неоднозначное взаимодействие, эффект которого зависит от множества различных факторов. Во-вторых, как считает большинство ученых, психика и поведение человека лишь процентов на 50 определяются генами .

Одним из методов изучения влияния окружающей среды на проявление генотипа является наблюдение за однояйцовыми близнецами. Такой подход в генетике получил название «близнецовый метод ».

Однояйцовые близнецы образуются в результате деления одной и той же зиготы и содержат идентичные геномы. Хотя появление близнецов - довольно редкое явление (считается, что у человека одна двойня приходится па 80-85 родов), тем не менее, имеющихся случаев достаточно для проведения соответствующих исследований.

Одним из наиболее четких способов идентификации человека являются отпечатки пальцев . Характерные «узоры» закладываются у зародыша уже на третьем месяце развития и сохраняются без изменения в течение всей жизни. При сравнении кожных «узоров» у близнецов было выявлено, что они очень похожи, но, что удивительно, не всегда полностью идентичны.

При исследовании ряда других признаков также наблюдали их небольшие вариации у близнецов: цвет глаз и волос, форма уха.

Крупномасштабное сравнение однояйцовых близнецов друг с другом показало, что возникновение таких инфекционных заболеваний , как корь, коклюш, ветряная оспа практически полностью зависит от возбудителя заболевания, а вот полиомиелит и туберкулез определяются кроме того наследственными свойствами человека. В частности, заболеваемость туберкулезом обоих однояйцовых близнецов более чем в 3 раза выше, чем у двух разнояйцовых близнецов.

Исследование близнецов, проведенное в Каролинском институте в Стокгольме, убедительно показало существенное воздействие факторов окружающей среды (курения, загрязнений, питания, образа жизни) на развитие некоторых форм злокачественных заболеваний. Вместе с тем отмечено влияние генетических факторов на возникновение рака простаты, рака прямой кишки и рака груди.

При анализе близнецов удалось выяснить, что умственное развитие также могут объясняться генетически. Если один из пары однояйцовых близнецов слабоумен, то второй оказывается таким же почти всегда.

Российскими учеными было проведено исследование детей-близнецов в возрасте от 7 до 12 месяцев на предмет того, в какой мере генетика и среда влияют на агрессивность, раздражительность, активность и общительность . Оказалось, что первые три черты темперамента находятся под жестким генетическим контролем: агрессивность поведения младенца:на 94 процента определяется его генотипом, активность - па 89 процентов, раздражительность - па 85 процентов. А общительность почти на 90% формируется под влиянием среды, которую создают родители.

Благодаря методу близнецового анализа на генетический уровень вышла и широко обсуждаемая проблема гомосексуализма . Уже имеются достоверные данные, что около 57% однояйцовых близнецов, братьев мужчин-гомосексуалов также являются гомосексуалами. Для женщин-лесбиянок эта цифра составляет приблизительно 50%.

Осознание гомосексуализма как наследственной болезни возможно поможет решить как проблему гомофобии (плохо ненавидеть больных людей), так и проблему агрессивного гомосексуализма (эти люди требуют признания их здоровыми и полноценными, порой даже гордятся своей особенностью). Однако, если рассматривать гомосексуализм как болезнь, как патологию, ситуация кардинально меняется. Трудно представить себе человека, гордо стоящего с плакатом: «Я страдаю шизофренией, поэтому требую к себе уважения, как к полноценному члену общества!».

Согласно современным оценкам, продолжительность жизни человека, также связана с генетическими факторами, роль которых оценивается на уровне 65-70%.

Многочисленные и разнообразные данные позволяют утверждать, что геном определяет многое в нас, но и окружающая среда весьма заметно вмешивается в нашу сущность. Взаимосвязь между генами и окружающей средой ученые иногда сравнивают с заряженным пистолетом и курком. Пистолет не выстрелит, пока не будет нажат курок. Также обстоит ситуация и в клетке, где в качестве заряженного пистолета служит ген, а функцию курка выполняют всевозможные факторы окружающей среды. Имеется и другое сравнение - с карточной игрой: хороший игрок может выиграть и с плохими картами.

Чтобы разобраться в тех многочисленных взаимосвязях, которые существуют между проявлением отдельных вариантов генов и влиянием па этот процесс различных факторов окружающей среды, был создан специальный международный проект - The Environmental Genome Project. Среди множества задач данного проекта главной является, конечно же, изучение влияния окружающей среды па продолжительность жизни, а также на возникновение и развитие различных заболевании человека. В конечном итоге этот проект может оказаться не менее важным и сложным, чем знаменитый и очень дорогостоящий проект по секвенированию генома человека. А в том, что он будет продолжаться по времени значительно дольше, чем геномный проект, нет никакого сомнения.

В настоящее время изучение геномов не ограничивается только картированием генов, стало возможным изучать последовательность расположения нуклеотидов в составе любого гена. Решающим шагом на пути к решению этой проблемы явилось применение особых ферментов рестрикционных эндонуклеаз и разработка метода клонирования генов.

Рестрикционные эндонуклеазы (рестриктазы) ферменты, расщепляющие ДНК в специфических участках нуклеотидных последовательностей, которые они распознают. Эти ферменты обнаружены у многих бактерий. Они определяют и разрушают чужеродные молекулы ДНК, попадающие в клетку, в том числе при инфицировании их фагами или при трансформации. Таких ферментов обнаружено более 100, и каждый из них распознает в ДНК специфическую последовательность из 4 6 нуклеотидов. Каждая рестриктаза способна разрезать двойную спираль ДНК любой длины. При этом образуется серия фрагментов, называемых рестрикционными фрагментами. Сравнение размеров этих фрагментов, полученных при обработке бактериальных или плазмидных геномов (а также ДНК хромосом эукариот), позволяет создавать рестрикционные карты, в которых отмечается локализация каждого разреза участка относительно соседних участков других таких разрезов (рестрикций).

Существенно, что многие рестриктазы вносят разрывы в обе цепи ДНК со смещением на несколько нуклеотидов. Вследствие этого на конце нити одного фрагмента образуется участок, нуклеотидные последовательности которого оказываются комплементарными нуклеотидным последовательностям другой нити с другого конца фрагмента. Такие концевые последовательности, комплементарные друг другу, получили название липких концов. С их помощью образовавшиеся рестрикционные фрагменты будут вновь образовывать кольца в результате спаривания липких концов. Способность рестрикционных нуклеаз разрезать ДНК с образованием липких концов широко используется в технологии создания рекомбинантных ДНК, так как при помощи таких концов можно соединить два любых фрагмента ДНК, если они получены с помощью одной и той же рестриктазы и, следовательно, имеют комплементарные липкие концы. После замыкания последних путем образования комплементарных пар оснований образовавшееся кольцо из фрагментов разных ДНК можно сшить ковалентными фосфодиэфирными связями между противоположными концами каждой нити ДНК с помощью ДНК-лигазы. В этом заключается суть технологии получения рекомбинантных молекул ДНК.

Ранее всего был изучен геном бактериального вируса ФХ174. Е го ДНК состоит из 5400 нуклеотидов и содержит 9 генов. Вирус ФХ174 можно увидеть только с помощью электронного микроскопа, а запись его генетической информации, содержащейся в 9 генах, в виде линейной последовательности через буквы (А, Т, Г, Ц) занимает целую страницу текста. Запись в таком же виде информации, имеющейся в хромосоме животной клетки, составит книгу объемом более 500000 страниц!

Изучение генома человека началось в 80-х гг. XX в. В последующем была создана Международная организация по изучению генома человека HUGO (от англ. Human Genome Organization организация генома человека). Изучением генома человека занимаются ученые США, Японии, ряда стран Европы, России и др.

Основная задача определить последовательное расположение всех нуклеотидов (а их 3,5 109 пар) во всех 23 парах хромосом человека. Предстоит выяснить молекулярные основы наследственных болезней и определить пути их лечения рано или поздно генотерапия станет вполне реальной. Уже сейчас осуществляется ДНК-диагностика более 100 наследственных болезней. После открытия структуры ДНК, гена и расшифровки генетического кода осуществление программы «Геном человека» будет означать самую фундаментальную революцию в биологии и медицине.

Заключенного в клетке человека. Человеческий геном состоит из 23 пар хромосом, находящихся в ядре, а также митохондриальной ДНК. Двадцать две пары аутосом, две половые хромосомы Х и
Y, а также митохондриальная ДНК человека содержат вместе примерно 3,1 млрд пар оснований. У человека мужской пол является гетерогаметным и определяется наличием Y хромосомы. Нормальные диплоидные соматические клетки имеют 46 хромосом.
Секвенирование - это определение нуклеотидной последовательности избранного участка ДНК
Картирование - это создание схемы, описывающей порядок расположения генов на хромосоме
Метод «прогулки по хромосоме» - Метод выделения и анализа нуклеотидных последовательностей (новых генов), фланкирующих известные гены, для которых имеются олигонуклеотидные зонды; после выделения гена с фланкирующими его последовательностями эти последние используются в качестве зондов для выделения новых, прилегающих к ним последовательностей и т.д.; в результате “П.п.х.” с помощью перекрывающихся последовательностей нуклеотидов исследуются неизвестные протяженные участки генома, прилегающие друг к другу
Гибридизация ДНК - образование в опыте двухцепочечной ДНК или дуплексов
ДНК:РНК в результате взаимодействия комплементарных нуклеотидов. Метод гибридизации заключается в следующем: клонированную копию нужного гена помечают радиоактивной или флуоресцентной меткой.
Отмеченный таким образом, фрагмент ДНК называется ЗОНДОМ.
Полимеразная цепная реакция (ПЦР) – молекулярно-биологическая реакция, позволяющая быстро получить большое количество копий конкретного фрагмента ДНК.
Искомый фрагмент может быть частью очень сложной смеси нуклеиновых кислот.
Исходным материалом для ПЦР может быть даже единственная молекула ДНК.
Преимущества: Высокая специфичность; Высокая чувствительность; Возможность диагностики скрытых инфекций; Прямое определение наличия возбудителя; Высокая скорость получения анализа (4-5 часов)
Проблема клонирования человека - проблема этическая в ᴨȇрвую очередь. Человек вторгается в сферу бытия, за которую не ответственен в силу своей природы, что влечет непредсказуемость последствий таких шагов.
Проблемы генотерапии : В обозримом будущем влияние генотерапии ограничено лишь соматическими клетками (не зародышевыми). Трансген должен избирательно попасть в клетки определенной ткани , чему сейчас уделяется существенное внимание. Как только

1.Фундаментальные свойства живых систем. Проявление фундаментальных свойств
живого на основных эволюционно обусловленных уровнях организации жизни.
Фундаментальными свойствами живого являются: 1) Структурная организация; 2)
Отрицательная энтропия; 3) Открытая система; 4) Самообновление,
самовоспроизведение; 5) Раздражимость; 6) Адаптация; 7) Репродукция; 8)
Наследственность; 9) Изменчивость; 10) Индивидуальное развитие (онтогенез); 11)
Филогенетическое развитие; 12) Дискретность и целостность.
Структурная организация. Живые системы способны создавать порядок из хаотичного движения молекул, образуя определенные структуры. Для живого характерна упорядоченность в пространстве и времени. Это комплекс сложных саморегулирующихся процессов обмена веществ, протекающих в строго определенном порядке, направленном на поддержание постоянства внутренней среды - гомеостаза.
Открытая система. Живые организмы - открытые системы, совершающие постоянный обмен веществом и энергией с окружающей средой. При изменении условий среды происходит саморегуляция жизненных процессов по принципу обратной связи, направленная на восстановление постоянства внутренней среды - гомеостаза.
Самовоспроизведение. Самообновление. Время существования любой биологической системы ограничено. Для поддержания жизни происходит процесс самовоспроизведения, связанный с образованием новых молекул и структур, несущих генетическую информацию , находящуюся в молекулах ДНК.
Раздражимость. Все живое избирательно реагирует на внешние воздействия специфическими реакциями благодаря свойству раздражимости.
Адаптация - приспособление организма к внешним условиям в процессе эволюции, включая морфофизиологическую и поведенческую составляющие. Адаптация может обеспечивать выживаемость в условиях конкретного местообитания, устойчивость к воздействию факторов абиотического и биологического характера, а также успех в конкуренции с другими видами, популяциями, особями.
Размножение - присущее всем живым организмам свойство воспроизведения себе подобных, обеспечивающее непрерывность и преемственность жизни.
Наследственность. Молекула ДНК способна хранить, передавать наследственную информацию, благодаря матричному принципу репликации, обеспечивая материальную преемственность между поколениями.
Изменчивость. При передаче наследственной информации иногда возникают различные отклонения, приводящие к изменению признаков и свойств у потомков. Если эти изменения благоприятствуют жизни, они могут закрепиться отбором.
Онтогенез – процесс индивидуального развития организма, проходящий весь жизненный цикл, начиная от зиготы и до смерти.
Филогенез - историческое развитие организмов, или эволюция органического мира; можно говорить и о филогенезе тех или органов.
Дискретность и целостность. Любая биологическая система (клетка, организм, вид и т.д.) состоит из отдельных частей, т.е. дискретна. Взаимодействие этих частей образует целостную систему (например, в состав организма входят отдельные органы , связанные структурно и функционально в единое целое).
2. Профилактика наследственных заболеваний и болезней с наследственным
предрасположением. Пренатальная диагностика, ее методы и возможности.
Пренатальная диагностика --область медицины, которая занимается дородовым выявлением различных патологических состояний плода, в том числе, диагностикой врожденных пороков развития (ВПР) и наследственных заболеваний (НЗ).
Методы пренатальной диагностики:


ультразвуковой скрининг (динамическое наблюдение) развития плода и скрининг сывороточных факторов материнской крови считаются неинвазивными - т.е. не предусматривают хирургического вторжения в полость матки.

Другие же технологии (биопсия хориона или амниоцентез, например) являются инвазивными - т.е. предполагают хирургическое вторжение в полость матки с целью взятия плодного материала для последующего лабораторного исследования.
Биопсия хориона – данный метод проводится до 12 недели беременности. Суть метода: под контролем УЗИ аспирируется очень небольшое количество этой ткани хориона, имеющего плодное происхождение.
Риск осложнений после этой процедуры – 2%.
Кроме хромосомных и некоторых моногенных заболеваний можно определить еще и пол плода.
Процедуру проводят в амбулаторных условиях.
Плацентобиопсия –это малое оперативное вмешательство, позволяющее получить микроскопические кусочки тканей плаценты.
Показание: исключить грубую генетическую патологию плода.
Чаще всего такая необходимость возникает: у женщин старше 35 лет; у женщин, которые уже имеют ребенка с хромосомными аномалиями либо у которых они определялись при ранее возникавших беременностях; при наличии УЗИ-маркеров хромосомных болезней плода; при подтвержденной хромосомной аномалии у одного из родителей или близких родственников; при определении повышенного риска по результатам одного из скрининговых исследований.
Амниоцентез - пункция плодного пузыря с целью получения околоплодных вод.
Амниоцентез проводят обычно на 15-16 неделе беременности. Околоплодная жидкость исследуется на предмет выявления моногенной и хромосомной патологии плода.
Результаты исследования будут не ранее 2-6 недель от амниоцентеза.
Риск осложнений 0,5-1%.
Кордоцентез –пункция сосудов пуповины плода под контролем УЗИ с целью получения крови плода. Выполняют после 20-й недели беременности под наркозом. Взятая из пуповины кровь оценивается цитогенетическим, молекулярно-генетическим и биохимическим методами.
Результат исследования можно получить через 7-10 дней.
Риск прерывания беременности около 2%.
УЗИ-скрининг беременности – это проведение исследования по определенной схеме.
Данный метод диагностики должен проводиться абсолютно каждой женщине, готовящейся стать мамой.
Только качественное УЗИ может с большой степенью достоверности выявить или исключить у плода врожденные пороки развития.
В нашей стране законодательством установлены следующие сроки обязательного УЗИ скрининга, основанные на многолетнем опыте работы
11-13 недель
20-22 недели
30-34 недели
Первый скрининг проводится не ранее 10 и не позже 14 недель беременности. Это продиктовано тем, что данные сроки оптимальны для выявления грубых пороков развития и определенных показателей, настораживающих в плане генетических отклонений и заболеваний.

Созданного 4 года назад с целью максимально полной расшифровки информации, закодированной в геноме человека, сообщили о завершении первого этапа работы. Более 300 исследователей из США и других стран провели детальный анализ структуры и функции одной сотой части человеческого генома (30 млн пар оснований из 3 млрд). В клетках человека обнаружено неожиданно большое разнообразие транскриптов — молекул РНК, синтезированных на матрице геномной ДНК. Выяснилось, что первичному прочтению (транскрипции) подвергается 80% генома, несмотря на то, что кодирует белки лишь 2% генома. Этот и другие результаты говорят о том, что механизмы функционирования генома сложнее, чем принято считать, и сам «язык», на котором записана наследственная информация, нам еще не до конца понятен.

Хотя геном человека был объявлен «прочтенным вчерне» еще в 2000-2001 гг., а в 2003-2004 гг. заговорили о «почти совсем полном прочтении», наука по-прежнему далека от полного понимания закодированной в геноме информации. Для решения этой глобальной задачи в 2003 году Национальным институтом по изучению генома человека (National Human Genome Research Institute, NHGRI) был запущен проект ENCODE (Enc yclopedia o f D NA E lements), объединивший сотни ученых и десятки научных коллективов из США и других стран.

Задача-максимум, стоящая перед участниками проекта, состоит в том, чтобы выяснить, зачем нужен и что кодирует каждый из 3 млрд нуклеотидов человеческого генома. Причем выяснить не только теоретически, in silico (путем компьютерного анализа последовательностей ДНК), но и подтвердить результаты экспериментально. До решения этой задачи, разумеется, еще очень далеко. Пока же ученые отрапортовали о завершении первого этапа работы, целью которого была в основном отработка методик и проба сил.

Ученые использовали весь обширный арсенал средств и методов современной генетики, геномики и молекулярной биологии. В частности, широко использовалось сравнение человеческого генома с геномами других млекопитающих (см.: Геном макака резуса расскажет об эволюции человека , «Элементы», 19.04.2007; Прочтение генома опоссума доказало ключевую роль транспозонов в эволюции млекопитающих , «Элементы», 13.05.2007). Такое сравнение позволяет выявить «консервативные», то есть схожие у разных видов участки генома. Консерватизм обычно свидетельствует о функциональной важности данного участка (см.: Сравнение геномов человека и мыши помогло обнаружить новый способ регуляции работы генов , «Элементы», 21.04.2007).

Но главным «коньком» проекта ENCODE является тотальный анализ транскриптома , то есть тех молекул РНК, которые синтезируются клеткой на матрице геномной ДНК в ходе транскрипции — «прочтения» генетической информации. Напомним, что информация, закодированная в классических белок-кодирующих генах, реализуется в два этапа: сначала на матрице ДНК синтезируется РНК (транскрипция), затем на матрице РНК синтезируется белок (трансляция).

Ранее уже было известно, что только 2% генома человека кодируют белки. Лишь эти два процента генетического «текста» подвергаются не только транскрипции, но и трансляции. Было известно и то, что транскрипции подвергаются также и многие нетранслируемые участки генома. Это, во-первых, гены функциональных РНК (транспортных, рибосомных и разнообразных регуляторных), во-вторых — интроны, некодирующие «вставки», имеющиеся в большинстве белок-кодирующих генов. Перед трансляцией интроны вырезаются из молекул РНК (это называется сплайсингом). Одно из главных достижений проекта ENCODE состоит в том, что наконец удалось выяснить, какая доля геномной ДНК подвергается транскрипции в человеческих клетках. Оказалось — целых 80%, гораздо больше, чем предполагалось. До начала выполнения проекта было известно, что в той сотой части генома, которую предстояло изучить, есть 8 генов нетранслируемых РНК. Оказалось, что в действительности их тысячи.

Исследователи пока не могут точно сказать, какую функцию выполняют все эти транскрипты. Не исключено, что некоторые из них не выполняют никакой специальной функции и являются всего лишь побочным продуктом деятельности ферментов РНК-полимераз — деятельности, которая, вероятно, является отчасти хаотической (о хаотических аспектах работы некоторых белков см.: Работу регуляторного белка впервые пронаблюдали под микроскопом , «Элементы», 31.05.2007; Разгадан механизм движения «шагающего белка» , «Элементы», 29.05.2007). Но многие из обнаруженных транскриптов все-таки зачем-то нужны. Это подтверждается тем, что в них имеются консервативные участки, почти одинаковые у человека и мыши.

Изучение транскриптов, считанных с обычных белок-кодирующих генов, тоже преподнесло сюрпризы. Всего в пределах изученного участка генома находится 400 таких генов. Более чем у 80% из них анализ транскриптов выявил наличие неизвестных ранее функциональных фрагментов — экзонов (экзонами, в отличие от интронов, называют те участки гена, которые кодируют белок). Некоторые из этих экзонов, как выяснилось, находятся в геномной ДНК на расстоянии тысяч пар нуклеотидов от всех остальных экзонов того же гена, иногда они даже оказываются внутри другого гена. То, что гены высших организмов состоят из кодирующих кусочков-экзонов, разделенных некодирующими вставками-интронами, было известно давно, но никто не знал, что экзоны многих человеческих генов находятся так далеко друг от друга и так причудливо разбросаны. Более того: были обнаружены транскрипты, содержащие экзоны двух разных генов.

Всё это заставляет признать, что мы до сих пор не очень хорошо представляем себе, что же такое ген и как он работает. Некоторые из участников проекта позволили себе даже высказаться в прессе в том смысле, что, мол, ген — понятие отчасти устаревшее, а на самом деле фундаментальными единицами генома являются транскрипты (как сказал кто-то из теоретиков — «мы до сих пор живем в мире РНК»). Другие не согласны с этим: по их мнению, ген остается центральным объектом молекулярной биологии, только вот определение этого понятия нужно подкорректировать.

В ходе выполнения проекта исследователи разработали целый ряд новых методик, которые пригодятся им в дальнейшем — например, научились гораздо лучше искать регуляторные участки ДНК, в том числе сайты начала транскрипции (промоторы) — последовательности нуклеотидов, сигнализирующие РНК-полимеразам о том, что в этом месте следует начинать транскрипцию. До начала выполнения проекта ENCODE в этой части генома человека было известно 532 промотора, сейчас их уже 775, и вдобавок много предположительных, ожидающих экспериментального подтверждения.

Назовем еще некоторые из полученных результатов:

Гистоны — специальные белки, на которые «наматывается» геномная ДНК в клеточном ядре — определенным образом модифицируются вблизи сайтов начала транскрипции и других регуляторных элементов; по характеру этих модификаций можно даже предсказывать наличие тех или иных регуляторных элементов в данном участке ДНК.

Примерно 5% нуклеотидов в геноме млекопитающих безусловно находятся под действием стабилизирующего (очищающего) отбора, иными словами, они консервативны — темп их эволюционных изменений сильно замедлен.

Для 60% этих консервативных оснований имеются экспериментальные подтверждения наличия функции — то есть они действительно зачем-то нужны, что-то кодируют.

Многие фрагменты ДНК с экспериментально подтвержденной функциональной ролью не являются, однако, эволюционно консервативными — последовательность нуклеотидов в них быстро менялась в ходе эволюции млекопитающих. По-видимому, многие из этих участков кодируют функции, не являющиеся жизненно важными. Такие участки могут служить хорошим «материалом для отбора». Кстати, сами исследователи именно этот результат считают наиболее неожиданным: раньше думали, что практически всё функциональное в геноме должно быть консервативным.

Функциональные фрагменты ДНК имеют разную степень вариабельности в пределах человеческой популяции: одни из них почти одинаковы у всех людей, другие могут очень сильно различаться.

Стоимость первого этапа исследований составила $42 млн. На продолжение работы NHGRI намерен выделять $23 млн ежегодно. Предполагается, что через 4 года весь геном человека будет подвергнут столь же глубокому анализу, как и изученная на сегодняшний день сотая часть. Ускорение и удешевление процесса будет обеспечено за счет новых методик, разработанных участниками проекта.

Источники:
1) The ENCODE Project Consortium. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project (полный текст — Pdf, 4,5 Мб) // Nature . 2007. V. 447. P. 799-816.
2) Elizabeth Pennisi. DNA Study Forces Rethink of What It Means to Be a Gene // Science . 2007. V. 316. P. 1556-1557.

Об исследованиях генома человека см. также:
1) Проект «Геном человека» .
2) Эволюция человека сопровождалась изменением активности генов-регуляторов , «Элементы», 13.03.2006.
3) Люди отличаются от шимпанзе не тем, чем хотели , «Элементы», 30.11.2006.
4) Будут ли расшифрованы генетические основы разума? , «Элементы», 09.10.2006.
5) Почему шимпанзе не болеют раком , «Элементы», 08.02.2006.

1. Геном, клонирование, происхождение человека. – Под ред. Л.И. Корочкина. – Фрязино: «Век 2», 2004. – 224 с.

2. Вымершие звери и птицы, которых проще всего клонировать. – Электронный ресурс. – 2013.

3. Андреева, Л.Е., В.З. Тарантул. Трансгенные животные: фундаментальные и прикладные аспекты / Л.Е. Андреева, В.З. Тарантул // Проблемы и перспективы молекулярной генетики. Том 1 / Отв. ред. Е.Д.Свердлов. – М.: Наука, 2003. – С. 184 – 217.

4. Клонирование человека. Вопросы этики. – Париж, Изд-во ЮНЕСКО, 2004. – 21 с.

Тема № 4. Современные методы исследования генома

Краткое содержание:

1. Классический подход к расшифровке последовательностей ДНК

2. Принцип высокопроизводительного пиросеквенирования ДНК

3. Достижения и перспективы секвенирования

4. Использование методов биоинформатики в секвенировании

5. История прочтения генома человека

Невозможно представить себе современную биологию (не только молекулярную биологию и биохимию, но и систематику, теорию эволюции, антропологию, медицину) без мегабайтов прочитанных последовательностей ДНК, этой плоти и крови биоинформатики , самой динамично развивающейся области биологической науки. Успех в этой области был достигнут в конце ХХ в. благодаря прорыву в создании технических устройств и технологий расшифровки геномов. Определение последовательностей нуклеотидов в молекуле ДНК получило название секвенирования (от англ. sequence – последовательность), а приборы, предназначенные для этой цели, именуются секвенаторами .

1. Классический подход к расшифровке последовательностей днк

Самый распространенный на сегодняшний день способ секвенирования ДНК - «метод терминации цепи », или «дидезокси метод », разработанный в 70-х гг. прошлого века Фредериком Сэнгером (дважды лауреат Нобелевской премии по химии: за определение аминокислотной последовательности инсулина (1955 г.) и за разработку метода секвенирования ДНК (1980 г.)). Дешевизна, точность, а также сравнительная простота автоматизации делает этот метод своеобразным «золотым стандартом » среди всех существующих способов определения последовательности нуклеотидных остатков ДНК. Так был расшифрован весь геном человека, и именно метод Сэнгера до сих пор является рутинным в повседневной лабораторной практике.

амплифицируются

Вначале фрагменты ДНК, последовательность которых предстоит определить, многократно копируются (амплифицируются ), затем нарезаются на короткие куски, которые служат матрицей для синтеза комплементарных цепей ДНК. Синтез в общих чертах напоминает процесс копирования ДНК в живой клетке.

Особенность метода заключается в использовании химически модифицированных разновидностей четырех дезоксирибонуклеотидов , составляющих цепи ДНК. Каждая разновидность «помечена» флуоресцентной молекулой-маркером, на жаргоне «краской». Короткий фрагмент ДНК, называемый затравкой, или праймером , инициирует синтез ДНК в определённой точке цепи ДНК-матрицы. Синтезирует комплементарную цепь особый фермент - ДНК-полимераза . При этом флуоресцентно меченные разновидности нуклеотидов, которые присутствуют в реакционной смеси в значительно меньших количествах, чем обычные нуклеотиды, обрывают синтез, когда один из них оказывается на конце растущей ДНК-цепи. (Все дело в том, что видоизмененные нуклеотиды не имеют той самой химической группы, к которой должен присоединяться следующий нуклеотид для продолжения цепи.) В результате получается смесь, содержащая полный набор ново-синтезированных фрагментов ДНК, каждый из которых начинается в одном и том же месте, но заканчивается во всех возможных положениях вдоль цепи ДНК-матрицы.

Современные автоматизированные секвенаторы разделяют эти фрагменты, пропуская всю смесь через тончайшие капилляры, наполненные гелем. Чем короче фрагмент, тем быстрее он движется в геле по капилляру под действием электрического поля. (Фрагменты ДНК - по сути, ионы, движущиеся в электрическом поле от «минуса» к «плюсу».) Процесс, называемый капиллярным электрофорезом , настолько эффективен, что фрагмент, только что вышедший из капилляра, оказывается ровно на один нуклеотид длиннее, чем предшествующий ему. По мере того как фрагмент появляется, он освещается лазером, что заставляет светиться меченый нуклеотид на его конце. Компьютер определяет разновидность этих нуклеотидов по цвету вспышки и регистрирует последовательность их появления, складывая «буквы» (нуклеотиды) в «текст» (последовательность ДНК). В случае расшифровки целого генома так нарабатываются миллиарды коротких «текстов», которые поступают в специальную программу, запускаемую на суперкомпьютерах. Программа находит места перекрывания «текстов» и, располагая их в нужном порядке, выстраивает полную последовательность генома.

Большинство новых технологических разработок направлено на миниатюризацию , мультиплексирование (в данном случае, параллельное соединение низкопроизводительных блоков системы для повышения общей производительности) и автоматизацию процесса секвенирования. Все они могут быть разделены на два класса. Первый объединяет методы «секвенирования синтезом», в которых основания определяются по мере того, как они встраиваются в растущую цепь ДНК.

Ко второму классу относятся технологии расшифровки последовательности оснований единичной молекулы ДНК. Некоторые из них достаточно экзотичны - как, например, чтение нуклеотидных остатков ДНК электронным или оптическим способом по мере того, как молекула «протискивается» через нанопору . Длинный перечень улучшений системы капиллярного электрофореза в сочетании с возрастающей автоматизацией и усовершенствованием программного обеспечения позволили снизить стоимость секвенирования в 13 раз с тех пор, как первые автоматические секвенаторы появились в 90-е годы.

Но все это выглядит несколько бледно на фоне возможностей нового метода секвенирования синтезом - изощрённого варианта пиросеквенирования, разрабатываемого и внедряемого компанией 454 Life Sciences.

2. Принцип высокопроизводительного пиросеквенирования ДНК

Технология, разработанная компанией 454 Life Sciences, называется пирофосфатным секвенированием, или пиросеквенированием . Сама идея пиросеквенирования, надо сказать, не нова: она возникла ещё в начале 90-х годов прошлого века, но опубликованный тогда метод не сумел вытеснить традиционный дидезокси метод Сэнгера. Однако разработчики из 454 Life Sciences дополнили его возможностями современных нанотехнологий, и количество перешло в качество. Поэтому, точнее будет назвать метод «пиросеквенированием ДНК в плотно упакованных пиколитровых реакторах».

Скорость является одним из главных преимуществ нового метода секвенирования. Название метода заимствовано у знаменитого на Западе автомобиля Chevrolet Chevelle SS 454 1970-го года с двигателем мощностью 360 лошадиных сил.

Весь геном, все его молекулы ДНК, случайным образом фрагментируются на кусочки по 300–500 пар оснований. Затем комплементарные цепи фрагмента разделяются, к каждой цепи фрагментов пришивается одинаковый для всех олигонуклеотид-«адаптер », который позволяет отдельным цепям налипать на пластиковые бусинки . (Последовательность этого олигонуклеотида позволяет позднее в процессе секвенирования распознавать ДНК-матрицу.) При этом смесь разъединённых на комплементарные цепи фрагментов разбавляют таким образом, что каждая бусинка получает лишь по одной (!) индивидуальной цепи.

Каждая бусинка оказывается заключённой в капельку, окруженную маслом и содержащую смесь для осуществления полимеразной цепной реакции (ПЦР), которая и проходит отдельно в каждой капельке эмульсии (так называемая эмульсионная ПЦР , эПЦР). Это приводит к «клональной амплификации» цепей ДНК, а говоря по-русски, к тому, что на поверхности бусинки удерживается уже не одна, а около 10 млн копий («клонов») уникальной ДНК-матрицы.

Далее эмульсия разрушается, вновь двуцепочечные фрагменты ДНК (образовавшиеся в ходе ПЦР) разделяются, и бусинки, несущие одноцепочечные копии ДНК-матрицы, помещаются в лунки «предметного стекла » - слайда особой конструкции. Каждая лунка такого слайда образует отдельный пиколитровый «реактор» , в котором и будет происходить реакция секвенирования.

Слайд представляет собой срез блока , полученного путём нескольких циклов вытягивания и сплавления оптических волокон. В результате каждого цикла диаметр индивидуальных волокон уменьшается по мере того, как волокна формируют пучки шестигранной упаковки увеличивающегося поперечного диаметра. Каждое волокно имеет сердечник диаметром 44 мкм, окружённый 2–3 мкм слоем оболочки. Затем сердечники вытравливаются, и в результате получаются лунки ≈55 мкм глубиной, с расстоянием ≈50 мкм между центрами соседних лунок. Объём таких «реакторов» - 75 пиколитров; плотность размещения на поверхности слайда - 480 лунок на квадратный миллиметр. Каждый слайд несёт около 1,6 миллионов лунок, в каждую из которых попадает одна (!) бусинка с ДНК-матрицей. Слайд помещается в проточную камеру таким образом, что над отверстиями лунок создаётся канал высотой 300 мкм, по которому в лунки поступают необходимые реактивы.

Доставляемые в проточную камеру реактивы текут в слое, перпендикулярном оси лунок. Такая конфигурация позволяет одновременно осуществлять реакции на бусинках, несущих ДНК-матрицы, внутри отдельных лунок. Добавление и удаление реагентов и продуктов реакции происходит за счёт конвекционного и диффузионного переноса. Время диффузии между потоком и лунками составляет около 10 секунд и зависит от высоты проточной камеры и глубины лунок. Глубина лунок тщательным образом рассчитана исходя из следующих соображений:

1. Лунки должны быть достаточно глубокими, чтобы бусинки, несущие ДНК-матрицу, не выскакивали из них под действием конвекции.

2. Они должны быть достаточно глубокими, чтобы исключить диффузию продуктов реакции из лунок, где имело место включение нуклеотида, в лунки, где включения не произошло.

3. Лунки должны быть мелкими настолько, сколько требуется для осуществления быстрой диффузии нуклеотидов в лунку и быстрого вымывания оставшихся нуклеотидов и продуктов реакции в конце каждого цикла, что, в свою очередь, необходимо для обеспечения высокой продуктивности секвенирования и снижения расходов реактивов.

Помимо бусинок с ДНК-матрицей, в каждую лунку «насыпают» ещё бусинок помельче - каждая с «сидящими» на её поверхности (иммобилизованными ) ферментами , необходимыми для пирофосфатного секвенирования. Нуклеотиды (одного вида за раз) и другие реактивы, необходимые для реакции секвенирования, подаются последовательно в проточную камеру, куда помещается слайд.

Каждый раз, когда определённый нуклеотид встраивается в растущую цепь ДНК в какой-нибудь из лунок, в ней высвобождается молекула пирофосфата , которая, в свою очередь, является необходимым предшественником компонента другой ферментативной реакции. Её катализирует особый фермент, люцифераза светлячка Photinus pyralis. Но для её осуществления необходим аденозинтрифосфат (АТФ). Новообразованный пирофосфат превращается в лунке в АТФ под действием ещё одного фермента - АТФ-сульфурилазы . И тогда люцифераза окисляет люциферин до оксилюциферина, а эта реакция сопровождается хемилюминесценцией - по-простому, маленькой вспышкой света. Дно слайда находится в оптическом контакте с оптико-волоконным световодом, подключённым к прибору с зарядовой связью (CCD-сенсор, charge coupled device ). Это позволяет регистрировать излучаемые фотоны со дна каждой индивидуальной лунки, в которой произошло встраивание известного нуклеотида. Общая схема пиросеквенирования дана на рис. 1.

Связывая зарегистрированные от каждой лунки вспышки с типом нуклеотида, присутствующего в проточной камере в данный момент времени, компьютер последовательно отслеживает рост цепочек ДНК в сотнях тысяч лунок одновременно. Время, необходимое для протекания ферментативной реакции, производящей детектируемую «вспышку», составляет порядка 0,02–1,5 секунд. Таким образом, скорость реакции определяется скоростью массопереноса, что оставляет место для улучшений за счёт ускорения доставки реактивов. После поступления в проточную камеру каждого нуклеотида, она промывается раствором, содержащим фермент апиразу . Таким образом, перед тем как «запустить» в камеру следующий нуклеотид, из всех лунок удаляются любые нуклеотиды, остававшиеся там от предыдущего раунда.

Включение того или иного нуклеотида детектируется в результате высвобождения неорганического пирофосфата и последующего излучения света. Определить лунки, содержащие бусинки с матричной цепью ДНК, можно, прочитав «последовательность - ключ» адаптерного олигонуклеотида, пришитого к началу каждой ДНК-матрицы. Из регистрируемого сигнала вычитается уровень фона, затем сигнал нормализуется и корректируется.

Интенсивность нормализованного сигнала для каждой конкретной лунки во время поступления в проточную камеру определённого нуклеотида пропорциональна числу встроенных нуклеотидов. Линейность зависимости сохраняется для гомополимеров длиной как минимум в восемь нуклеотидов. При таком секвенировании синтезом очень небольшое число ДНК-матриц на каждой бусинке теряет синхронизм , т. е. вырываются вперёд или начинают отставать от других матриц. Исправление таких сдвигов необходимо, поскольку потеря синхронизма создаёт кумулятивный эффект , сильно снижающий качество прочтения при увеличении его длины. С учетом этого, сотрудники компании 454 разработали особый алгоритм, позволяющий оценивать и вносить поправки на «перелёт» и неполную достройку цепи, происходящие в отдельных лунках. Высокая точность расшифровки последовательности достигается тем, что система осуществляет многочисленное прочтение одного и того же фрагмента, что позволяет построить единую обобщённую (так называемую консенсусную ) последовательность.

Отдельные прочтения (риды – от англ. reаd, читать) одного и того же участка ДНК выравниваются относительно друг друга исходя из интенсивности сигналов в момент протекания через камеру того или иного нуклеотида, а не на основе последовательности этих прочтений. Затем соответствующие сигналы усредняют, и только тогда записывают полученную последовательность. Такой подход значительно улучшает качество расшифровки последовательности и предоставляет возможность оценки её качества.

В 2005 г. учёные из 454 Life Sciences, используя свою технологию, сумели расшифровать состоящий из 600 тысяч нуклеотидов геном бактерии Mycoplasma genitalium с точностью 99,4%, а также состоящий из 2,1 млн нуклеотидов геном Streptococcus pneumoniae .

Рисунок 1 - Схема пиросеквенирования. А - ДНК фрагментируется, к фрагментам пришиваются олигонуклеотиды-«адаптеры»; полученные двуцепочечные молекулы ДНК разделяются на две комплементарные цепи. Б - Одноцепочечные молекулы ДНК прикрепляются к бусинкам в условиях, стимулирующих попадание лишь одной молекулы на бусинку. Отдельные бусинки заключаются в капли реакционной смеси, окруженные маслом. Количество молекул на бусинке увеличивается в миллионы раз в результате эмульсионной полимеразной цепной реакции (эПЦР). В - Эмульсия разбивается, и цепи ДНК-фрагментов, образовавшиеся в результате эПЦР, разделяются. Бусинки, несущие на своей поверхности миллионы одноцепочечных копий первоначального фрагмента ДНК, помещаются в лунки оптико-волоконного слайда, по одной в каждую лунку. Г - В каждую лунку добавляются бусинки поменьше, несущие на своей поверхности ферменты, необходимые для пиросеквенирования. Д - Микрофотография эмульсии, изображающая «пустые» капли и капли, содержащие бусинки с ДНК-матрицей. Толстая стрелка указывает на 100-мкм каплю, тонкая - на 28-мкм бусинку. Е - Микрофотография фрагмента оптико-волоконного слайда, полученная при помощи сканирующего электронного микроскопа. Видны оболочки оптических волокон и пустые лунки

В статье, в которой впервые был представлен и опробован новый метод, сообщается, что весь геном Mycoplasma genitalium был прочтён за один раз! Сначала весь геном был фрагментирован и превращён в библиотеку кусочков ДНК, как описано выше (труд одного человека на протяжении 4-х часов). После проведения эмульсионной ПЦР и помещения полученных бусинок с ДНК-матрицами на 60 мм 2 слайд (на что одному сотруднику потребовалось 6 часов), процесс завершился 4-х часовой автоматической работой инструмента, состоящей из 42 циклов.

В результате сборки прочитанных последовательностей (каждый около 108 пар оснований) было получено 25 отдельных непрерывных фрагментов, так называемых контигов (от англ. contigious –соприкасающийся), средней длиной в 22,4 тысяч пар оснований. Эти фрагменты покрыли около 96,54% всего генома микоплазмы. Из оставшихся непрочтёнными 4,6% генома, 3% приходились на неразрешимые повторы . Таким образом, за один раз было отсеквенировано 99,5% уникальной последовательности генома.

3. Достижения и перспективы секвенирования

Хотя первая версия инструмента от компании 454 Life Sciences легко могла заменить более 50 капиллярных секвенаторов Applied Biosystem 3730XL по цене в шесть раз меньшей, реакция научного сообщества была на удивление прохладной. Вместо того чтобы принять новую технологию и начать использовать её неисчерпаемый потенциал, многие учёные, привыкшие к использованию метода Сэнгера, заговорили о таких проблемах, как точность расшифровки, длина отдельных прочтений, стоимость инфраструктуры... А кто-то просто восставал против необходимости работать с большими массивами информации, производимыми с использованием новой технологии.

Большинство критиков, однако, не заметили, что множество препятствий, стоящих на пути метода секвенирования следующего поколения, преграждали на первых порах путь и методу Сэнгера. Тогда длина прочтений составляла всего 25 пар оснований, и достигла 80 только после появления терминирующих дидезокси-нуклеотидов Фреда Сэнгера. Технология «секвенирования синтезом», основанная на выделении пирофосфата, изначально позволяла прочитывать отрезки длиной не более 100 нуклеотидов. Спустя 16 месяцев на биотехнологическом рынке, этот показатель был улучшен до 250 пар оснований. Последние разработки позволяют считывать уже около 500 пар оснований, приближая новый метод к методу Сэнгера с его ≈1000 нуклеотидами.

Другим важным фактором, помимо длины отдельных прочтений, является число прочтений , производимое в результате одного «прогона » секвенатора, нормированное на стоимость такого «прогона». Этот вопрос хорошо решается конкурентами 454 Life Sciences, системы которых производят в десять раз больше прочтений, платя за это укорочением их длины, составляющей всего 35 (или меньше) нуклеотидов. Сегодня на рынке существует три коммерческих системы нового поколения для секвенирования ДНК:

Roche (454) GS FLX Genome Analyzer, распространяемый Roche Applied Sciences. (Компания 454 LIfe Sciences выкуплена гигантом Roche Diagnostics в марте 2007 г. за 154,9 млн. долларов, но продолжает оставаться независимым подразделением);

Секвенатор Illumina Solexa 1G и

Наиболее свежая система SOLiD от Applied Biosystems.

Другие системы для расшифровки ДНК, которые уже появились на рынке, относятся к «третьему поколению » и основываются на анализе одиночных молекул. Они разрабатывались компаниями VisiGen и Helicos.

И хотя прочтение бактериального генома за раз было впечатляющим достижением, поначалу не было ясно, какие биологические задачи , недоступные старому доброму методу Сэнгера, можно будет решать, взяв на вооружение новый метод пиросеквенирования. И действительно, первые проекты с участием инструмента Roche 454 GS20 заключались лишь в «перечитывании» уже расшифрованных бактериальных геномов и подкреплении дополнительными данными уже идущих больших «Сэнгеровских проектов». В то же время исследования в области метагеномики , помимо работы с огромными массивами данных, порою бóльшими, чем геном человека, страдали от искажений, вносимых на стадиях конструирования библиотек и клонирования фрагментов для секвенирования.

В этом смысле технология 454, сочетающая эПЦР и пиросеквенирование, обладает неоспоримым преимуществом перед методом Сэнгера. Эмульсионная ПЦР позволяет амплифицировать без всяких предпочтений единичные молекулы ДНК, заключая их в капельку эмульсии и устраняя конкуренцию со стороны других ДНК-матриц за ограниченное число ДНК-полимераз. Пиросеквенирование, в свою очередь, осуществляет параллельное прочтение этих матриц со световым сигналом на выходе, который может считываться компьютером. Первые подобные исследования, опубликованные в 2006 году, показали необыкновенную гибкость метода нового поколения, использованного при изучении микробного многообразия подземных экосистем глубокой шахты, глубоководных морских экосистем, морских вирусных «сообществ» («виромов ») в нескольких океанах.

Интересное исследование, сочетающее в себе метагеномный анализ и «ДНК-палеонтологию », было проведено в конце 2005 г. Одного запуска инструмента Roche (454) GS20 было достаточно для анализа 13 млн. пар оснований последовательности генома 28 000-летнего мамонта . Эта работа проложила дорогу для технически более трудного проекта расшифровки генома неандертальца . Трудность такого проекта состоит в том, что количество выделяемой из образцов костей древней ДНК неандертальца составляет всего лишь 5% от количества, получаемого из «свежего материала». Следовательно, секвенировать приходится в 20 раз дольше, чем это необходимо для генома современного человека. Кроме того, вклад разрушения ДНК в образцах, сохраняемых при умеренных температурах, в сочетании с ошибками, присущими новому методу пиросеквенирования, часто превосходит уровень различия, установленный для геномов неандертальца и современного человека. Поэтому утверждать, что полученная последовательность действительно древняя, а не случайно попавшая в препарат современная ДНК, значительно легче в случае с мамонтом - современные слоны, в отличие от людей, не часто встречаются в лабораториях. Для того чтобы получить настоящую последовательность древнего генома млекопитающего, необходимо провести множество раундов прочтения каждого участка генома, а также удостовериться в происхождении прочитанных участков.

Вместе с прорывом в области секвенирования сложных смесей ДНК, такие проекты сделают возможным изучение любой экосистемы на планете на уровне последовательностей ДНК. Это откроет доступ к флоре и фауне 100-тысячелетней давности - возможности, превосходящие самые смелые ожидания совсем недалекого прошлого.

На клеточном уровне секвенирование нового поколения (здесь и далее речь идёт не только о пиросеквенировании, но и о других новых методах секвенирования синтезом) впервые позволяет учёным идентифицировать мутации в любом организме для всего генома. Так были найдены аллели, отвечающие за устойчивость к антибиотику у Mycobacterium tuberculosis , а также идентифицированы все мутации в геноме размером в 9 млн пар оснований у штамма бактерии, эволюционировавшей на протяжении 1000 поколений. Эти ранние попытки не только продемонстрировали способность новой технологии обнаруживать мутации и ошибки в опубликованных научных статьях, но и связанные с её использованием трудности, такие как ошибки прочтения гомополимерных последовательностей при пиросеквенировании (454) или быстрое уменьшение качества прочтения ближе к 3’-концу последовательности в системах с короткой длиной индивидуальных прочтений (Solexa или SOLiD от Applied Biosystem).

Раньше для преодоления этих трудностей данные, полученные пиросеквенированием, дополняли информацией, полученной классическим сэнгеровским путём. Но поскольку стоимость и затраты, требуемые сэнгеровской составляющей эксперимента, остаются отталкивающе высокими, многие лаборатории сегодня полагаются только на методы нового поколения, обычно сочетая относительно длинные прочтения пиросеквенирования с короткими, но дешевыми (а значит, и многочисленными) прочтениями, осуществляемыми системами Solexa и SOLiD. Такое сочетание различных платформ позволяет производить независимую оценку качества их работы, а также проверять эталонные последовательности, хранящиеся в общественных базах данных.

Получение большого количества последовательностей ДНК из различных близкородственных организмов движет вперед и развивает подход, названный повторным секвенированием (resequencing), в котором работа с последовательностями ведётся иначе, чем при сборке свежесеквенированного генома. При повторном секвенировании сборка направляется уже имеющейся под рукой эталонной последовательностью, и поэтому требует значительно меньшего покрытия (8–12-ти кратного), чем при сборке генома de novo (25–70-ти кратного). Этот подход был применён в работе по расшифровке 10 митохондриальных геномов млекопитающих, которая сделала возможными исследования в области генетики популяций, основанные не на коротких отрезках последовательности, а на полных геномах митохондрий. В настоящий момент многочисленные проекты по расшифровке микробных геномов ведутся не только для расширения списка доступных геномов, но и для проведения будущих сравнительных исследований, сопоставляющих генотип и фенотип организма на геномном уровне.

Далеко может продвинуться также и работа по изучению организмов, которые не стоят в планах по геномному секвенированию - благодаря возможностям новых методов секвенирования напрямую расшифровывать последовательности транскриптов (точнее, кДНК - ДНК-копий матричных РНК) в клетке. Изучение транскриптов посредством прямого секвенирования обладает рядом преимуществ перед методом гибридизации на ДНК-микрочипах. Главное здесь то, что секвенирование не требует никаких знаний о геномной последовательности организма a priori , поскольку последовательность транскрипта может быть немедленно сравнена с эталонной последовательностью близкородственного вида из базы данных, используя стандартные алгоритмы биоинформатики. Знание последовательностей транскриптов может в корне изменить исследования организмов, геномы которых сегодня не стоят в очереди на расшифровку, а в некоторых случаях никогда там и не окажутся. Первые работы в этой области показали, что существует возможность сопоставлять последовательности (кДНК и геномные, соответственно) двух таких далёких друг от друга видов, как бобовое Meticago truncatula и растение-эталон Arabidopsis thaliana . Также было обнаружено множество не описанных ранее транскриптов кукурузы Zea mays .

Прямой анализ транскриптов поможет обойти проблему, которую ставят перед учёными организмы с непомерно большими геномами. Несмотря на успешно проведённые проекты по расшифровке вирусных, бактериальных и больших геномов млекопитающих, метод Сэнгера оставил задачу по расшифровке геномов полиплоидных растений своим преемникам. Эти гигантские геномы, частенько принадлежащие важным хозяйственным растениям (например, геном пшеницы составляет 16 млрд пар оснований), делали все предыдущие попытки по расшифровке бесплодными. Однако перспектива дешёвого секвенирования экспрессируемых участков генома (то есть транскриптов) позволяет надеяться на успешное изучение геномов таких растений хотя бы на функциональном уровне.

И наконец, новые методы секвенирования имеют практическое применение и в медицине. Например, в генетике раковых заболеваний, специфические раковые аллели могут быть отслежены в тканях посредством высокопроизводительного секвенирования геномной ДНК в тех случаях, когда метод Сэнгера терпит поражение. И здесь большим преимуществом нового метода оборачивается многократное прочтение последовательности.

Несмотря на то, что новые методы секвенирования ДНК уже стимулировали большое количество всевозможных исследований, осуществление которых было невозможно ещё в недалёком прошлом, учёным и инженерам, занимающимися разработкой этих технологий - а равно как и компаниям, продвигающим эти технологии на рынке, - предстоит многое сделать для её улучшения. Прежде всего, снизить стоимость . Уменьшение цены на один-два порядка необходимо для осуществления надежд на персональную геномику , цель которой - повторное секвенирование индивидуальных геномов по цене, не превышающей 1000 долларов. В дополнение к этому, снижение процента ошибок будет также горячо приветствоваться - не только для методов следующего поколения, но и для метода Сэнгера, который будет продолжать вносить вклад и в обозримом будущем. Возможно, появятся искусственно изменённые специализированные ДНК -полимеразы , предоставляющие информацию о последовательности ДНК в виде испускаемого светового сигнала. По мере того, как стоимость технологий будет снижаться, количество накапливаемой информации будет расти лавинообразно, что может создать «узкое место» в исследованиях. Поэтому часть усилий по разработке новых технологий секвенирования необходимо направить на развитие биоинформатики .