Что такое геном человека: расшифровка. Расшифровка генома человека Геном человека: общие понятия

Что такое геном человека: расшифровка. Расшифровка генома человека Геном человека: общие понятия

Это было семь лет назад - 26-го июня 2000 года. На совместной пресс-конференции с участием президента США и премьер-министра Великобритании представители двух исследовательских групп - International Human Genome Sequencing Consortium (IHGSC) и Celera Genomics - объявили о том, что работы по расшифровке генома человека, начавшиеся ещё в 70-х годах, успешно завершены, и черновой его вариант составлен. Начался новый эпизод развития человечества - постгеномная эра.

Что может дать нам расшифровка генома, и стоят ли потраченные средства и усилия достигнутого результата? Фрэнсис Коллинз (Francis S. Collins ), руководитель американской программы «Геном человека», в 2000 году дал следующий прогноз развития медицины и биологии в постгеномную эру:

  • 2010 год - генетическое тестирование, профилактические меры, снижающие риск заболеваний, и генная терапия до 25 наследственных заболеваний. Медсёстры начинают выполнять медико-генетические процедуры. Широко доступна преимплантационная диагностика, активно обсуждаются ограничения в применении данного метода. В США приняты законы для предотвращения генетической дискриминации и соблюдения конфиденциальности. Практические приложения геномики доступны не всем, особенно это чувствуется в развивающихся странах.
  • 2020 год - на рынке появляются лекарства от диабета, гипертонии и других заболеваний, разработанные на основе геномной информации. Разрабатывается терапия рака, прицельно направленная на свойства раковых клеток определенных опухолей. Фармакогеномика становится общепринятым подходом для создания многих лекарств. Изменение способа диагностики психических заболеваний, появление новых способов их лечения, изменение отношения общества к таким заболеваниям. Практические приложения геномики все еще доступны далеко не везде.
  • 2030 год - определение последовательности нуклеотидов всего генома отдельного индивида станет обычной процедурой, стоимость которой менее $1000. Каталогизированы гены, участвующие в процессе старения. Проводятся клинические испытания по увеличению максимальной продолжительности жизни человека. Лабораторные эксперименты на человеческих клетках заменены экспериментами на компьютерных моделях. Активизируются массовые движения противников передовых технологий в США и других странах.
  • 2040 год - Все общепринятые меры здравоохранения основаны на геномике. Определяется предрасположенность к большинству заболеваний (ещё до рождения). Доступна эффективная профилактическая медицина с учетом особенностей индивида. Болезни определяются на ранних стадиях путем молекулярного мониторинга.
    Для многих заболеваний доступна генная терапия. Замена лекарств продуктами генов, вырабатываемыми организмом при ответе на терапию. Средняя продолжительность жизни достигнет 90 лет благодаря улучшению социо-экономических условий. Проходят серьезные дебаты о возможности человека контролировать собственную эволюцию.
    Неравенство в мире сохраняется, создавая напряженность на международном уровне.

Как видно из прогноза, геномная информация в недалеком будущем может стать основой лечения и профилактики множества болезней. Без информации о своих генах (а она умещается на стандарный DVD-диск) человек в будущем сможет вылечить разве что насморк у какого-нибудь целителя в джунглях. Это кажется фантастикой? Но когда-то такой же фантастикой была поголовная вакцинация от оспы или интернет (заметьте, в 70-х его еще не существовало)! В будущем генетический код ребенка будут выдавать родителям в роддоме. Теоретически, при наличии такого диска, лечение и предотвращение любых недугов отдельно взятого человека станет сущим пустяком. Профессиональный врач сможет в предельно сжатые сроки поставить диагноз, назначить эффективное лечение, и даже определить вероятность появления разных болезней в будущем. К примеру, современные генетические тесты уже позволяют точно определить степень предрасположенности женщины к раку груди. Почти наверняка, лет через 40–50 ни один уважающий себя врач без генетического кода не захочет «лечить вслепую» - подобно тому, как сегодня хирургия не может обойтись без рентгеновского снимка.

Давайте зададимся вопросом - а достоверно ли сказанное, или, может быть, в действительности всё будет наоборот? Смогут ли люди наконец победить все болезни и придут ли они ко всеобщему счастью? Увы. Начнем с того, что Земля маленькая, и счастья на всех не хватит. По правде сказать, его не хватит даже для половины населения развивающихся стран. «Счастье» предназначено в основном для государств, развитых в плане науки, в частности - наук биологических. Например методика, с помощью которой можно «прочесть» генетический код любого человека, уже давно запатентована. Это отлично отработанная автоматизированная технология - правда, дорогостоящая и очень тонкая. Хочешь, покупай лицензию, а хочешь - придумывай новую методику. Только вот денег на подобную разработку хватит далеко не у всех стран! В итоге ряд государств будет обладать медициной, существенно опережающей уровень остального мира. Естественно, в слаборазвитых странах Красным Крестом будут строиться благотворительные больницы, госпитали и геномные центры. И постепенно это приведет к тому, что генетическая информация пациентов развивающихся стран (которых большинство), сосредоточится у двух-трех держав, финансирующих эту благотворительность. Что можно сделать, имея такую информацию - даже представить трудно. Может, и ничего страшного. Однако возможен и другой исход. Битва за приоритет, сопровождавшая секвенирование генома, наглядно подтверждает важность доступности генетической информации. Давайте кратко вспомним некоторые факты из истории программы «Геном человека».

Противники расшифровки генома считали поставленную задачу нереальной, ведь ДНК человека в десятки тысяч раз длиннее молекул ДНК вирусов или плазмид. Главный аргумент против был: «проект потребует миллиарды долларов, которых недосчитаются другие области науки, поэтому геномный проект затормозит развитие науки в целом. А если все-таки деньги найдутся и геном человека будет расшифрован, то полученная в результате информация не оправдает затрат... » Однако Джеймс Уотсон, один из первооткрывателей структуры ДНК и идеолог программы тотального прочтения генетической информации, остроумно парировал: «лучше не поймать большую рыбу, чем не поймать маленькую » , . Аргумент учёного был услышан - проблему генома вынесли на обсуждение в конгресс США, и в итоге была принята национальная программа «Геном человека».

В американском городе Бетесда, что недалеко от Вашингтона, находится один из координационных центров HUGO (HUman Genome Organization ). Центр координирует научную работу по теме «Геном человека» в шести странах - Германии, Англии, Франции, Японии, Китае и США. В работу включились учёные из многих стран мира, объединенные в три команды: две межгосударственные - американская Human Genome Project и британская из Wellcome Trust Sanger Institute - и частная корпорация из штата Мериленд, включившаяся в игру чуть позже, - Celera Genomics . Кстати, это пожалуй первый случай в биологии, когда на таком высоком уровне частная фирма соревновалась с межгосударственными организациями.

Борьба происходила с использованием колоссальных средств и возможностей. Как отмечали некоторое время назад российские эксперты, Celera стояла на плечах у программы «Геном Человека», то есть использовала то, что уже было сделано в рамках глобального проекта. Действительно, Celera Genomics подключилась к программе не сначала, а когда проект уже шёл полным ходом. Однако специалисты из Celera усовершенствовали алгоритм секвенирования. Кроме того, по их заказу был построен суперкомпьютер, который позволял складывать выявляемые «кирпичики» ДНК в результирующую последовательность быстрее и точнее. Конечно, все это не давало компании Celera безоговорочного преимущества, однако считаться с ней как с полноправным участником гонки заставило.

Появление Celera Genomics резко повысило напряженность - те, кто был занят в государственных программах, почувствовали жёсткую конкуренцию. Кроме того, после создания компании остро встал вопрос об эффективности использования государственных капиталовложений. Во главе Celera стал профессор Крейг Вентер (Craig Venter ) , который имел огромный опыт научной работы по государственной программе «Геном человека». Именно он и заявил, что все публичные программы малоэффективны и что в его фирме геном секвенируют быстрее и дешевле. А тут появился ещё один фактор - спохватились крупные фармацевтические компании. Дело в том, что если вся информация о геноме окажется в открытом доступе, они лишатся интеллектуальной собственности, и нечего будет патентовать. Озабоченные этим, они вложили миллиарды долларов в Celera Genomics (с которой, вероятно, было проще договориться). Это еще более укрепило её позиции. В ответ на это коллективам межгосударственного консорциума срочно пришлось повышать эффективность работ по расшифровке генома. Сначала работа шла несогласованно, но потом были достигнуты определенные формы сосуществования - и гонка начала наращивать темп.

Финал был красивым - конкурирующие организации по взаимной договоренности одновременно объявили о завершении работ по расшифровке генома человека , . Произошло это, как мы уже писали - 26 июня 2000 года. Но разница во времени между Америкой и Англией вывела на первое место США.

Рисунок 1. «Гонка за генóм», в которой участвовали межгосударственная и частная компании, формально завершилась «ничьей»: обе группы исследователей опубликовали свои достижения практически одновременно. Руководитель частной компании Celera Genomics Крейг Вентер опубликовал свою работу в журнале Science в соавторстве с ~270 учёными, работавшими под его началом . Работа, выполненная международным консорциумом по секвенированию человеческого генома (IHGSC), опубликована в журнале Nature , и полный список авторов насчитывает около 2800 человек, работавших в почти трёх десятках центров по всему миру .

Исследования в сумме продлились 15 лет. Создание первого «чернового» варианта генома человека обошлось в 300 миллионов долларов. Однако на все исследования по этой теме, включая сравнительные анализы и решение ряда этических проблем, было выделено в сумме около трех миллиардов долларов. Celera Genomics вложила примерно столько же, правда, она истратила их всего за шесть лет. Цена колоссальная, но эта сумма ничтожна в сравнении с той выгодой, которую получит страна-разработчик от ожидаемой вскоре окончательной победы над десятками серьезных заболеваний. В начале октября 2002 года в интервью «Ассошиэйтед пресс» президент Celera Genomics Крейг Вентер заявил, что одна из его некоммерческих организаций планирует заняться изготовлением компакт-дисков, содержащих максимум информации о ДНК клиента. Предварительная стоимость такого заказа - более 700 тысяч долларов. А одному из первооткрывателей структуры ДНК - доктору Джеймсу Уотсону - уже в этом году были подарены два DVD-диска с его геномом общей стоимостью 1 млн. долларов , - как видим, цены падают. Так, вице-президент фирмы 454 Life Sciences Майкл Эгхолм (Michael Egholm ) сообщил , что в скором времени компания сможет довести цену расшифровки до 100 тыс. долларов.

Широкая известность и масштабное финансирование - палка о двух концах. С одной стороны, за счет неограниченных средств работа продвигается легко и быстро. Но с другой стороны, результат исследований должен получиться таким, каким его заказывают. К началу 2001 года в геноме человека со стопроцентной достоверностью было идентифицировано больее 20 тыс. генов. Эта цифра оказалось в три раза меньше, чем было предсказано всего за два года до этого. Вторая команда исследователей из Национального института геномных исследований США во главе с Френсисом Коллинсом независимым способом получила те же результаты - между 20 и 25 тыс. генов в геноме каждой человеческой клетки. Однако неопределенность в окончательные оценки внесли два других международных совместных научных проекта. Доктор Вильям Хезелтайн (руководитель фирмы Human Genome Studies ) настаивал , что в их банке содержится информация о 140 тыс. генов. И этой информацией он не собирается пока делиться с мировой общественностью. Его фирма вложила деньги в патенты и собирается зарабатывать на полученной информации, поскольку она относится к генам широко распространенных болезней человека. Другая группа заявила о 120 тыс. идентифицированных генов человека и также настаивала, что именно эта цифра отражает общее число генов человека.

Тут необходимо уточнить, что эти исследователи занимались расшифровкой последовательности ДНК не самого генома, а ДНК-копий информационных (называемых также матричными) РНК (иРНК или мРНК). Другими словами, исследовался не весь геном, а только та его часть, что перекодируется клеткой в мРНК и направляет синтез белков. Поскольку один ген может служить матрицей для производства нескольких различных видов мРНК (что определяется многими факторами: тип клетки, стадия развития организма и т. д.), то и суммарное число всех различных последовательностей мРНК (а это именно то, что запатентовала Human Genome Studies ) будет значительно бóльшим. Скорее всего, использовать это число для оценки количества генов в геноме просто некорректно.

Очевидно, что наспех «приватизированная» генетическая информация будет в ближайшие годы тщательно проверяться, пока точное число генов станет, наконец, общепринятым. Но настораживает тот факт, что в процессе «познания» патентуется вообще все, что только можно запатентовать. Тут даже не шкура не убитого медведя, а вообще все, что находилось в берлоге, было поделено! Кстати, на сегодня дебаты сбавили обороты, и геном человека официально насчитывает только 21667 генов (версия NCBI 35 , датированная октябрём 2005 года). Следует отметить, что пока большая часть информации всё-таки остаётся общедоступной. Сейчас существуют базы данных, в которых аккумулирована информация о структуре генома не только человека, но и геномов многих других организмов (например, EnsEMBL). Однако попытки получить исключительные права на использование каких-либо генов или последовательностей в коммерческих целях всегда были, есть сейчас и будут предприниматься впредь.

На сегодня основные цели структурной части программы уже в основном выполнены - геном человека почти полностью прочитан. Первый, «черновой» вариант последовательности, опубликованный в начале 2001 года , был далек от совершенства. В нём отсутствовало приблизительно 30% последовательности генома в целом, из них около 10% последовательности так называемого эухроматина - богатых генами и активно экспрессирующихся участков хромосом. Согласно последним подсчётам, эухроматин составляет примерно 93,5% от всего генома . Оставшиеся же 6,5% приходятся на гетерохроматин - эти участки хромосом бедны генами и содержат большое количество повторов, которые представляют серьезные трудности для ученых, пытающихся прочесть их последовательность . Более того, считается, что ДНК в гетерохроматине находится в неактивном состоянии и не экспрессируется. (Этим можно объяснить такое «невнимание» ученых к оставшимся «малым» процентам человеческого генома.) Но даже имевшиеся на 2001 год «черновые» варианты эухроматиновых последовательностей содержали большое количество разрывов, ошибок и неверно соединенных и ориентированных фрагментов. Нисколько не умаляя значения для науки и ее приложений появление этого «черновика», стоит однако отметить, что использование этой предварительной информации в крупномасштабных экспериментах по анализу генома в целом (например, при исследовании эволюции генов или общей организации генома) выявило множество неточностей и артефактов. Поэтому дальнейшая и не менее кропотливая работа, «последние вершки», была абсолютно необходима.

Рисунок 2. Слева: Автоматизированная линия подготовки образцов ДНК для секвенирования в Центре Геномных исследований института Уайтхеда. Справа: Лаборатория в , заполненная автоматами для высокопроизводительной расшифровки последовательностей ДНК.

Завершение расшифровки заняло еще несколько лет и привело почти что к удвоению стоимости всего проекта. Однако уже в 2004 г. было объявлено, что эухроматин прочитан на 99% с общей точностью одна ошибка на 100 000 пар оснований. Количество разрывов уменьшилось в 400 раз. Аккуратность и полнота прочтения стала достаточной для эффективного поиска генов, отвечающих за то или иное наследственное заболевание (например, диабет или рак груди). Практически это означает, что исследователям больше не надо заниматься трудоемким подтверждением последовательностей генов, с которыми они работают, так как можно полностью положиться на определенную и доступную каждому последовательность всего генома.

Таким образом, изначальный план проекта был значительно перевыполнен. Помогло ли это нам в понимании того, как устроен и работает наш геном? Безусловно. Авторы статьи в Nature , в которой был опубликован «окончательный» (на 2004 год) вариант генома , провели с его использованием несколько анализов, которые были бы абсолютно бессмысленны, имей они на руках только «черновую» последовательность. Оказалось, что более тысячи генов «родились» совсем недавно (по эволюционным меркам, конечно) - в процессе удвоения исходного гена и последующего независимого развития дочернего гена и гена-родителя. А чуть меньше сорока генов недавно «умерли», накопив мутации, сделавшие их совершенно неактивными. Другая статья, вышедшая в том же номере журнала Nature , прямо указывает на недостатки метода, использованного учеными из Celera . Следствием этих недостатков стали пропуски многочисленных повторов в прочитанных последовательностях ДНК и, как результат, недооценённая длина и сложность всего генома. Чтобы не повторять подобных ошибок в будущем, авторы статьи предложили использовать гибридную стратегию - комбинацию высокоэффективного подхода, использовавшегося учеными из Celera , и сравнительно медленного и трудоемкого, но и более надежного метода, применявшегося исследователями из IHGSC.

Куда дальше будет направлено беспрецедентное исследование «Геном человека»? Кое-что об этом можно сказать уже сейчас. Основанный в сентябре 2003 года международный консорциум ENCODE (ENCyclopaedia Of DNA Elements ) поставил своей целью обнаружение и изучение «управляющих элементов» (последовательностей) в геноме человека. Действительно, ведь 3 млрд. пар оснований (а именно такова длина генома человека) содержат всего лишь 22 тыс. генов, разбросанных в этом океане ДНК непонятным для нас образом. Что управляет их экспрессией? Зачем нам такой избыток ДНК? Действительно ли он является балластом, или же все-таки проявляет себя, обладая какими-то неизвестными функциями ?

Для начала, в качестве пилотного проекта, ученые из ENCODE «пристально вгляделись» в последовательность, составляющую 1% от генома человека (30 млн. пар оснований), используя новейшее оборудование для исследований в молекулярной биологии. Результаты были опубликованы в апреле нынешнего года в Nature . Оказалось, что бóльшая часть генома человека (в том числе участки, считавшиеся ранее «молчащими») служит матрицей для производства различных РНК, многие из которых не являются информационными, поскольку не кодируют белков. Многие из этих «некодирующих» РНК перекрываются с «классическими» генами (участками ДНК, кодирующими белки). Неожиданным результатом было и то, как регуляторные участки ДНК были расположены относительно генов, экспрессией которых они управляли. Последовательности многих из этих участков мало изменялись в процессе эволюции, в то время как другие участки, считавшиеся важными для управления клеткой, мутировали и изменялись в процессе эволюции с неожиданно высокой скоростью . Все эти находки поставили большое количество новых вопросов, ответы на которые можно получить лишь в дальнейших исследованиях.

Другая задача, решение которой станет делом недалекого будущего, - определение последовательности оставшихся «малых» процентов генома, составляющих гетерохроматин, т. е. бедных генами и богатых повторами участков ДНК, необходимых для удвоения хромосом в процессе деления клетки. Наличие повторов делает задачу расшифровки этих последовательностей неразрешимой для существующих подходов, и, следовательно, требует изобретения новых методов. Поэтому не удивляйтесь, когда году в 2010 выйдет очередная статья, объявляющая об «окончании» расшифровки генома человека - в ней будет рассказано о том, как был «взломан» гетерохроматин.

Конечно, сейчас в нашем распоряжении имеется лишь некий «усредненный» вариант человеческого генома. Образно говоря - мы сегодня имеем лишь самое общее описание конструкции автомобиля: мотор, ходовая часть, колёса, руль, сиденья, краска, обивка, бензин с маслом и т. д. Ближайшее рассмотрение полученного результата свидетельствует о том, что впереди - годы работ по уточнению наших знаний по каждому конкретному геному. Программа «Геном человека» не прекратила свое существование, она лишь меняет ориентацию: от структурной геномики осуществляется переход к геномике функциональной, предназначенной установить, как управляются и работают гены. Более того, все люди на уровне генов отличаются так же, как одни и те же модели автомобилей отличаются различными вариантами исполнения одних и тех же агрегатов. Не только отдельные основания в последовательностях генов двух разных людей могут отличаться, но и количество копий крупных фрагментов ДНК, порой включающих в себя несколько генов, может сильно варьировать. А это означает, что на передний план выходят работы по детальному сравнению геномов, скажем, представителей различных человеческих популяций, этнических групп, и даже здоровых и больных людей. Современные технологии позволяют быстро и точно проводить такие сравнительные анализы, а ведь еще лет десять назад об этом никто и не мечтал. Изучением структурных вариаций человеческого генома занимается очередное международное научное объединение . В США и Европе значительные средства выделяются на финансирование биоинформатики - молодой науки, возникшей на стыке информатики, математики и биологии, без которой никак не разобраться в безграничном океане информации, накопленном в современной биологии. Биоинформационные методы помогут нам ответить на многие интереснейшие вопросы - «как происходила эволюция человека?», «какие гены определяют те или иные особенности человеческого организма?», «какие гены ответственны за предрасположенность к болезням?» Знаете, как говорят англичане: “This is the end of the beginning ” - «Это конец начала». Вот именно эта фраза точно отражает нынешнюю ситуацию . Начинается самое главное и - я совершенно уверен - самое интересное: накопление результатов, их сравнение и дальнейший анализ.

«...Сегодня мы выпускаем в свет первое издание „Книги жизни“ с нашими инструкциями , - сказал в эфире телеканала «Россия» Фрэнсис Коллинз. - Мы будем обращаться к нему десятки, сотни лет. И уже скоро люди зададутся вопросом, как они могли обходиться без этой информации ».

Другую точку зрения можно проиллюстрировать, процитировав академика Кордюма В. А.:

«...Надежды же на то, что новая информация о функциях генома будет полностью открытой, чисто символические. Можно прогнозировать, что возникнут (на базе уже имеющихся) гигантские центры, которые смогут все данные соединить в одно связное целое, некую электронную версию Человека и реализовывать её практически - в гены, белки, клетки, ткани, органы и что угодно ещё. Но во что? Угодное кому? Для чего? В процессе работ по программе „геном человека“ стремительно совершенствовались методы и аппаратура для определения первичной последовательности ДНК. В крупнейших центрах это превратилось в некое подобие заводской деятельности. Но даже на уровне лабораторных индивидуальных приборов (вернее их комплексов) уже создано столь совершенное оборудование, что оно способно определить за три месяца такую по объему последовательность ДНК, которая равна всему геному человека. Не удивительно, что возникла (и тут же начала стремительно реализоваться) идея определения геномов индивидуальных людей. Безусловно, это очень интересно - сравнить отличия разных индивидуумов на уровне их первоосновы. Польза от такого сравнения тоже несомненная. Можно будет установить, у кого имеются какие нарушения в геноме, прогнозировать их последствия и устранить то, что может привести к болезням. Здоровье будет гарантированным, да и жизнь продлится весьма существенно. Это с одной стороны. С другой же стороны всё совсем не очевидно. Получить и проанализировать всю наследственность индивидуума означает получение полного, исчерпывающего биологического досье на него. Оно, при желании того, кто его знает, позволит столь же исчерпывающе делать с человеком всё что угодно. По уже известной цепочке: клетка - молекулярная машина; человек состоит из клеток; клетка во всех своих проявлениях и во всём диапазоне возможных ответов, записана в геноме; с геномом можно ограниченно уже и сегодня манипулировать, а в обозримом будущем вообще манипулировать практически как угодно... »

Однако, наверное, пугаться таких мрачных прогнозов еще рано (хотя знать о них, безусловно, нужно). Для их осуществления надо полностью перестраивать многие социальные и культурные традиции. Очень хорошо по этому поводу сказал в интервью доктор биологических наук Михаил Гельфанд, и. о. заместителя директора Института проблем передачи информации РАН: «...если у вас есть, предположим, один из пяти генов, предопределяющих развитие шизофрении, то что может случиться, если эта информация - ваш геном - попала в руки вашего потенциального работодателя, который ничего в геномике не понимает! (и как следствие - вас на работу могут не принять, посчитав это рискованным; и это не смотря на то, что шизофрении у вас нет и не будет - прим. автора.) Другой аспект: с появлением индивидуализированной медицины, основанной на геномике, полностью изменится страховая медицина. Ведь одно дело - предусматривать риски неизвестные, а другое дело - совершенно определенные. Если честно, то все западное общество в целом, не только российское, к геномной революции сейчас не готово...» .

Действительно, чтобы разумно пользоваться новой информацией, надо ее понимать. А для того чтобы понять геном - не просто прочитать, этого далеко не достаточно, - нам потребуются десятилетия. Слишком уж сложная картина вырисовывается, и чтобы осознать её, нам надо будет поменять многие стереотипы. Поэтому на самом деле расшифровка генома ещё продолжается и будет продолжаться. И будем ли мы стоять в стороне или станем, наконец, активными участниками этой гонки - зависит от нас.

Литература

  1. Киселёв Л. (2001). Новая биология началась в феврале 2001 года . «Наука и Жизнь» ;
  2. Киселёв Л. (2002). Вторая жизнь генома: от структуры к функции . «Знание–Сила» . 7 ;
  3. Ewan Birney, The ENCODE Project Consortium, John A. Stamatoyannopoulos, Anindya Dutta, Roderic Guigó, et. al.. (2007). Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project . Nature . 447 , 799-816;
  4. Lincoln D. Stein. (2004). Human genome: End of the beginning . Nature . 431 , 915-916;
  5. Гельфанд М. (2007). Постгеномная эра . «Коммерческая биотехнология» .

Сравнение полных геномов - важнейший метод изучения эволюции, ставший доступным биологам с 1995 года. К настоящему времени полностью прочитано 212 геномов многоклеточных животных. Это уже позволило сделать ряд общих выводов - например, частично реконструировать минимальный геном последнего общего предка животных, а также оценить характерную для современных геномов долю новых генов, свойственных только отдельным систематическим группам.

«Сравнение полных геномов представляет собой единственный удовлетворяющий исследователя путь к реконструкции эволюции», - пишет в книге «Логика случая» знаменитый биоинформатик Евгений Кунин (Eugene Koonin). С категоричностью этого утверждения можно не согласиться, но речь идет и правда о важнейшей вещи. Сравнение полных геномов - метод, который дал биологам совершенно новые возможности для наблюдения эволюционного процесса.

Эпоха сравнения полных геномов началась в 1995 году, когда лаборатория Крейга Вентера (John Craig Venter) опубликовала результат прочтения генома бактерии гемофильного гриппа Haemophilus influenzae (R. D. Fleischmann et al., 1995. Whole-genome random sequencing and assembly of Haemophilus influenzae ). В течение года с того момента было прочитано еще несколько геномов бактерий и один эукариотный - геном дрожжей Saccharomyces cerevisiae. Их можно и нужно было сравнивать, разрабатывая для этого приемы, фиксируя открывающиеся закономерности. За считанные годы родилась новая наука - сравнительная геномика, подобно тому, как в XVIII веке сложилась сравнительная анатомия.

Несколько недель назад американские биологи Кейси Данн (Casey Dunn) и Джозеф Райан (Joseph F. Ryan) выпустили очень краткий - на пяти страничках - обзор данных , полученных из прочитанных на данный момент полных геномов многоклеточных животных. Их уже столько, что можно сделать первые выводы, касающиеся генетической эволюции животных в целом.

Данн и Райан определили предмет своего интереса совершенно четко: макроэволюция ядерных геномов. Оговорка о макроэволюции означает, что нас сейчас интересуют геномные различия между крупными группами организмов, а не те, что можно найти между близкими видами, и тем более не внутривидовые. Оговорка про ядерные геномы означает, что мы не рассматриваем, например, митохондриальную ДНК (которую тоже очень интересно изучать, но это особая тема). Итак, что нам известно о ядерных геномах животных?

Сначала сухие цифры. На момент публикации статьи Данна и Райана число полностью прочитанных геномов животных составляло 212 (даже за прошедшее с тех пор короткое время их могло стать уже больше). Подразумевается, что каждый геном принадлежит отдельному виду. Двести двенадцать видов - это меньше двух сотых долей процента от общего числа видов современных животных, которое составляет примерно 1,5 миллиона. Кроме того, разные группы животных представлены в этой выборке очень неравномерно. Во-первых, 83% прочитанных геномов принадлежат позвоночным. Во-вторых, наблюдается явный перекос в сторону животных с маленькими геномами, работать с которыми технически гораздо проще. Напомним, что размеры геномов разных животных могут отличаться на три порядка, то есть в тысячи раз (см. Геномы хвостатых амфибий с самого начала были большими , «Элементы», 24.06.2015). Обладателям гигантских геномов, например, двоякодышащим рыбам, придется еще какое-то время подождать своей очереди.

Тем не менее, все крупные эволюционные ветви животных современной выборкой охвачены, так что ее можно считать вполне представительной (рис. 1).

Уточним это утверждение. На эволюционном древе есть семь крупных ветвей, без упоминания которых не обходится ни один разговор о животном царстве (если, конечно, его хотят охватить в целом). Это губки , гребневики , пластинчатые , стрекающие , линяющие , спиральнодробящиеся и вторичноротые . Так вот, во всех этих ветвях без исключения есть представители, полные геномы которых уже прочитаны и внесены в электронные базы. В большинстве ветвей - и не по одному.

Все геномы животных гораздо более похожи друг на друга, чем можно было бы ожидать, исходя из внешних различий их обладателей. Например, размер генома очень слабо коррелирует со сложностью организма. Конечно, упоминая в биологии «сложность», приходится всегда оговаривать, что понятие это абстрактное и трудно определимое. Но при любом его понимании не приходится сомневаться, например, в том, что человек, одна только нервная система которого насчитывает 86 миллиардов нейронов, сложнее круглого червя Caenorhabditis elegans , у которого нейронов 302 штуки. В догеномную эпоху высказывались предположения, что у человека примерно 140 тысяч генов, но сейчас ясно, что их всего 20–25 тысяч (см. А. Панчин, 2015. Сколько мусора в нашей ДНК?). А число генов ценорабдитиса - 19 735 (L. D. W. Hillier et al., 2005. Genomics in C. elegans : So many genes, such a little worm). По числу генов человек и ценорабдитис мало отличаются друг от друга.

Любой геном можно охарактеризовать двумя главными параметрами: размер генома (C) и число генов (G). Размер генома измеряется в парах нуклеотидов, число генов - просто в штуках. Широко известно, что размер генома может очень сильно - на порядки - отличаться у организмов, явно близких по сложности устройства тела (например, у хвостатых и бесхвостых земноводных). Это явление называют «парадоксом значений C».

А вот с числом генов все наоборот. Оно часто бывает примерно одинаковым (во всяком случае, сравнимым) у организмов, отличающихся чуть ли не по всем признакам устройства тела, какие только можно придумать. Этот факт получил название «парадокса значений G» (M. W. Hahn, G. A. Wray, 2002. The g-value paradox). Теоретически объяснять его можно по-разному, но в любом случае это один из главных выводов, сделанных с помощью чтения полных геномов. Другими способами надежно узнать число генов нельзя. Например, если мы измеряем химическими методами количество ДНК в клетке, то сразу получаем информацию о размере генома, но отличить гены от некодирующих последовательностей (которых в геномах эукариот всегда много) таким образом невозможно.

Еще одна задача, которую нельзя решить без исследований полных геномов - это реконструкция генома общего предка всех многоклеточных животных. Сравнение геномов разных животных, а также их одноклеточных родственников, позволяет в принципе определить минимальный набор генов, которыми этот предок должен был обладать. На данный момент можно сказать, что у последнего общего предка всех животных было по меньшей мере 6289 генных семейств, общих у него с некоторыми одноклеточными, и 2141 генное семейство, уникальное для животных (напомним, что генное семейство - это группа генов, происходящих от одного гена-предшественника путем его удвоений; см., например: Предки губок могут оказаться сложнее, чем предполагалось , «Элементы», 27.10.2015). Получается, что у общего предка животных было минимум 8430 генов. Правда, это - в случае, если каждое генное семейство состояло только из одного гена, что маловероятно. На самом деле генов, скорее всего, было больше, но все же эти цифры дают какую-никакую точку отсчета. И в любом случае, они не окончательные - ведь анализ геномов продолжается.

Некоторые выводы касаются отдельных групп генов и белков. Например, белки клеточной адгезии (cell adhesion molecules, CAM), обеспечивающие сцепление и взаимодействие клеток друг с другом, оказались вовсе не уникальными для животных - они появились у наших одноклеточных родственников, которым были нужны, вероятно, ввиду их сложного жизненного цикла (см. H. Suga et al., 2013. The Capsaspora genome reveals a complex unicellular prehistory of animals). А вот многие гены и белки, обеспечивающие внутриклеточную сигнализацию, для животных как раз уникальны.

От генома последнего общего предка многоклеточных животных, естественно, произошли - путем многократных копирований с изменениями - геномы всех животных, доживших до современности. Так и сформировалось ветвистое эволюционное древо, которые мы теперь видим. События, меняющие геномы в ходе эволюции, очень разнообразны: дупликации разных типов, перестройки устойчивого совместного расположения генов (синтении), умножение или потеря генов тех или иных семейств, всевозможные вставки, модификации регуляторных областей ДНК, перенос мобильных генетических элементов , изменение состава повторяющихся последовательностей, таких как сателлитная ДНК , и многое другое. Все эти события оставляют следы, которые наслаиваются друг на друга. Их можно найти и прочитать, примерно так же, как можно найти и прочитать следы правок в обычном тексте. Ведь геном - тоже текст (хотя и не только текст, конечно). Геном любого животного заключает в себе целую летопись изменений, многие из которых можно довольно точно распознать и датировать. Сплошь и рядом это относится даже к изменениям, которые произошли много сотен миллионов лет назад. Текст может сохранить все.

Сейчас широко известно, что генный «инвентарь» многоклеточных животных эволюционно очень консервативен. Сплошь и рядом одни и те же гены используются для близких функций и у человека, и у относительно простых существ наподобие того же ценорабдитиса. Однако это - далеко не вся правда. В любом эукариотном геноме есть 10–20% генов, не похожих ни на какие гены смежных (и любых других) групп организмов (K. Khalturin et al., 2009. More than just orphans: are taxonomically-restricted genes important in evolution?). Такие гены часто называют «генами-сиротами» (orphan genes), имея в виду, что для них не удается найти генов-предков. Но все-таки корректнее называть их таксономически ограниченными генами (taxonomically-restricted genes, TRG). Таксономически ограниченный ген - это действительно новый ген, появившийся в эволюции одной-единственной группы организмов. Например, есть гены, свойственные только позвоночным, только некоторым насекомым или даже только мышам. Естественно, тут возникают интересные вопросы. Во-первых, откуда новые гены берутся? И, во-вторых, какие у них обычно бывают функции?

На вопрос, откуда берутся новые гены, самый распространенный ответ простой: новые гены берутся из старых. Например, в результате случайной дупликации образуются две копии некоего гена, в первой из них мутации накапливаются медленнее, во второй быстрее, в итоге вторая копия постепенно становится новым геном с новой функцией. Это действительно очень частый механизм создания новых генов, но не единственный. По-видимому, новые гены в принципе могут образоваться из чисто регуляторных участков ДНК или даже из некодирующих последовательностей (D. Tautz, T. Domazet-Loso, 2011. The evolutionary origin of orphan genes). Иногда на это накладываются дополнительные события, например вставка в новый ген небольшого куска другого, старого гена. Кстати, установлено, что «молодые» гены обычно кодируют более короткие белки, чем «старые». Получается, что долгоживущий ген как бы накапливает груз, состоящий из случайных вставок - которые, впрочем, в свою очередь могут подвергаться отбору и обретать новые функции. В любом случае, образование новых генов, как и большинство процессов в биологии, не сводится к какому-либо одному механизму. Таких механизмов несколько, и они могут сочетаться.

Что касается функций таксономически ограниченных генов, то они бывают очень разнообразными. Роднит их одно: большинство этих функций - специфические для данной группы животных, не встречающиеся за ее пределами.

Например, свой набор таксономически ограниченных генов есть у типа стрекающих , к которому относятся медузы и полипы (включая гидр и кораллов). Пожалуй, самая яркая особенность стрекающих животных - стрекательные клетки (книдоциты), в честь которых этот тип получил свое название. Книдоциты - одни из самых сложных клеток, какие только можно найти в животном мире. В каждом книдоците находится свернутая стрекательная нить с ядовитым веществом и механизмом выбрасывания. Книдоциты стрекающих очень разнообразны, их насчитывается более 30 типов, а вот ни у каких других животных подобных клеток нет. Так вот, оказалось, что очень многие гены, свойственные только стрекающим, связаны со специфическими органеллами стрекательных клеток. Например, целая группа таких генов кодирует миниколлагены - уникальные короткие белки, входящие в состав стенки внутриклеточной капсулы, в которой размещается стрекательная нить. У одного из видов пресноводной гидры найден 41 ген, активный только в стрекательных клетках и не похожий ни на какие гены других типов животных. Выходит в общем логично: новые гены обеспечивают эволюционные новшества, проявляющиеся уже на уровне организма (рис. 2).

Любой геном - это в некотором смысле архив, документирующий события, происходившие на всем протяжении эволюционной линии от последнего общего предка всех живых организмов (last universal common ancestor, LUCA) до обладателя этого генома. Например, в геноме мыши запечатлены следы событий, происходивших по всей непрерывной цепочке предков и потомков от LUCA до этой самой мыши. Конечно, некоторые следы в ходе эволюции стираются бесследно, и с этим ничего не поделаешь. Но очень многие сохраняются. Причем все эти следы заключены внутри сложной упорядоченной структуры, дающей возможность их послойно датировать. В этом отношении работа сравнительного геномика напоминает стратиграфию или археологию.

При всем величии сравнительной геномики ее никак нельзя назвать «альфой и омегой» современной эволюционной биологии. Данн и Райан совершенно справедливо замечают, что далеко не всех биологов, занятых сравнительным анализом геномов, интересует геномная эволюция сама по себе. Гораздо чаще история геномов служит посредником (proxy) для понимания других аспектов эволюции, связанных с фенотипом и организмом. Подобным же образом историка, методами палеографии и источниковедения изучающего средневековые документы, чаще всего интересуют не тексты как таковые, а социально-исторические процессы, отображение которых в этих текстах можно найти.

История становления и развития психогенетики как научной дисциплины.

Древние врачи и натурфилософы строили гипотезы по поводу наследственности по видимым данным: внешние сходства детей и родителей, характер, голос, походка, а также болезни и уродства.

Всю историю становления и развития психогенетики можно условно поделить на пять этапов (1973 г. В.Томпсон и Г.Уайльд).

Первый этап (1865 - начало 1900-х) – Гальтон и его последователи. В 1865 первая научная публикация по психогенетике "Наследственный талант и характер" – идеи наследуемости психических особенностей, одаренности и. Вслед за этим вышла его знаменитая книга "Наследственный гений" (1869), а также статьи "Люди науки, их воспитание и характер" (1874) и "История близнецов как критерий относительной силы природы и воспитания

Второй этап - до конца 30-х гг. ХХ столетия - характеризуется интенсивным развитием методологии психогенетики. Были разработаны надежные методы определения зиготности близнецов (Siemens H., 1927). В 20-е гг. в методический арсенал психогенетики прочно вошел метод приемных детей, который и сейчас, наряду с близнецовым, является одним из основных.

Благодаря совместным усилиям генетиков и математиков, совершенствовались методы количественной генетики. большинство психологических признаков относятся к категории количественных, т.е. требуют измерения и применения вариационно-статистических методов.

На третьем этапе (до конца 60-х гг.) психогенетика развивалась экстенсивно. Это был период накопления фактического материала. Продолжала развиваться генетика поведения животных. В 1960 г. вышла первая обобщающая монография по генетике поведения.В этом же году была основана "Ассоциация генетики поведения" , начал выходить журнал "Генетика поведения" .Это означало, что генетика поведения окончательно оформилась как самостоятельная область науки.

Четвертый этап (до конца 80-х гг.) вновь характеризуется смещением акцентов на развитие методологии психогенетики. совершенствование компьютерных технологий. В этот период начали интенсивно развиваться новые генетико-математические методы (структурное моделирование, метод путей). Психогенетика получила для своих исследований мощный инструмент, который позволял в короткие сроки проводить обработку значительных массивов данных и проверять самые сложные гипотезы.

Неослабевающий долгие годы интерес к исследованию наследуемости интеллекта уступает место другим характеристикам человеческой индивидуальности (когнитивным стилям, темпераменту, личности, психофизиологическим особенностям, различным нарушениям развития). Все более тщательно изучаются различные аспекты средовых влияний, создаются специальные методики для изучения семейной среды. Во всем мире начинают закладываться лонгитюдные проекты исследования близнецов и приемных детей, позволяющие проследить траектории развития и генетическую преемственность.

Пятый этап - современный - охватывает 90-е гг. ХХ в. и начало нынешнего, т.е. по времени совпадает с интенсивной работой над проектом "Геном человека". Преобладающим направлением сейчас можно считать геномное. Р. Пломин -в генетике поведения более перспективным является движение "от поведения к генам", включая взаимодействия и корреляции между генотипом и средой, а также возможности коррекции генетических нарушений с помощью средовых воздействий, т.е. "средовой инженерии".

Проект «Геном человека» цели, задачи и достижения

Проект по расшифровке генома человека - международный научно-исследовательский проект, главной целью которого было определить последовательность нуклеотидов, которые составляют ДНК и идентифицировать 20-25 тыс. генов в человеческом геноме.

Проект начался в 1990 году, под руководством Джеймса Уотсона. Целью проекта по расшифровке генома человека является понимание строения генома человеческого вида.

Изначально планировалось определение последовательности более трёх миллиардов нуклеотидов, содержащихся в гаплоидном человеческом геноме. Затем несколько групп объявили о попытке расширить задачу до секвенирования биополимеров - определение их аминокислотной или нуклеотидной последовательности. В результате секвенирования получают формальное описание первичной структуры линейной макромолекулы в виде последовательности мономеров в текстовом виде диплоидного генома человека .

Геном любого отдельно взятого организма (исключая однояйцевых близнецов) уникален, поэтому определение последовательности человеческого генома в принципе должно включать в себя и секвенирование многочисленных вариаций каждого гена. Однако, в задачи проекта «Геном человека» не входило определение последовательности всей ДНК, находящейся в человеческих клетках; а некоторые гетерохроматиновые области (в общей сложности около 8 %) остаются несеквенированными до сих пор.

Создание детальной физической карты генома человека;

Создание физических карт всех хромосом человека и хромосом ряда модельных организмов;

Определение полной последовательности ДНК человека и ряда модельных организмов;

Развитие методологии и инфраструктуры для хранения, анализа и распределения полученной информации;

Создание технологии, необходимой для достижения перечисленных целей.

Геном был разбит на небольшие участки, примерно по 150 000 пар нуклеотидов в длину. Эти куски затем встраивали в вектор, известный как Искусственная бактериальная хромосома или BAC. Эти векторы созданы из бактериальных хромосом, измененных методами генной инженерии. Векторы, содержащие гены, затем можно вставлять в бактерии, где они копируются бактериальными механизмами репликации. Каждый из кусочков генома потом секвенировали раздельно методом дробовика, и затем все полученные последовательности собирали воедино уже в виде компьютерного текста. Размеры полученных больших кусков ДНК, собираемых для воссоздания структуры целой хромосомы, составляли около 150 000 пар нуклеотидов. Такая система известна под именем «иерархического метода дробовика», потому что вначале геном разбивается на куски разного размера, положение которых в хромосоме должно быть заранее известно.

Сущ. многочисленные определения «полной последовательности человеческого генома». Согласно некоторым из них, геном уже полностью секвенирован, а согласно другим, этого ещё предстоит добиться. остаётся несколько регионов, которые считаются незаконченными:

Прежде всего, центральные регионы каждой хромосомы, известные как центромеры, которые содержат большое количество повторяющихся последовательностей ДНК

Во-вторых, концы хромосом, называемые теломерами, также состоящие из повторяющихся последовательностей, и по этой причине в большинстве из 46 хромосом их расшифровка не завершена. Точно не известно, какая часть последовательности остаётся не расшифрованной до теломер, но как и с центромерами, существующие технологические ограничения препятствуют их секвенированию.

В-третьих, в геноме каждого индивидуума есть несколько локусов, которые содержат членов мультигенных семейств, которые также сложно расшифровать с помощью основного на сегодняшний день метода фрагментирования ДНК.

Бо́льшая часть остающейся ДНК сильно повторяющаяся, и маловероятно, что она содержит гены, однако это останется неизвестным, пока они не будут полностью секвенированы. Понимание функций всех генов и их регуляции остается далеко неполным.

Все люди имеют в той или иной степени уникальные геномные последовательности. Поэтому данные, опубликованные проектом «Геном человека», не содержат точной последовательности геномов каждого отдельного человека.

Почти все цели, которые ставил перед собой проект, были достигнуты быстрее, чем предполагалось. Проект поставил разумную, достижимую цель секвенирования 95 % ДНК. Исследователи смогли секвенировать 99,99 % человеческой ДНК.

Ученые, работавшие над расшифровкой последовательности генетического кода человека, заявили, что завершили свой труд на два года раньше запланированного срока. Это объявление последовало менее чем через три года после опубликования в мировой прессе "черновика" генома. В июне 2000 года премьер-министр Великобритании Тони Блэр и тогдашний президент США Билл Клинтон заявили, что расшифровано 97% "книги жизни".

Как сообщает Би-Би-Си , сейчас последовательность ДНК человека раскодирована практически на 100%. При этом остаются небольшие пробелы, заполнение которых считается слишком дорогостоящим, но система, способная делать из генетических данных медицинские и научные выводы, уже хорошо отработана. Институт Сэнгера, единственное британское учреждение, участвующее в масштабном международном проекте, выполнил почти треть всего объема работ. Большего вклада в расшифровку генома не сделал ни один научный институт в мире.

Не менее значительная доля работы по раскодированию легла на плечи американских ученых. Доктор Фрэнсис Коллинс, директор Национального института исследований генома США, также указывает на долгосрочные перспективы. "Один из наших проектов предусматривал идентификацию генов предрасположенности к диабету II типа, - говорит он. - Этим заболеванием страдает каждый 20-й человек старше 45 лет, и эта доля со временем только возрастает. При помощи общедоступной карты генетических последовательностей мы сумели отобрать один ген в хромосоме 20, наличие которого в геноме, похоже, как раз и увеличивает вероятность возникновения диабета II типа".

Когда о проекте расшифровки генома человека было официально объявлено, некоторые специалисты утверждали, что на его реализацию потребуется лет 20 или даже больше. Но ход выполнения работ невероятно ускорили появление роботов-манипуляторов и суперкомпьютеров. Подстегнула деятельность ученых в этом направлении и информация о том, что параллельно геном человека расшифровывает и частно финансируемая компания Celera Genomics. В последние три года основной целью биологов было заполнение брешей, остававшихся в уже раскодированных последовательностях ДНК, и более детальное уточнение всех остальных данных, на основе которых можно было бы выработать "золотой стандарт", который лег бы в основу дальнейших разработок в этой области. Зная практически всю последовательность почти трех миллиардов букв-нуклеотидов генетического кода нашей ДНК, ученые смогут вплотную заняться теми проблемами жизни человека, которые вызываются генетическими причинами.

Работа по идентификации генов теперь может длиться дни, а не годы, как раньше. Но главная задача практической медицины заключается теперь в том, чтобы знание о том, какие именно гены работают неправильно или вызывают определенные нарушения, трансформировать в знание того, что с этим можно сделать. А для этого им понадобится лучше понять, как, строя и поддерживая наше тело, взаимодействуют между собой белки (они же протеины) - сложные молекулы, построенные по генетическим "шаблонам" ДНК.

Проект Геном Человека

Логотип проекта

Проект по расшифровке генома человека (англ. The Human Genome Project , HGP ) - международный научно-исследовательский проект, главной целью которого было определить последовательность нуклеотидов , которые составляют ДНК и идентифицировать 20,000-25,000 генов в человеческом геноме .

Изначально планировалось определение более трёх миллиардов последовательности нуклеотидов , содержащихся в гаплоидном человеческом геноме их. Затем несколько групп обьявили о попытке расширить задачу до секвенирования диплоидного генома человека, среди них международный проект HapMap (англ.), Applied Biosystems , Perlegen, и клонированных животных) уникален, поэтому определение последовательности человеческого генома в принципе должно включать в себя и секвенирование многочисленных вариаций каждого гена. Однако, в задачи проекта «Геном человека» не входило определение последовательности всей ДНК, находящейся в человеческих клетках; а некоторые гетерохроматиновые области (в общей сложности около 8 %) остаются несеквенированными до сих пор.

Проект

Предпосылки

Проект стал кульминацией нескольких лет работы поддержаной министерством энергетики США , в частности семинаров проводившихся в 1984-м и 1986-м годах, и последовавшими министерства энергетики . Отчёт 1987 года чётко указывает: «Окончательной целью данного начинания является понимание человеческого генома» и «знание человеческого генома так же необходимо для прогресса медицины и других наук о здоровье, как знание анатомии было необходимо для достижения её нынешнего состояния». Поиски технологий, подходящих для решения предложенной задачи, начинались еще во второй половине 80-х годов.

В силу широкой международной кооперации и новых достижений в области геномики (особенно в секвенировании), а также значительных достижений в вычислительной технике, «черновик» генома был закончен в 2000 (о чём было объявлено совместно тогдашним президентом США Билом Клинтоном и британским премьер-министром Тони Блером 26 июня 2000 ). Продолжение секвенирования привело к объявлению в апреле 2003 года о почти полном завершении работы, на 2 года раньше чем планировалось . В мае , была пройдена другая веха на пути к завершению проекта, когда в журнале « .

Завершённость

Существуют многочисленные определения «полной последовательности человеческого генома». Согласно некоторым из них, геном уже полностью секвенирован, а согласно другим, этого ещё предстоит добиться. В популярной прессе было множество статей, сообщающих о «завершении» генома. Согласно определению, которое использует Международный проект по расшифровке генома человека, геном расшифрован полностью. График истории расшифровки проекта показывает, что большая часть человеческого генома была закончена в конце 2003 года. Однако еще остаётся несколько регионов, которые считаются незаконченными:

  • Прежде всего, центральные регионы каждой хромосомы, известные как центромеры , которые содержат большое количество повторяющихся последовательностей ДНК ; их сложно секвенировать при помощи современных технологий. Центромеры имеют длину миллионы (возможно десятки миллионов) пар нуклеотидов, и, по большому счёту, остаются не секвенированными.
  • Во-вторых, концы хромосом, называемые теломерами , также состоящие из повторяющихся последовательностей, и по этой причине в большинстве из 46 хромосом их расшифровка не завершена. Точно не известно, какая часть последовательности остаётся не расшифрованной до теломер, но как и с центромерами, существующие технологические ограничения препятствуют их секвенированию.
  • В-третьих, в геноме каждого индивидуума есть несколько локусов, которые содержат членов мультигенных семейств, которые также сложно расшифровать с помощью основного на сегодняшний день метода фрагментирования ДНК (англ.). В частности, эти семейства кодируют белки, важные для иммунной системы.
  • Кроме перечисленных регионов, остаётся ещё несколько брешей, разбросанных по всему геному, некоторые из которых довольно крупные, но есть надежда, что все они будут закрыты в ближайшие годы.

Б́ольшая часть остающейся ДНК сильно повторяющаяся, и маловероятно, что она содержит гены, однако это останется неизвестным, пока они не будут полностью секвенированы. Понимание функций всех генов и их регуляции далека от завершения. Роль мусорной ДНК , эволюция генома, различия между индивидуумами, и многие другие вопросы по-прежнему являются предметом интенсивных исследований в лабораториях всего мира.

Цели

Последовательность человеческой ДНК сохраняется в базах данных , доступных любому пользователю через интернет . Национальный центр биотехнологической информации США (и его партнёрские организации в Европе и Японии) хранят геномные последовательности в базе данных известной как GenBank (англ.), вместе с последовательностями известных и гипотетических генов и белков. Другие организации, к примеру Калифорнийский Университет в Санта-Круз (англ.) и Ensembl (англ.) поддерживают дополнительные данные и аннотации а также мощные инструменты для визуализации и поиска в этих базах. Были разработаны компьютерные программы для анализа данных, потому что сами данные без таких программ интерпретировать практически невозможно.

Процесс идентификации границ генов и других мотивов в необработанных последовательностях ДНК называется аннотацией генома (англ.) и относится к области биоинформатики . Эту работу при помощи компьютеров выполняют люди, но они делают её медленно и, чтобы удовлетворять требованиями высокой пропускной способности проектов секвенирования геномов, здесь также всё шире используют специальные компьютерные программы. Лучшие на сегодняшний день технологии аннотации используют статистические модели основанные на параллелях между последовательностями ДНК и человеческим языком , пользуясь такими концепциями информатики как формальные грамматики .

Другая, часто упускаемая из виду целью проекта «Геном человека» - исследование этических, правовых и социальных последствий расшифровки генома. Важно исследовать эти вопросы и найти наиболее подходящие решения до того, как они станут почвой для разногласий и политических проблем.

Почти все цели, которые ставил перед собой проект, были достигнуты быстрее, чем предполагалось. Проект по расшифровке генома человека был закончен на два года раньше, чем планировалось. Проект поставил разумную, достижимую цель секвенирования 95 % ДНК. Исследователи не только достигли её, но и превзошли собственные предсказания, и смогли секвенировать 99,99 % человеческой ДНК. Проект не только превзошёл все цели и выработанные ранее стандарты, но и продолжает улучшать уже достигнутые результаты.

Проект финансировался правительством США и британским благотворительным обществом Wellcome Trust (англ.), которое финансировало , а также множество других групп по всему свету. Геном был разбит на небольшие участки, примерно по 150 000 пар нуклеотидов в длину. Эти куски затем встраивали в вектор , известный как как Искусственная бактериальная хромосома (англ.) или BAC. Эти векторы созданы из бактериальных хромосом, измененных методами генной инженерии . Векторы, содержащие гены, затем можно вставлять в бактерии, где они копируются бактериальными механизмами репликации . Каждый из кусочков генома потом секвенировали раздельно методом «фрагментирования», и затем все полученные последовательности собирали воедино уже в виде компьютерного текста. Размеры полученных больших кусков ДНК, собираемых для воссоздания структуры целой хромосомы, составляли около 150 000 пар нуклеотидов. Такая система известна под именем «иерархического метода фрагментирования», потому что вначале геном разбивается на куски разного размера, положение которых в хромосоме должно быть заранее известно.

Сопоставление данных общего и частного проектов

Крейг Вентер

В 1998 году, американский исследователь Крейг Вентер и его фирма Celera Genomics запустили аналогичное исследование, финансированное частным капиталом. В начале 1990-х когда проект «Геном человека» только начинал работу, Вентер тоже работал в Национальном институте здоровья. Целью его собственного $300-миллионного проекта Celera было более быстрое и дешёвое секвенирование человеческого генома, чем в $3-миллиардном государственном проекте.

Celera использовала более рискованную разновидность метода фрагментации генома (англ.), которую использовали ранее для секвенирования бактериальных геномов размером до шести миллионов пар нуклеотидов в длину, но никогда для чего-либо столь большого, как человеческий геном, состоящий из трёх миллиардов пар нуклеотидов.

Вначале Celera анонсировала, что она будет добиваться патентной защиты «всего лишь 200 или 300» генов, но позднее внесла поправки, что ищет «защиту интеллектуальной собственности» на «полное описание важнейших структур», составляющих примерно 100-300 целей. Наконец фирма подала предварительные патентные заявки на 6,500 целых или частичных генов . Celera также обещала опубликовать результаты своей работы согласно условиям «Бермудского заявления (англ.)» 1996 года , выпуская новые данные ежеквартально (проект «Геном человека» выпускал новые данные ежедневно), однако, в отличие от проекта с государственным финансированием, фирма не дает разрешения на свободное распространение или коммерческое использование своих данных.

В марте 2000 года, президент США Билл Клинтон заявил что последовательность генома не может быть запатентована и должна быть свободно доступна для всех исследователей. После заявления президента акции компании Celera сильно упали, что потянуло вниз весь биотехнологический сектор рыночной капитализации за два дня.

Хотя рабочий вариант генома был анонсирован в июне 2000 года, Celera и учёные работавшие в проекте «Геном человека» опубликовали детали своей работы только в феврале 2001. Специальные выпуски журнала ) и журнала Science (который опубликовал статью Celera ) описали методы, использовавшиеся для производства черновика последовательности, и предложили ее анализ. Эти черновики покрывали примерно 83 % генома (90 % эухроматиновых регионов с 150 000 брешей, а также содержали порядок и ориентацию многих всё ещё не законченных сегментов). В феврале 2001 года, во время подготовки совместных публикаций, были выпущены пресс-релизы , говорящие о том, что проект был завершён обеими группами. В 2003 и 2005 гг. были анонсированы улучшенные черновики, содержавшие приблизительно 92 % последовательности.

Соревнование очень хорошо сказалось на проекте, заставив участников государственного проекта модифицировать свою стратегию, чтобы ускорить ход работы. Вначале конкуренты согласились объединить результаты, но союз распался после того, как Celera отказалась сделать свои результаты доступными через публичную базу данных GenBank с неограниченным доступом для всех пользователей. Celera включила данные проекта «Геном человека» в собственную последовательность, однако запретила попытки использовать свои данные для всех сторонних пользователей.

В 2004, исследователи из Международного Консорциума по Секвенированию Человеческого Генома (англ. International Human Genome Sequencing Consortium ) (IHGSC) проекта «Геном человека» огласили новую оценку числа генов в человеческом геноме составившую от 20,000 до 25,000 . Ранее предсказывалось от 30,000 до 40,000, а в начале проекта оценки доходили до 2,000,000. Это число продолжает колебаться и в настоящее время ожидается что ещё в течение многих лет не удастся прийти к согласию по поводу точного количества генов в человеческом геноме.

История частного проекта

Детали по данной теме смотри в статье История генетики .

В 1995 г. было показано, что данная техника применима к секвенированию первого бактериального генома (1,8 миллиона пар нуклеотидов) свободно живущего организма Haemophilus influenzae и первого генома животного (~100 млн пар оснований) . Метод включает использование автоматизированных секвенаторов, что позволяет определять более длинные индивидуальные последовательности (в то время однократно получалось приблизительно 500 пар нуклеотидов). Пересекающиеся последовательности размером примерно в 2000 пар нуклеотидов «читали» в двух направлениях, это были критические элементы, создание которых повлекло за собой разработку первых компьютерных программ сборки генома, необходимых для реконструирования больших регионов ДНК, известных под названием контиги ("contigs").

Три года спустя, в 1998, заявление только что созданной компании Celera Genomics, о том что она собирается масштабировать метод фрагментирования ДНК на человеческий геном, в некоторых кругах было встречено скептически . Техника фрагментирования разрывает ДНК на фрагменты различных размеров, от 2,000 до 300,000 пар нуклеотидов в длину, образуя то, что называется «библиотекой» ДНК. Затем ДНК «читают» с помощью автоматического секвенатора кусками по 800 пар нуклеотидов длиной с обоих концов каждого фрагмента. С помощью сложного алгоритма сборки и суперкомпьютера , кусочки собирают воедино, после чего геном может быть реконструирован из миллионов коротких фрагментов длиной в 800 пар нуклеотидов. Успех как государственного, так и частного проектов зависел от новой, более высоко автоматизированной капиллярной секвенирующей ДНК машины, которая называлась Applied Biosystems 3700 . Она прогоняла цепочки ДНК через необычайно тонкую капиллярную трубку , а не через плоский гель, как это делали в ранних моделях секвенаторов. Ещё более критическим фактором была разработка новой, более масштабной программы сборки генома, ассемблера, который мог бы обрабатывать 30-50 миллионов последовательностей, требующихся для секвенирования всего человеческого генома. В то время такой программы не существовало. Одним из первых крупных проектов в Celera Genomics стала разработка данного ассемблера, который был написан параллельно с созданием большой, высокоавтоматизированной фабрики секвенирования геномов. Разработка ассемблера велась под руководством Брайена Рамоса (англ. Brian Ramos ). Первая версия появилась в 2000 году, когда команда Celera объединила силы с профессором Джеральдом Рубином (англ.) для секвенирования генома фруктовой мушки Дрозофила меланогастер методом фрагментирования генома . Собрав 130 миллионов пар нуклеотидов, программа обработала, по меньшей мере, в 10 раз больше данных, чем любой ранее собранный из результатов метода фрагментирования геном. Год спустя команда Celera опубликовала свою сборку трёх миллиардов пар нуклеотидов человеческого генома.

Как были достигнуты результаты

IHGSC для ориентации и проверки правильности сборки последовательности каждой человеческой хромосомы использовал секвенирование концевых фрагментов в сочетании с картированием больших (около 100 тыс. пар оснований) плазмидных клонов, полученных методом фрагментирования генома, а также применял метод фрагментирования меньших субклонов тех же плазмид, а также множество других данных .

Группа Celera понимала важность метода фрагментирования генома и тоже использовала саму последовательность, чтобы ориентировать и найти правильное местоположение секвенированных фрагментов внутри хромосомы. Однако компания использовала и публично доступные данные из проекта «Геном человека», чтобы контролировать процесс сборки и ориентации, что поставило под вопрос независимость ее данных .

Доноры генома

В межгосударственном проекте «Геном человека» (HGP), исследователи из IHGSC взяли у большого числа доноров образцы крови (женщин) и спермы (мужчин). Из числа собранных образцов источником ДНК стали лишь несколько. Таким образом, личности доноров были скрыты, чтобы ни доноры, ни учёные не могли знать, чья именно ДНК была секвенирована. Во всём проекте были использованы многочисленные клоны ДНК из различных библиотек (англ.). Большинство из этих библиотек были созданы доктором Питером де Хонгом (англ. Pieter J. de Jong ). Неформально сообщалось, и в сообществе генетиков хорошо известно, что большая часть ДНК в государственном проекте получена от единственного анонимного донора - мужчины из Буффало (кодовое название RP11) .

В проекте компании Celera Genomics для секвенирования использовалась ДНК, поступившая от пяти различных человек. Крейг Вентер , в то время бывший главным научным руководителем Celera Genomics, позднее признался (в публичном письме в журнал Science), что его ДНК была одним из 21 образцов в общем фонде, пять из которых были отобраны для использования в проекте .

4 сентября 2007 года, команда под руководством Крейга Вентера опубликовала полную последовательность его собственной ДНК , впервые сняв покров тайны с шестимиллиарднонуклеотидной последовательности генома единственного человека.

Перспективы

Работа над интерпретацией данных генома находится всё ещё в своей начальной стадии. Ожидается что детальное знание человеческого генома откроет новые пути к успехам в медицине и биотехнологии . Ясные практические результаты проекта появились ещё до завершения работы. Несколько компаний, например Myriad Genetics (англ.), начали предлагать простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак груди , нарушения свёртываемости крови , кистозный фиброз , заболевания печени и многим другим. Также ожидается, что информация о геноме человека поможет поиску причин возникновения рака , болезни Альцгеймера и другим областям клинического значения и, вероятно, в будущем может привести к значительным успехам в их лечении.

Также ожидается множество полезных для биологов результатов. Например, исследователь, изучающий определённую форму рака может сузить свой поиск до одного гена. Посетив базу данных человеческого генома в сети , этот исследователь может проверить что другие учёные написали об этом гене включая (потенциально) трёхменую структуру его производного белка, его функции, его эволюционную связь с другими человеческими генами или с генами в мышах или дрожжах или дрозофиле, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела в которых ген активируется, заболеваниями, связанными с этим геном или другие данные.

Более того, глубокое понимание процесса заболевания на уровне молекулярной биологии может предложить новые терапевтические процедуры. Учитывая установленную огромную роль ДНК в молекулярной биологии и её центральную роль в определении фундаментальных принципов работы клеточных процессов , вероятно, что расширение знаний в данной области будет способствовать успехам медицины в различных областях клинического значения, которые без них были бы невозможны.

Анализ сходства в последовательностях ДНК различных организмов также открывает новые пути в исследовании теории эволюции . Во многих случаях вопросы эволюции теперь можно ставить в терминах молекулярной биологии . И в самом деле, многие важнейшие вехи в истории эволюции (появление рибосомы и органелл , развитие эмбриона , имунной системы позвоночных) можно проследить на молекулярном уровне. Ожидается что этот проект прольёт свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами (приматами , а на деле и всеми млекопитающими).

Проект определения разнообразия человеческого генома (англ.) (HGDP), отдельное исследование, нацеленное на картирование участков ДНК, которые различаются между этническими группами , который был, по слухам, приостановлен, но на самом деле продолжает работу и в настоящее время накапливает новые результаты. В будущем HGDP, вероятно, сможет получить новые данные в области контроля заболеваний, развития человека и антропологии. HGDP может открыть секреты уязвимости этнических групп к отдельным заболеваниям и подсказать новые стратегии для их преодоления (см. Раса и здоровье (англ.)). Он может также показать, как человеческие популяции адаптировались к этим заболеваниям.

Ссылки

Внешние ссылки

  • Delaware Valley Personalized Medicine Project - использует данные из проекта генома человека, чтобы сделать медицину более персонализированной;
  • National Human Genome Research Institute (NHGRI) - NHGRI возглавил работу над проектом в Национальном Институте Здравоохранения. Этот проект, который имел своей основной целью секвенирование трёх миллиардов пар нуклеотидов, из которых состоит человеческий геном, был успешно завершён в апреле 2003 года.
просмотров