Генетическая лотерея
Шрифт:
На изображении ниже приведена иллюстрация того, как выглядят результаты секвенирования после выравнивания на референсный геном – определения участка генома, который был прочитан в каждом конкретном прочтении. Прочтения выглядят как серые горизонтальные полоски и в данном случае имеют длину 100 нуклеотидов. Количество таких прочтений, покрывающих каждый нуклеотид референсного генома (последовательность приведена в нижней части изображения) является покрытием. Например, позицию в геноме, обозначенную черным цветом, покрывает 44 прочтения (на экране видны не все 44), значит покрытие этой позиции – 44х.
Теперь еще раз обратим внимание на эту позицию – во всех прочтениях был обнаружен нуклеотид Т, что говорит
Наш пример ниже с неверно определенным нуклеотидом А в 1 из 42 ридов никак не повлияет на определение генотипа (G/G), так как биоинформатические программы, обрабатывающие такие данные, умеют находить и исключать такие ошибки секвенирования. Более того, каждый прочитанный нуклеотид в каждом прочтении имеет показатели качества, которые говорят о том, насколько система секвенирования была уверена в верности прочтения нуклеотида. Эти показатели также используется в биоинформатических программах, определяющих генотипы, еще больше снижая вероятность ошибок. В конце концов, алгоритмы финальной фильтрации данных вообще исключают участки с недостаточно хорошими показателями качества, позволяя быть максимально уверенными в конечном результате (рис. 13).
Рис. 13. Результаты секвенирования после выравнивания на референсный геном.
В секвенировании всегда нужно помнить о том, что на верность определения генотипа влияет огромное количество факторов, в том числе генетические контекст. Определить генетическую вариацию в генетически сложном регионе (например, длинной повторяющейся последовательности нескольких нуклеотидов) достаточно сложно, и вероятность ошибки для таких вариаций существенно выше. В целом нужно понимать, что такого рода генетические тесты являются скрининговыми, и в случае обнаружения каких-либо серьезных генетических изменений результат требует валидации методами так называемого золотого стандарта – ПЦР или секвенирование по Сэнгеру. Этим занимаются специализированные лаборатории, имеющие аккредитацию.
В случае обычных генетических тестов, выполняемых на ДНК микрочипах, ошибки составляют менее 1 процента всех прогенотипированных локусов, что подтверждается многочисленными исследованиями качества генотипирования различных чипов, в основном изготавливаемых компанией Illumina. Как и в случае с секвенированием, вероятность ошибки зависит от генетического контекста:
1. однонуклеотидные замены (например, A->G) имеют меньшую частоту ошибки, чем инсерции и делеции;
2. мультинуклеотидные
3. замены, располагающиеся в генетически сложных регионах, имеют более высокую вероятность ошибки, чем все остальные типы генетических вариаций.
В общем, можно сказать, что, как и в любом другом научном методе, вероятность ошибки никогда не бывает нулевой, но она минимизирована максимально в соответствии с доступными на данный момент технологиями лабораторного анализа и анализа данных. Все тесты являются скрининговыми, то есть позволяют дешево проанализировать огромное количество локусов генома. Найденные подозрительные и клинически значимые изменения нужно валидировать методами золотого стандарта, которые на порядки дороже в пересчете на один участок генома, однако позволяют установить истину.
О чем расскажут ДНК-тесты?
Генетические тесты позволяют узнать о человеке много различной информации, однако все компании, предоставляющие услуги генотипирования, предлагают плюс-минус одинаковые разделы. Их наполнение разнится, в то время как логика интерпретации остается одной и той же. В этой главе мы поговорим о том, какую информацию можно извлечь из среднестатистического генетического теста и как ее получают.
Наследственные заболевания вызываются одним или несколькими генетическими изменениями в одном гене. Науке давно известно огромное количество конкретных мутаций различных генов, вызывающих развитие того или иного патологического состояния. Зная список этих мутаций, патогенные изменения последовательности нуклеотидов и их расположение в геноме человека, можно сравнивать результаты генотипирования, полученные из ДНК-теста, с этой базой патогенных мутаций и предоставлять результаты о найденных мутациях.
Стоит отметить, что некоторые мутации имеют неполную пенетрантность, то есть внешние проявления наличия мутации (в нашем случае какое-либо заболевание) проявляются не у всех людей, у кого эта мутация есть. Причины этого кроются в сложном наследовании и молекулярных взаимодействиях, которые не всегда технически возможно отследить в генетическом тесте. Как результат, некоторые находки анализа на наследственные заболевания могут не соответствовать внешним проявлениям, однако требуют сторонней проверки, например, при планировании семьи.
Развитие некоторых заболеваний (например, болезнь Крона, ишемическая болезнь сердца и другие) зависит не от какой-либо одной мутации в каком-либо одном гене (как в случае с наследственными заболеваниями), а от целого спектра различных генетических вариаций в различных генах. То есть вероятность развития заболевания может, например, увеличиваться при наличии какого-либо варианта в каком-то одном месте генома, а при наличии другого варианта в другом участке ДНК – уменьшаться. Для разных заболеваний количество таких генетических вариаций, увеличивающих или уменьшающих риск развития заболевания, варьируется от двух до нескольких сотен. Каждая генетическая вариация вносит свой вклад (увеличивающий риск или уменьшающий его), и при анализе данных генотипирования эти вариации анализируются и определяется суммарный риск. Почти всегда на риск развития таких заболеваний влияет не только генетика, но и факторы внешней среды (образ жизни и т. п.), возраст, вес, пол. Эти параметры тоже имеют свой либо увеличивающий, либо уменьшающий риск вклад, и могут учитываться в интерпретации в случае, если человек, сдавший генетический тест, предоставляет эти данные об образе жизни и некоторых других параметрах.