Rambler's Top100
Все новости Новости отрасли

В России разработана программа для поиска патогенных изменений в малоизученных областях генов

20 февраля 2023

Российские исследователи разработали компьютерную программу, которая повысит эффективность диагностики редких генетических заболеваний. Алгоритм на основе искусственного интеллекта позволяет выявлять патогенные варианты нуклеотидной последовательности в 5`-нетранслируемых областях генов. 

Программа, созданная специалистами лаборатории функциональной геномики подведомственного Минобрнауки России Медико-генетического научного центра имени академика Н. П. Бочкова (МГНЦ), может применяться в случаях, когда стандартные методы не приносят результата.

В первую очередь при ДНК-диагностике наследственных заболеваний исследователи ищут патогенные варианты в той части гена, с которой непосредственно происходит трансляция основного белка, кодируемого этим геном. Однако в генах человека также есть последовательности, не участвующие в кодировании белка. Одна из таких — 5`-нетранслируемая область. Она играет важную роль в регуляции активности работы генов, это происходит за счет различных механизмов, среди них — малые открытые рамки считывания (upstream ORFs, uORFs). Это последовательности нуклеотидов, с которых может происходить трансляция, но они находятся перед основной кодирующей частью гена.

По оценкам научного сообщества, более половины генов человека могут иметь такие рамки считывания, но патогенные варианты в них описаны лишь в единичных случаях. Ученые связывают это, с одной стороны, с отсутствием качественного перечня малых открытых рамок считывания в генах человека, а с другой, с отсутствием доступных инструментов для поиска и интерпретации вариантов в них.

Решение таких задач находится в области биоинформатики. Ее методы нацелены на анализ больших объемов данных. Специалисты МГНЦ, Дальневосточного Федерального Университета (ДВФУ), Научно-исследовательского института искусственного интеллекта (AIRI), Института биоинформатики и их иностранные коллеги детально проанализировали около 3600 генов, связанных с наследственными заболеваниями, которые упоминаются в базе данных OMIM. В результате было описано примерно 4,7 тыс. сайтов инициации трансляции — участков, с которых начинается трансляция малых открытых рамок считывания в 1782 генах, ассоциированных с развитием наследственных заболеваний.

«Одним из важнейших результатов работы стало подтверждение того, что у половины генов, связанных с наследственными заболеваниями, существуют малые открытые рамки считывания, — рассказала научный сотрудник лаборатории функциональной геномики МГНЦ Александра Филатова, — до настоящего момента не было создано достаточно качественного списка с координатами uORF в генах человека, что затрудняло поиск патогенных вариантов в них. Наше исследование важно для повышения качества ДНК-диагностики пациентов с наследственными заболеваниями».

Ученые создали собственную модель машинного обучения, которая позволяет находить патогенные варианты в малых открытых рамках считывания. С ее помощью были проанализированы варианты, находящиеся в открытых базах данных HGMD и ClinVar , и найдены те из них, которые приводят к развитию заболевания именно за счет нарушения малых открытых рамок считывания.

Опираясь на проведенный детальный анализ в небольшой части генов, ассоциированных с развитием наследственных заболеваний, компьютерная программа может предсказывать наличие малых открытых рамок считывания во всех остальных генах человека.

Источник: Минобрнауки РФ

Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!

Оставить свой комментарий:

Для комментирования необходимо авторизоваться!

Комментарии по материалу

Данный материал еще не комментировался.

Продолжение использования сайта пользователем интерпретируется как согласие на обработку фрагментов персональных данных (таких, как cookies) для целей корректной работы сайта.

Согласен