Ученые из Института общей генетики имени Н.И. Вавилова (г. Москва), Московского Государственного университета имени М.В. Ломоносова (г. Москва), Института белка РАН (г. Пущино Московской обл.) совместно с зарубежными коллегами протестировали множество нейросетей разной сложности для предсказания уровня экспрессии генов.
Для оценки того, как архитектура модели и стратегия обучения влияют на эффективность геномной модели был организован конкурс DREAM Challenge. Перед участниками стояла задача разработать модели «последовательность-экспрессия» и обучить их. Модели получают регуляторную последовательность ДНК в качестве входных данных и используют ее для прогнозирования уровня экспрессии гена.
Для надежной оценки моделей был разработан комплексный набор тестов, охватывающих различные типы последовательностей. Все наиболее эффективные модели использовали нейронные сети, но различались по архитектуре и стратегиям обучения. Чтобы проанализировать, как архитектурные и обучающие составляющие влияют на эффективность, была разработана структура Prix Fixe для разделения моделей на модульные строительные блоки. Были протестированы все возможные комбинации для трех лучших моделей, что еще больше улучшило их эффективность.
Модели DREAM Challenge не только достигли самых современных результатов на комплексном наборе данных для дрожжей, но и превзошли существующие тесты на наборах геномных данных для Drosophila и человека, демонстрируя прогресс, которого можно добиться с помощью наборов данных геномики золотого стандарта.
Кроме того, данное исследование показало, что более простые архитектуры нейронных сетей с меньшим количеством параметров при тщательной настройке могут превзойти по эффективности новейшие более сложные алгоритмы.
Результаты работы оформлены в статью:
Abdul Muntakim Rafi, Daria Nogina, Dmitry Penzar, Dohoon Lee, Danyeong Lee, Nayeon Kim, Sangyeup Kim, Dohyeon Kim, Yeojin Shin, Il-Youp Kwak, Georgy Meshcheryakov, Andrey Lando, Arsenii Zinkevich, Byeong-Chan Kim, Juhyun Lee, Taein Kang, Eeshit Dhaval Vaishnav, Payman Yadollahpour, Random Promoter DREAM Challenge Consortium, Sun Kim, Jake Albrecht, Aviv Regev, Wuming Gong, Ivan V. Kulakovskiy, Pablo Meyer & Carl G. de Boer. A community effort to optimize sequence-based deep learning models of gene regulation. Nature Biotechnology, 2024. https://doi.org/10.1038/s41587-024-02414-w.
По материалам данной статьи на портале InSCIENCE опубликован пресс-релиз «Российская нейросеть легла в основу новой платформы для моделирования регуляторных участков генома».
Array
(
[und] => Array
(
[0] => Array
(
[value] =>
Ученые из Института общей генетики имени Н.И. Вавилова (г. Москва), Московского Государственного университета имени М.В. Ломоносова (г. Москва), Института белка РАН (г. Пущино Московской обл.) совместно с зарубежными коллегами протестировали множество нейросетей разной сложности для предсказания уровня экспрессии генов.
Для оценки того, как архитектура модели и стратегия обучения влияют на эффективность геномной модели был организован конкурс DREAM Challenge. Перед участниками стояла задача разработать модели «последовательность-экспрессия» и обучить их. Модели получают регуляторную последовательность ДНК в качестве входных данных и используют ее для прогнозирования уровня экспрессии гена.
Для надежной оценки моделей был разработан комплексный набор тестов, охватывающих различные типы последовательностей. Все наиболее эффективные модели использовали нейронные сети, но различались по архитектуре и стратегиям обучения. Чтобы проанализировать, как архитектурные и обучающие составляющие влияют на эффективность, была разработана структура Prix Fixe для разделения моделей на модульные строительные блоки. Были протестированы все возможные комбинации для трех лучших моделей, что еще больше улучшило их эффективность.
Модели DREAM Challenge не только достигли самых современных результатов на комплексном наборе данных для дрожжей, но и превзошли существующие тесты на наборах геномных данных для Drosophila и человека, демонстрируя прогресс, которого можно добиться с помощью наборов данных геномики золотого стандарта.
Кроме того, данное исследование показало, что более простые архитектуры нейронных сетей с меньшим количеством параметров при тщательной настройке могут превзойти по эффективности новейшие более сложные алгоритмы.
Результаты работы оформлены в статью:
Abdul Muntakim Rafi, Daria Nogina, Dmitry Penzar, Dohoon Lee, Danyeong Lee, Nayeon Kim, Sangyeup Kim, Dohyeon Kim, Yeojin Shin, Il-Youp Kwak, Georgy Meshcheryakov, Andrey Lando, Arsenii Zinkevich, Byeong-Chan Kim, Juhyun Lee, Taein Kang, Eeshit Dhaval Vaishnav, Payman Yadollahpour, Random Promoter DREAM Challenge Consortium, Sun Kim, Jake Albrecht, Aviv Regev, Wuming Gong, Ivan V. Kulakovskiy, Pablo Meyer & Carl G. de Boer. A community effort to optimize sequence-based deep learning models of gene regulation. Nature Biotechnology, 2024. https://doi.org/10.1038/s41587-024-02414-w.
По материалам данной статьи на портале InSCIENCE опубликован пресс-релиз «Российская нейросеть легла в основу новой платформы для моделирования регуляторных участков генома».
[summary] =>
Ученые из Института общей генетики имени Н.И. Вавилова (г. Москва), Московского Государственного университета имени М.В. Ломоносова (г. Москва), Института белка РАН (г. Пущино Московской обл.) совместно с зарубежными коллегами протестировали множество нейросетей разной сложности для предсказания уровня экспрессии генов.
[format] => full_html
[safe_value] =>
Ученые из Института общей генетики имени Н.И. Вавилова (г. Москва), Московского Государственного университета имени М.В. Ломоносова (г. Москва), Института белка РАН (г. Пущино Московской обл.) совместно с зарубежными коллегами протестировали множество нейросетей разной сложности для предсказания уровня экспрессии генов.
Для оценки того, как архитектура модели и стратегия обучения влияют на эффективность геномной модели был организован конкурс DREAM Challenge. Перед участниками стояла задача разработать модели «последовательность-экспрессия» и обучить их. Модели получают регуляторную последовательность ДНК в качестве входных данных и используют ее для прогнозирования уровня экспрессии гена.
Для надежной оценки моделей был разработан комплексный набор тестов, охватывающих различные типы последовательностей. Все наиболее эффективные модели использовали нейронные сети, но различались по архитектуре и стратегиям обучения. Чтобы проанализировать, как архитектурные и обучающие составляющие влияют на эффективность, была разработана структура Prix Fixe для разделения моделей на модульные строительные блоки. Были протестированы все возможные комбинации для трех лучших моделей, что еще больше улучшило их эффективность.
Модели DREAM Challenge не только достигли самых современных результатов на комплексном наборе данных для дрожжей, но и превзошли существующие тесты на наборах геномных данных для Drosophila и человека, демонстрируя прогресс, которого можно добиться с помощью наборов данных геномики золотого стандарта.
Кроме того, данное исследование показало, что более простые архитектуры нейронных сетей с меньшим количеством параметров при тщательной настройке могут превзойти по эффективности новейшие более сложные алгоритмы.
Результаты работы оформлены в статью:
Abdul Muntakim Rafi, Daria Nogina, Dmitry Penzar, Dohoon Lee, Danyeong Lee, Nayeon Kim, Sangyeup Kim, Dohyeon Kim, Yeojin Shin, Il-Youp Kwak, Georgy Meshcheryakov, Andrey Lando, Arsenii Zinkevich, Byeong-Chan Kim, Juhyun Lee, Taein Kang, Eeshit Dhaval Vaishnav, Payman Yadollahpour, Random Promoter DREAM Challenge Consortium, Sun Kim, Jake Albrecht, Aviv Regev, Wuming Gong, Ivan V. Kulakovskiy, Pablo Meyer & Carl G. de Boer. A community effort to optimize sequence-based deep learning models of gene regulation. Nature Biotechnology, 2024. https://doi.org/10.1038/s41587-024-02414-w.
По материалам данной статьи на портале InSCIENCE опубликован пресс-релиз «Российская нейросеть легла в основу новой платформы для моделирования регуляторных участков генома».
[safe_summary] =>
Ученые из Института общей генетики имени Н.И. Вавилова (г. Москва), Московского Государственного университета имени М.В. Ломоносова (г. Москва), Института белка РАН (г. Пущино Московской обл.) совместно с зарубежными коллегами протестировали множество нейросетей разной сложности для предсказания уровня экспрессии генов.
)
)
)