. Дубна: 5 oC
Дата 19.04.2024
rss telegram vk ok

Объединенный коллектив исследователей из Mail.Ru Group, Insilico Medicine и МФТИ применил нейронную сеть для создания противораковых препаратов.

В базе неорганических молекул, известных фармакологам, несколько сотен миллионов веществ. Но только доля процента из них применяется в медицине.

Например, фармакологи продолжают исследовать аспирин, который применяется уже много лет, что-то добавляют к молекуле, чтобы снизить побочные эффекты или повысить эффективность, но сама молекула исходного вещества не менятся.

Исследователи из МФТИ и Insilico Medicine поставили себе цель — создать новые молекулы с заранее заданными свойствами и заставить глубокие нейронные сети “вообразить” новые структуры молекул, которые могли бы убивать раковые клетки при определенной концентрации.

За основу взяли специальную архитектуру нейронных сетей, позволяющую применять обучние без учителя – состязательных автокодировщиков. Для обучения нейронов использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные. Она была составлена из трёх структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Обучение нейронных сетей зависит от количества входных данных и от размеров самой сети.

В среднем такая нейронная сеть обучается в течение недели. Поиск наиболее оптимального решения архитектуры сети может занять от нескольких дней до нескольких месяцев. Настройка нейронной сети — это целое искусство.

Все молекулы представляются в виде смайлзов — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Стандартная запись, которой обучали в школе, не подходит для обработки сетью, но и смайлз не очень подходит — он имеет произвольную длину от одной буквы до 200. Для обучения нейронной сети требуется одинаковая длина описания (вектора).

Решает эту задачу фингерпринт, в переводе  – «отпечаток пальца» молекулы. Фингерпринт содержит в себе всю информацию о молекуле. Существует множество способов построения «отпечатка», исследователи использовали самый простой бинарный из 166 цифр. Они конвертировали смайлзы в фингерпринты и на них уже обучали сеть.

На вход нейронной сети подавались «отпечатки» известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов так, чтобы при заданном входе получился заданный же выход. Эта операция повторялась много раз.  В результате получился «чёрный ящик», который умеет при заданном входе давать заданный выход.

Затем разработчики убрали первые слои, и сеть генерировала фингерпринты при обратном прогоне уже сама. Учёные построили «отпечатки» для всех 72 млн молекул и далее сравнивали сгенерированные сетью фингерпринты с базой. Отобранные молекулы должны потенциально обладать заданными качествами.

Для проверки сети использовали базу известных противораковых лекарств. Исследовали сверили сгенерированные сетью соединения с общей базой. Из полученных 69 молекул многие являются активно используемыми противораковыми препаратами. А вот остальные потенциально могут стать основой новых лекарственных препаратов.

Рассказывает один из авторов исследования Александр Жаворонков, глава Insilico Medicine и международный адъюнкт-профессор МФТИ:

– Генеративные состязательные сети с применением обучения с подкреплением — это будущее фармакологии. В этой статье мы показали первое применение генеративных состязательных автокодировщиков, GAN’ов, для создания новых молекулярных структур противоопухолевых препаратов по определённым параметрам. Эта работа была сделана ещё летом, и с тех пор мы значительно продвинулись в этом направлении. Я очень надеюсь, что в скором времени мы сможем разрабатывать индивидуальные лекарства для лечения редких заболеваний и даже для лечения отдельных пациентов. Уже в этом году искусственный интеллект начнёт трансформировать фармацевтическую индустрию.

 – GAN’ы находятся сейчас на переднем крае нейронауки. Совершенно очевидно, что они могут быть использованы на более широком спектре задач, чем генерация картинок и музыки. Мы попробовали применить этот подход в биоинформатике и получили прекрасный результат», — подводит итог Артур Кадурин, ведущий программист группы оптимизации поиска Mail.RuGroup, независимый научный консультант InsilicoMedicine.

Использование технологий генеративных нейронных состязательных сетей, обученных «придумывать» молекулярные структуры, может в разы сокращать время и стоимость поиска веществ, обладающих потенциально лечебными свойствами. Исследователи предполагают возможное применение этих технологий для поиска новых препаратов в самых разных областях от онкологии до сердечно-сосудистых заболеваний. Результаты опубликованы в журнале Оncotarget.

Добавить комментарий

Комментарии не должны оскорблять автора текста и других комментаторов. Содержание комментария должно быть конкретным, написанным в вежливой форме и относящимся исключительно к комментируемому тексту.


Защитный код
Обновить