Разработан новый метод для предсказания оптических свойств молекул

Ученые из Института AIRI разработали новый метод машинного обучения для точного предсказания оптических свойств молекул, который поможет в создании красителей, OLED-материалов и биомаркеров.

Разработан новый метод для предсказания оптических свойств молекул

Подход основан на 3D-графовых нейронных сетях, учитывающих не только состав молекулы, но и пространственное расположение атомов, что позволило снизить ошибку предсказания более чем на 30% по сравнению с лучшими существующими нейросетевыми моделями.

Для обучения нейросети ученые собрали специализированный набор данных nablaColors-3D, который включает экспериментальные данные об оптических свойствах молекул и их трехмерные структуры в различных растворителях. Все записи были вручную сверены с первоисточниками, а ошибочные данные исправлены или удалены. Это первый крупный набор данных, где для молекул-хромофоров доступны пространственные структуры, что позволило применить особый класс нейросетевых моделей, учитывающих трехмерную геометрию.

В ходе исследования ученые сравнили пять современных моделей, работающих с геометрией молекул, включая PaiNN, DimeNet++ и UniMol+. Каждую модель предобучили на крупных химических датасетах, а затем дообучили на наборе nablaColors-3D для предсказания экспериментальных спектров. Для сравнения также использовались сильные базовые модели, которые учитывают только информацию о химических связях без пространственной геометрии.

Качество предсказания оценивалось по средней абсолютной ошибке между предсказанной и экспериментальной длиной волны. Лучшая модель без учета геометрии показала ошибку около 24 нанометров, тогда как модель с учетом пространственной структуры снизила этот показатель до 16 нанометров. Для сравнения, традиционный квантово-химический метод TD-DFT на том же тесте давал ошибку около 62 нанометров. Исследователи также установили, что чем точнее метод расчета геометрии молекулы, тем лучше качество предсказаний.

По словам Дениса Потапова, научного сотрудника группы органической химии Центра ИИ-разработки новых лекарственных препаратов Института AIRI, знания только о химических связях недостаточно для точного предсказания оптических свойств. Именно пространственное расположение атомов определяет электронную структуру молекулы и, следовательно, то, как она поглощает и испускает свет. Учет этого фактора дал основной прирост точности в новом подходе, который позволяет решать задачу за доли секунды на одну молекулу, тогда как экспериментальная проверка или квантово-химические расчеты требуют значительно больше времени и ресурсов.

Читайте также: «Разработан метод переработки пластика в жизненно важные лекарства».