Специалисты Facebook научили ИИ решать сложные математические задачи

Несмотря на то, что нейронные сети основаны на линейной алгебре и исчислениях, они испытывают трудности с пониманием математики. Как следствие, для осуществления математических операций таким системам требуется большое количество времени и вычислительной мощности. Специалисты подразделения Facebook Research AI решили подойти к проблеме с другой стороны и разработали методику, которая позволяет преобразовывать сложные математические задачи в машиночитаемые данные. Для этого ученые применили технологию, используемую для перевода текстов с английского языка на китайский. Иными словами, ученые научили искусственный интеллект «говорить» на математическом языке.

Математические переменные и уравнения нейросеть Facebook обрабатывает подобно частям речи. Аналогично разбору предложения, программа преобразует уравнения в дерево, которое компьютер может прочитать так же, как любой другой язык. В области машинного перевода существует множество исследований, поэтому, чтобы перевести задачи в решения, ученые просто воспользовались одной из популярных моделей перевода.

Facebook ограничила свое исследование решением интегральных и дифференциальных уравнений — двух областей математики, для которых характерны продолжительное время вычислений и неточные результаты. Однако в дальнейшем его можно будет применять и в других областях — например, флюидодинамике или биологических процессах.

Стоит отметить, что модель Facebook значительно превосходит существующие программные продукты в этой области. Так, при решении сложных интегральных задач ее точность составляет 99,7%, тогда как в системе Mathematica точность равна 84%. Программные пакеты Mathematica и Matlab решают подобные задачи при помощи линейных вычислений, однако на это требуется продолжительное время. Преимущество модели машинного обучения — в том, что после обучения нейронной сети решения предоставляются практически мгновенно. Таким образом, задачи, на решение которых у Mathematica и Matlab уходит более трех минут, модель Facebook решает за полсекунды.

Так же как в случае с любой нейронной сетью, правильные ответы нельзя гарантировать, отметили специалисты Facebook. Модели основаны на распознавании и аппроксимации шаблонов, поэтому разработчикам следует подходить к применению технологии с осторожностью, учитывая существующую вероятность ошибок. С другой стороны, результаты всегда можно проверить при помощи традиционных вычислений.

Ключевой недостаток новой технологии — неспособность нейросети объяснить, почему или каким образом она достигла того или иного результата. Технология напоминает черный ящик: любые математические решения, которые он использует, заблокированы в его нейронных слоях.

Работа Facebook опубликована для широкого доступа, и после дополнительной проверки может использоваться в тех же пакетах Mathematica и Matlab. По мнению ученых, их разработка является важным шагом на пути к новому способу применения нейросетей, выходящему за рамки традиционных задач, с которыми ИИ уже справляется.

Источник