«Яндекс» представил метод для оценки стиля и естественности перевода

В «Яндексе» разработали новую систему оценки качества машинного перевода RATE, которая выявляет ошибки в естественности и стиле, незаметные для предыдущих метрик. Метод уже используется для совершенствования переводческих моделей компании.

«Яндекс» представил метод для оценки стиля и естественности перевода

Исследователи «Яндекса» представили новый метод оценки качества машинного перевода RATE (Refined Assessment for Translation Evaluation). Его задача — выявлять ошибки в переводах, которые делают уже достаточно точные модели, но которые могут страдать от недостаточной естественности.

Новая метрика анализирует перевод по трем ключевым критериям: точность передачи смысла, естественность языка и соответствие стилю оригинала. Это позволяет применять RATE к любым типам текстов — новости, соцсети, художественную литературу. Система не только фиксирует ошибки, но и определяет степень их серьезности.

RATE не используется для прямого дообучения моделей, но с высокой точностью указывает на конкретные недостатки, которые необходимо исправить для улучшения качества перевода. По данным тестов на материалах международного конкурса WMT, метод выявляет в семь раз больше ошибок, чем другие популярные системы оценки — MQM и ESA. Это показывает, что многие недочеты, заметные пользователям, ранее не регистрировались.

«Яндекс» уже применяет RATE для совершенствования собственных моделей перевода, адаптируя их к различным сценариям — от деловой коммуникации до повседневного общения. Метрика помогает ориентировать алгоритмы на живую человеческую речь, а не только на формальную точность.

Что будем искать? Например,ChatGPT

Мы в социальных сетях