Модель Mistral 8x7b Small догнала уровень GPT-3.5

Компьютерра 12 декабря 2023 23:45

На чтение: 2 минуты

Нравится:

Хорошие новости в мире опенсорса: выпущена бесплатная open source модель Mistral 8x7b Small, которая по результатам тестов и качеству ответов догнала ChatGPT-3.5.

Что известно

Модель вышла в трех вариантах: mistral-tiny, mistral-small, mistral-medium. По качеству она догнала LLama2, GPT 3.5. При этом на инференсе в 6 раз быстрее, чем LLama. Еще одно преимущество в том, что она бесплатная и открытая. Модель работает на английском, французском, итальянском, немецком и испанском. Контекст — 32К токенов. Модель есть тут, а потестировать ее онлайн можно тут.

У сообщества заняло примерно 1,5 года, чтобы достичь этих результатов. Другие open source модели, которые выдавали похожие результаты, были слишком большими, чтобы обычные юзеры могли их использовать. К тому же Mistral работает без цензуры. Внутри модели восемь ИИ-агентов, каждый из которых хорош в чем-то своем. Вместе они «советуются», пытаясь выдать вам идеальный ответ.

Почему это важно

Куда важнее раунд финансирования: Mistral AI привлекла 450 миллионов евро при оценке в 2 миллиарда долларов. В сентябре компания, соучредители которой выпускники Google DeepMind и Meta*, выпустила свою первую модель, Mistral 7B, которая превзошла другие модели такого же размера.

В то же время инвесторы, похоже, рассматривают Mistral, а также ее конкурента, немецкую компанию Aleph Alpha, как возможность для Европы установить свой флаг на очень плодородной почве генеративного ИИ. До сих пор самые громкие и хорошо финансируемые предприятия в области генеративного ИИ находились на территории США: OpenAI, Anthropic, Inflection AI, Cohere. Удача Mistral — это во многом микрокосм борьбы за суверенитет ИИ. Европейский союз хочет не остаться в стороне от очередного технологического скачка и в то же время вводит правила, регулирующие развитие технологий.

Meta* — экстремистская и запрещенная в РФ организация.

Подписывайтесь на наш Telegram Подписаться