Компания Google представила новую модель искусственного интеллекта Gemini 3.1 Flash-Lite, позиционируя ее как самое быстрое и экономически эффективное решение в линейке Gemini 3. Модель предназначена в первую очередь для разработчиков, работающих с высоконагруженными задачами в промышленных масштабах.

Доступ к предварительной версии модели открыт для разработчиков через Gemini API в Google AI Studio, а для корпоративных клиентов — через платформу Vertex AI.
Главной особенностью новинки заявлено сочетание низкой стоимости и высокой производительности. Стоимость использования составляет 0,25 доллара за 1 миллион входных токенов и 1,50 доллара за 1 миллион выходных токенов. По данным компании, модель демонстрирует улучшенные характеристики по сравнению с предыдущей версией Gemini 2.5 Flash: скорость выдачи первого токена ответа выросла в 2,5 раза, а общая скорость генерации увеличилась на 45% при сохранении или улучшении качества ответов.
Разработчикам также доступна функция гибкой настройки глубины «размышления» модели, что позволяет оптимизировать ее работу для конкретных задач — от простых операций вроде перевода или модерации контента до более сложных, требующих многоступенчатого анализа, таких как создание пользовательских интерфейсов или моделирование ситуаций.