Mistral AI выпустила Small 4, новую модель с открытым исходным кодом, призванную объединить несколько функций искусственного интеллекта в одном эффективном пакете. Модель сочетает в себе рассуждения, мультимодальные возможности (обработку текста и изображений) и производительность в кодировании, стремясь при этом к снижению затрат на вывод данных по сравнению с конкурирующими решениями. Это важно, поскольку компании часто развертывают отдельные модели для каждой задачи, увеличивая сложность и расходы.
Объединённые Возможности в Компактном Пакете
Small 4 основана на Mistral Small 3.2 и предлагает единую модель, которая соответствует производительности более крупных предложений Mistral, таких как Magistral (рассуждения), Pixtral (мультимодальное понимание) и Devstral (кодирование). Несмотря на наличие всего 6 миллиардов активных параметров на токен при общем количестве 119 миллиардов, модель может похвастаться контекстным окном в 256K, полезным для анализа и диалогов в длинном формате. Эта архитектура, основанная на смеси экспертов, позволяет эффективно масштабировать и специализировать, что означает более быстрые ответы даже для сложных задач.
Компромисс: Эффективность против Фрагментации
Хотя гибкость Small 4 является техническим преимуществом, рынок сталкивается с растущей фрагментацией по мере появления все большего количества небольших моделей от таких компаний, как Qwen и Claude. По словам Роба Мэя, генерального директора Neurometric, завоевание «влияния» — становление стандартным примером для тестирования — имеет решающее значение для внедрения. Mistral должна доказать возможности своей модели, чтобы преодолеть рыночную путаницу и утвердиться в качестве жизнеспособного варианта.
Рассуждения по Требованию с Регулируемыми Усилиями
Ключевой особенностью является параметр reasoning_effort, позволяющий пользователям динамически регулировать поведение модели. Компании могут выбирать между быстрыми, лёгкими ответами, аналогичными Small 3.2, или более подробными, пошаговыми рассуждениями, похожими на Magistral. Этот контроль над стилем вывода ценен для различных приложений, от быстрого разбора документов до углублённых аналитических задач.
Оборудование и Производительность
Mistral Small 4 оптимизирована для аппаратного обеспечения Nvidia, требуя всего четыре графических процессора HGX H100/H200 или два DGX B200. Сравнение показывает, что она работает на уровне Mistral Medium 3.1 и Large 3 в MMLU Pro, хотя и отстаёт от Qwen и Claude Haiku в бенчмарках, интенсивно использующих рассуждения, таких как LiveCodeBench. Тем не менее Mistral утверждает, что её значительно более короткие выходные данные приводят к снижению затрат и задержек, что делает её конкурентоспособной в высокопроизводительных корпоративных приложениях. В режиме инструкций Small 4 генерирует самые короткие выходные данные среди всех протестированных моделей.
В заключение, Mistral Small 4 представляет собой шаг к консолидации возможностей искусственного интеллекта в более эффективные и доступные модели. Её успех будет зависеть от преодоления рыночной фрагментации и доказательства её ценности для предприятий, которые отдают приоритет экономической эффективности и производительности.






























