Mistral AI випустила Small 4, нову модель з відкритим вихідним кодом, покликану поєднати кілька функцій штучного інтелекту в одному ефективному пакеті. Модель поєднує в собі міркування, мультимодальні можливості (обробку тексту та зображень) та продуктивність у кодуванні, прагнучи при цьому до зниження витрат на виведення даних у порівнянні з конкуруючими рішеннями. Це важливо, оскільки компанії часто розгортають окремі моделі для кожного завдання, збільшуючи складність та витрати.
Об’єднані Можливості в Компактному Пакеті
Small 4 заснована на Mistral Small 3.2 і пропонує єдину модель, яка відповідає продуктивності більших пропозицій Mistral, таких як Magistral (міркування), Pixtral (мультимодальне розуміння) та Devstral (кодування). Незважаючи на наявність всього 6 мільярдів активних параметрів на токен при загальній кількості 119 мільярдів, модель може похвалитися контекстним вікном у 256K, корисним для аналізу та діалогів у довгому форматі. Ця архітектура, заснована на суміші експертів, дозволяє ефективно масштабувати та спеціалізувати, що означає швидші відповіді навіть для складних завдань.
Компроміс: Ефективність проти Фрагментації
Хоча гнучкість Small 4 є технічною перевагою, ринок стикається з дедалі більшою фрагментацією в міру появи все більшої кількості невеликих моделей від таких компаній, як Qwen і Claude. За словами Роба Мея, генерального директора Neurometric, завоювання “впливу” – становлення стандартним прикладом для тестування – має вирішальне значення для впровадження. Mistral повинна довести можливості своєї моделі, щоб подолати ринкову плутанину і утвердитися як життєздатний варіант.
Міркування на вимогу з регульованими зусиллями
Ключовою особливістю є параметр reasoning_effort, що дозволяє користувачам динамічно регулювати поведінку моделі. Компанії можуть вибирати між швидкими, легкими відповідями, аналогічними Small 3.2, або докладнішими, покроковими міркуваннями, схожими на Magistral. Цей контроль над стилем виведення цінний для різних додатків, від швидкого аналізу документів до поглиблених аналітичних завдань.
Обладнання та Продуктивність
Mistral Small 4 оптимізована для апаратного забезпечення Nvidia, вимагаючи всього чотири графічні процесори HGX H100/H200 або два DGX B200. Порівняння показує, що вона працює на рівні Mistral Medium 3.1 і Large 3 в MMLU Pro, хоча і відстає від Qwen і Claude Haiku в бенчмарках, що інтенсивно використовують міркування, такі як LiveCodeBench. Тим не менш, Mistral стверджує, що її значно більш короткі вихідні дані призводять до зниження витрат і затримок, що робить її конкурентоспроможною у високопродуктивних корпоративних додатках. У режимі інструкцій Small 4 генерує найкоротші вихідні дані з усіх протестованих моделей.
На закінчення, Mistral Small 4 є кроком до консолідації можливостей штучного інтелекту у більш ефективні та доступні моделі. Її успіх залежатиме від подолання ринкової фрагментації та доказу її цінності для підприємств, що віддають пріоритет економічної ефективності та продуктивності.
