Mistral Small 4: één model voor redeneren, visie en coderen

16

Mistral AI heeft Small 4 uitgebracht, een nieuw open-source taalmodel dat is ontworpen om meerdere AI-functies in één efficiënt pakket te consolideren. Het model combineert redeneren, multimodale mogelijkheden (het omgaan met tekst en afbeeldingen) en codeerprestaties, terwijl wordt gestreefd naar lagere gevolgtrekkingskosten dan concurrerende oplossingen. Dit is belangrijk omdat bedrijven vaak voor elke taak afzonderlijke modellen inzetten, waardoor de complexiteit en de kosten toenemen.

Uniforme mogelijkheden in een kleiner pakket

Small 4 bouwt voort op Mistral Small 3.2 en biedt een enkel model dat overeenkomt met de prestaties van de grotere aanbiedingen van Mistral, zoals Magistral (redeneren), Pixtral (multimodaal begrip) en Devstral (codering). Ondanks dat er slechts 6 miljard actieve parameters per token zijn binnen een totaal van 119 miljard, beschikt het model over een contextvenster van 256K, handig voor lange analyses en gesprekken. Deze architectuur, gebaseerd op een mix van experts, maakt efficiënte schaalvergroting en specialisatie mogelijk, wat snellere reacties betekent, zelfs voor complexe taken.

De afweging: efficiëntie versus fragmentatie

Hoewel de flexibiliteit van Small 4 een technisch voordeel is, wordt de markt geconfronteerd met een groeiende fragmentatie naarmate er meer kleine modellen verschijnen van bedrijven als Qwen en Claude. Volgens Rob May, CEO van Neurometric, is het winnen van ‘mindshare’ – een standaard testcase worden – cruciaal voor adoptie. Mistral moet de capaciteiten van zijn model bewijzen om marktverwarring te overwinnen en zichzelf als een haalbare optie te profileren.

Redeneren op aanvraag met aanpasbare inspanning

Een belangrijk kenmerk is de parameter ‘reasoning_effort’, waarmee gebruikers het gedrag van het model dynamisch kunnen aanpassen. Bedrijven kunnen kiezen tussen snelle, lichtgewicht reacties vergelijkbaar met Small 3.2 of meer gedetailleerde, stapsgewijze redenering vergelijkbaar met Magistral. Deze controle over de uitvoerstijl is waardevol voor uiteenlopende toepassingen, van het snel parseren van documenten tot diepgaande analytische taken.

Hardware en prestaties

Mistral Small 4 is geoptimaliseerd voor Nvidia-hardware en vereist slechts vier HGX H100/H200 GPU’s of twee DGX B200’s. Benchmarks laten zien dat het in de buurt van Mistral Medium 3.1 en Large 3 presteert in MMLU Pro, hoewel het achter Qwen en Claude Haiku blijft in redeneerintensieve benchmarks zoals LiveCodeBench. Mistral stelt echter dat de aanzienlijk kortere output zich vertaalt in lagere kosten en latentie, waardoor het concurrerend wordt in grootschalige bedrijfstoepassingen. In de instructiemodus genereert Small 4 de kortste output van alle geteste modellen.

Samenvattend vertegenwoordigt Mistral Small 4 een stap in de richting van het consolideren van AI-mogelijkheden in efficiëntere en toegankelijkere modellen. Het succes ervan zal afhangen van het overwinnen van de marktfragmentatie en het bewijzen van de waarde ervan voor bedrijven die prioriteit geven aan kosteneffectiviteit en prestaties.