Met de lancering van R1 heeft DeepSeek niet alleen een schokgolf veroorzaakt in Silicon Valley, maar ook de concurrentie binnen het Middenrijk geïntensiveerd. Afgelopen februari kondigde Baidu, een belangrijke Chinese speler in GenAI en eigenaar van de gelijknamige zoekmachine, aan dat hun AI-model Ernie in juni open source zou worden en dat hun chatbot Ernie Bot gratis zou zijn. Ze hebben een tandje bijgezet, want gisteren publiceerden ze ERNIE 4.5, de nieuwste versie van hun multimodale fundamentmodel, en ook ERNIE X1, een model gericht op redeneren, dat prestaties biedt vergelijkbaar met R1, maar tegen de helft van de prijs. Beide zijn geïntegreerd in Ernie Bot, dat daardoor iets eerder gratis is dan gepland.
Volgens Baidu bevat ERNIE 4.5 significante verbeteringen in begrip, generatie, redenering en geheugen. Het profiteert onder meer van een betere beheersing van hallucinaties en een optimalisatie van logisch redeneren. Het vermogen om tegelijkertijd tekst, afbeeldingen, geluid en video te verwerken, maakt het een krachtig hulpmiddel voor diverse toepassingen, variërend van dialoog tot contentcreatie.
De verbeteringen aan het model zijn te danken aan verschillende sleuteltechnologieën, waaronder de dynamische aandachtmaskering 'FlashMask', de heterogene multimodale mengeling van experts, de compressie van ruimtelijke-temporale representatie, de kennisgerichte opbouw van trainingsdata en de verbeterde zelffeedback na training.
In hun persbericht stelt het bedrijf dat ERNIE 4.5 GPT-4.5 overtreft in verschillende benchmarks, terwijl het 100 keer minder kost.
ERNIE X1, gericht op multimodale redenering en het gebruik van geavanceerde tools, zou uitblinken in planning, analyse en het oplossen van complexe problemen. Het bevat specifieke functies zoals geavanceerd zoeken, generatie en interpretatie van afbeeldingen, het lezen van webpagina's en conceptuele mapping via TreeMind.
Een gok op toegankelijkheid en concurrerend vermogen
Door deze modellen gratis beschikbaar te maken voor het grote publiek en concurrerende prijzen aan te bieden voor bedrijven via hun cloudplatform Qianfan, wil Baidu zijn invloed in het AI-ecosysteem versterken. ERNIE 4.5 wordt aangeboden voor 0,004 RMB (ongeveer 0,0005 euro) per duizend tokens in input en 0,016 RMB (ongeveer 0,002 euro) in output, terwijl ERNIE X1 nog lagere prijzen laat zien: het wordt aangeboden voor 0,002 RMB (ongeveer 0,00025 euro) voor hetzelfde aantal tokens in input en 0,008 RMB (ongeveer 0,001 euro) in output.
Deze agressieve prijsstelling gaat gepaard met een wens om generatieve AI te democratiseren, terwijl deze modellen geleidelijk worden geïntegreerd in de producten en diensten van Baidu, waaronder hun zoekmachine en de applicatie Wenxiaoyan.
Door een model aan te bieden met prestaties vergelijkbaar met R1, maar tegen de helft van de prijs, toont Baidu duidelijk zijn ambitie om de sector niet alleen in China, maar ook tegenover Amerikaanse spelers te domineren.
