00:00
00:00
Comentariu
xAI prezentat „Grok 4.1”o actualizare care încorporează îmbunătățiri în creativitate, înțelegere emoțională și acuratețe.
Lansarea a avut loc între 1 și 14 noiembrie 2025 printr-o lansare progresivă pe grok.com, X și aplicații mobile. În această perioadă au fost efectuate evaluări oarbe asupra traficului real pentru a determina performanța modelului.
Compania susține că aceste îmbunătățiri provin din utilizarea aceleiași infrastructuri de învățare de întărire folosită în Grok 4, aplicată la reglarea fină. stil, personalitate și aliniere.
CITEȘTE ȘI

Aflați cum să îmbunătățiți răspunsurile ChatGPT, Gemini și Grok folosind sugestii clare și eficiente pentru rezultate mai utile și mai precise
Daniele Bonilla Martinez
Distribuție și primele rezultate
Potrivit site-ului oficial al lui Grok, procesul a început cu lansări de pre-lansare care vizează o parte din ce în ce mai mare din traficul de producție. Compania asigură că, în urma acestor teste, noul model a fost preferat în 64,78% din timp față de versiunea anterioară.
Abilități generale și clasificare
Grok 4.1 a atins performanțe excepționale în Evaluări oarbe ale preferințelor umane. În LMArena Text Arena, varianta Grok 4.1 Thinking (quasarflux) a obținut 1483 de puncte Elo, pe primul loc, în timp ce modul non-thinking (tensor) a obținut 1465 de puncte Elo și s-a clasat pe locul al doilea.
Conform informațiilor furnizate, acest din urmă mod a depășit alte modele cu un raționament cuprinzător. În plus, Rețineți că Grok 4.1 a înlocuit în mare măsură rezultatele Grok 4care era pe locul 33.

Poate fi folosit în modul automat sau selectat în meniul sub eticheta „Grok 4.1”. Fotografie:xAI/EFE
CITEȘTE ȘI

Vinerea neagră: ghid pentru a profita de ea fără a afecta planeta sau a fi înșelat
Jose Garcia Rico
Evaluări ale inteligenței emoționale, scrierii creative și reducerii halucinațiilor
Măsurarea inteligenței emoționale
Examinați aspecte precum empatia, abilitățile interpersonale și coerența personalității; xAI a evaluat modelul pe EQ-Bench3, un test cu 45 de scenarii de joc de rol. Pentru obținerea rezultatelor s-au folosit parametrii impliciti, judecătorul „Claude Sonnet 3.7” și calculul Elo normalizat.
Performanță în scrierea creativă
De asemenea, a fost supus Grok 4.1 încercați Scrierea creativă v3care include 32 de sloganuri dezvoltate în trei iterații. Calificarea a fost stabilită prin rubrici și comparații pe perechi, urmând un sistem Elo normalizat similar cu cel utilizat în evaluările inteligenței emoționale.

Această actualizare include îmbunătățiri ale creativității, înțelegerii emoționale și preciziei. Fotografie:TwitterxAI
CITEȘTE ȘI

Nu este doar X: întreruperea globală a Cloudflare afectează servicii precum Canva, ChatGPT și multe altele
Camila Sanchez Fajardo
Controlul halucinațiilor
În ceea ce privește erorile de fapt, informațiile furnizate indică faptul că instruirea ulterioară s-a concentrat asupra acestora reduce halucinațiile atunci când caută informațiiun punct critic în modelele rapide care funcționează cu bugete limitate pentru apeluri de instrumente.
Compania indică faptul că rata halucinațiilor în traficul real a fost măsurată și că a fost folosit indicele FActScore, compus din 500 de întrebări biografice, pentru a valida îmbunătățirile observate.
Disponibilitate
Conform textului original, Grok 4.1 este acum disponibil pentru toți utilizatorii de pe grok.com, X și aplicațiile iOS și Android. Poate fi folosit în modul automat sau selectat direct în meniul de sub „Grok 4.1”.
*Acest conținut a fost scris cu ajutorul inteligenței artificiale, pe baza informațiilor cunoscute public dezvăluite presei. În plus, a fost revizuită de jurnalistă și de un editor.
Mai multe știri pe EL TIEMPO
Urmăriți toate informațiile despre tehnologie Facebook ŞI Xsau în buletinul nostru informativ săptămânal.
00:00
00:00
Comentariu





