Grok 4.1 vine de la xAI: asistentul lui Elon Musk devine mai creativ, inteligent emoțional și mai precis

00:00
00:00

Comentariu

xAI prezentat „Grok 4.1”o actualizare care încorporează îmbunătățiri în creativitate, înțelegere emoțională și acuratețe.
Lansarea a avut loc între 1 și 14 noiembrie 2025 printr-o lansare progresivă pe grok.com, X și aplicații mobile. În această perioadă au fost efectuate evaluări oarbe asupra traficului real pentru a determina performanța modelului.
Compania susține că aceste îmbunătățiri provin din utilizarea aceleiași infrastructuri de învățare de întărire folosită în Grok 4, aplicată la reglarea fină. stil, personalitate și aliniere.

CITEȘTE ȘI

LA

Aflați cum să îmbunătățiți răspunsurile ChatGPT, Gemini și Grok folosind sugestii clare și eficiente pentru rezultate mai utile și mai precise

Daniele Bonilla Martinez

Distribuție și primele rezultate

Potrivit site-ului oficial al lui Grok, procesul a început cu lansări de pre-lansare care vizează o parte din ce în ce mai mare din traficul de producție. Compania asigură că, în urma acestor teste, noul model a fost preferat în 64,78% din timp față de versiunea anterioară.

Abilități generale și clasificare

Grok 4.1 a atins performanțe excepționale în Evaluări oarbe ale preferințelor umane. În LMArena Text Arena, varianta Grok 4.1 Thinking (quasarflux) a obținut 1483 de puncte Elo, pe primul loc, în timp ce modul non-thinking (tensor) a obținut 1465 de puncte Elo și s-a clasat pe locul al doilea.
Conform informațiilor furnizate, acest din urmă mod a depășit alte modele cu un raționament cuprinzător. În plus, Rețineți că Grok 4.1 a înlocuit în mare măsură rezultatele Grok 4care era pe locul 33.
Funcțiile Grok 3 includ teste de matematică, știință și programare.

Poate fi folosit în modul automat sau selectat în meniul sub eticheta „Grok 4.1”. Fotografie:xAI/EFE

CITEȘTE ȘI

Fie in magazinele fizice, fie pe site-uri, in fiecare an Black Friday este sinonim cu reduceri.

Vinerea neagră: ghid pentru a profita de ea fără a afecta planeta sau a fi înșelat

Jose Garcia Rico

Evaluări ale inteligenței emoționale, scrierii creative și reducerii halucinațiilor

Măsurarea inteligenței emoționale
Examinați aspecte precum empatia, abilitățile interpersonale și coerența personalității; xAI a evaluat modelul pe EQ-Bench3, un test cu 45 de scenarii de joc de rol. Pentru obținerea rezultatelor s-au folosit parametrii impliciti, judecătorul „Claude Sonnet 3.7” și calculul Elo normalizat.
Performanță în scrierea creativă
De asemenea, a fost supus Grok 4.1 încercați Scrierea creativă v3care include 32 de sloganuri dezvoltate în trei iterații. Calificarea a fost stabilită prin rubrici și comparații pe perechi, urmând un sistem Elo normalizat similar cu cel utilizat în evaluările inteligenței emoționale.
.

Această actualizare include îmbunătățiri ale creativității, înțelegerii emoționale și preciziei. Fotografie:TwitterxAI

CITEȘTE ȘI

Nu este doar X: întreruperea globală a Cloudflare afectează servicii precum Canva, ChatGPT și multe altele

Nu este doar X: întreruperea globală a Cloudflare afectează servicii precum Canva, ChatGPT și multe altele

Camila Sanchez Fajardo

Controlul halucinațiilor
În ceea ce privește erorile de fapt, informațiile furnizate indică faptul că instruirea ulterioară s-a concentrat asupra acestora reduce halucinațiile atunci când caută informațiiun punct critic în modelele rapide care funcționează cu bugete limitate pentru apeluri de instrumente.
Compania indică faptul că rata halucinațiilor în traficul real a fost măsurată și că a fost folosit indicele FActScore, compus din 500 de întrebări biografice, pentru a valida îmbunătățirile observate.
Disponibilitate
Conform textului original, Grok 4.1 este acum disponibil pentru toți utilizatorii de pe grok.com, X și aplicațiile iOS și Android. Poate fi folosit în modul automat sau selectat direct în meniul de sub „Grok 4.1”.
*Acest conținut a fost scris cu ajutorul inteligenței artificiale, pe baza informațiilor cunoscute public dezvăluite presei. În plus, a fost revizuită de jurnalistă și de un editor.

Mai multe știri pe EL TIEMPO

Urmăriți toate informațiile despre tehnologie Facebook ŞI Xsau în buletinul nostru informativ săptămânal.

00:00
00:00

Comentariu

Leave a Comment

Your email address will not be published. Required fields are marked *