Începe era Gemini 3: AI-ul Google vine cu un raționament multimodal mai bun și cu rezolvarea problemelor complexe

Comentariu

Google și Alphabet au anunțat începutul erei Gemeni 3următoarea generație a modelului său de inteligență artificială, care este încorporată progresiv în produse precum AI Mode in Search, aplicația Gemini, Google AI Studio, Vertex AI și noua platformă de dezvoltare a agenților Google Antigravity.

Compania susține că acest salt este susținut de îmbunătățiri ale raționamentului multimodal și o capacitate crescută de a rezolva probleme complexe din domenii precum știința, matematica și programarea, consolidarea proiectului început cu aproape doi ani în urmă cu Gemini 1 și continuat cu Gemini 2 și Gemini 2.5 Pro.

CITEȘTE ȘI

Studiul arată că 66% dintre companiile columbiene au trecut de faza inițială de adoptare a AI

Camila Sanchez Fajardo

Sundar Pichai, CEO Google și Alphabet, a amintit că programul Gemini a devenit unul dintre cele mai ambițioase eforturi științifice și de produs ale companiei.

Potrivit datelor lor, Prezentare generală creată de AI ajunge deja la 2 miliarde de utilizatori lunar, aplicația Gemini adaugă 650 de milioane de utilizatori pe lună, peste 70% dintre clienții cloud ai Google folosesc instrumentele sale AI și 13 milioane de dezvoltatori au lucrat cu modelele sale generative.

Managerul a declarat că fiecare generație a extins posibilitățile disponibile utilizatorilor și companiilor și și-a încheiat mesajul cu sintagma „Mai sunt multe de făcut!”

Gemeni 3 — Debutează cu îmbunătățiri cheie în raționamentul multimodal și își extinde prezența în serviciile Google. Fotografie:Google

CITEȘTE ȘI

CEO-ul Alphabet avertizează asupra riscurilor financiare, energetice și sociale legate de inteligența artificială

Camila Sanchez Fajardo

Gemini 3 Pro: noi performanțe în testele de raționament și multimodalitate

Demis Hassabis, CEO al Google DeepMind și Koray Kavukcuoglu, CTO al Google DeepMind și Chief AI Architect la Google, au prezentat Gemini 3 ca un model care vizează inteligența generală artificială (AGI) și s-au concentrat pe înțelegerea profundă a contextelor, a nuanțelor și a semnalelor subtile. Compania îl numește cel mai avansat model până în prezent înțelegere multimodală și codare orientată către agentcu accent pe vizualizări bogate și interactivitate bazată pe raționament.

Versiunea de previzualizare Gemini 3 Pro este acum disponibilă pentru o gamă largă de produse Googleeste primul exponent public al acestei generații. Conform datelor publicate de companie, acesta îl depășește clar pe Gemini 2.5 Pro în principalele teste de referință.

Se află în fruntea clasamentului LMArena cu 1501 de puncte, cu 50 de puncte ELO mai mare decât recordul anterior al Gemini 2.5 Pro și obține rezultate clasificate la nivel de doctorat la teste precum Humanity’s Last Exam, unde obține 37,5% fără a folosi instrumente externe și GPQA Diamond, cu 91,9%.

La matematică, modelul ajunge la 23,4% în MathArena Apex, prezentat de Google drept noua stare a artei modelelor de frontieră. În ea teren multimodalcompania are 81% la MMMU-Pro, 87,2% la Video-MMMU și 72,1% la SimpleQA Verified, un indicator utilizat pentru a măsura progresul în acuratețea faptelor.

Împreună, aceste rezultate sunt prezentate ca dovadă că Gemini 3 Pro poate aborda probleme complexe dintr-o gamă largă de discipline cu un grad ridicat de fiabilitate.

Lucrarea este clasificată drept plagiată dacă similaritatea textului este mai mare de 20%. — Modelul trece teste tehnice precum WebDev Arena și Terminal-Bench, arătând o mai mare autonomie. Fotografie:iStock

CITEȘTE ȘI

Funcțiile Grok 3 includ teste de matematică, știință și programare.

Grok 4.1 vine de la xAI: asistentul lui Elon Musk devine mai creativ, inteligent emoțional și mai precis

Maria Salas Valencia

„Deep Think”: mod extins de raționament pentru provocări mai complexe

Împreună cu versiunea Pro, Google a prezentat Gemini 3 Deep Thinkun mod de raționament consolidat care extinde capacitățile modelului în înțelegerea multimodală și rezolvarea noilor provocări. În evaluările interne, acest mod depășește scorurile Gemini 3 Pro menționate mai sus la Humanity’s Last Exam, cu 41,0% fără a apela la instrumente, și la GPQA Diamond, unde ajunge la 93,8%.

În plus, Gemini 3 Deep Think realizează 45,1% în ARC-AGI (cu execuție de cod), un etalon conceput pentru a testa capacitatea sistemelor AI de a aborda sarcini nemaivăzute până acum. Deocamdată, acest mod se află în faza de evaluare a siguranței și a fost distribuit cu testeri specializați înainte de sosirea sa pentru abonații Google AI Ultra.

Pentru a primi documentul electronic trebuie să vă înregistrați. — Deep Think îmbunătățește performanța la evaluările avansate, cum ar fi Humanity’s Last Exam și GPQA Diamond. Fotografie:Generat cu AI, iStock

CITEȘTE ȘI

Nu este doar X: întreruperea globală a Cloudflare afectează servicii precum Canva, ChatGPT și multe altele

Întreruperea globală a Cloudflare: compania raportează recuperarea din „degradarea serviciului intern”, dar avertizează asupra ratelor persistente de eroare

Camila Sanchez Fajardo

Gemeni 3 este despre învățarea, construirea și planificarea „orice”

Compania poziționează Gemini 3 ca un instrument pentru învață, construiește și planifica în mai multe contexte. De la origine, platforma a fost concepută pentru a combina informații în diferite formate (text, imagini, video, audio și cod), iar această nouă generație încorporează un raționament multimodal mai larg, o fereastră de context de 1 milion de token și capabilități de înțelegere spațială și multilingvă.

Google observă că, de exemplu, modelul poate interpreta rețete scrise de mână în diferite limbi și le poate transforma într-o carte de bucate de familie care poate fi partajată sau poate procesa articole academice, lecții video și tutoriale lungi pentru a genera carduri, vizualizări și alte resurse interactive care ușurează studiul. Se evidențiază, de asemenea, posibilitatea analizării înregistrărilor jocurilor de pickleball, identificarea aspectelor tehnice de îmbunătățire și dezvoltarea planurilor de antrenament personalizate.

În modul AI din Finder, Gemini 3 îmbunătățește o serie de caracteristici, inclusiv Design-uri vizuale captivante, instrumente interactive și simulări generate dinamic pe baza interogării utilizatorului. Este pentru prima dată când o nouă versiune a modelului Gemini este încorporată în motorul de căutare din prima zi a lansării sale.

În multe companii, chatbot-urile sunt folosite pentru a facilita procesele operaționale. — Google Antigravity introduce agenți care pot planifica și executa sarcini întregi. Fotografie:iStock

CITEȘTE ȘI

Fie in magazinele fizice, fie pe site-uri, in fiecare an Black Friday este sinonim cu reduceri.

Vinerea neagră: ghid pentru a profita de ea fără a afecta planeta sau a fi înșelat

Jose Garcia Rico

Dezvoltare software și agenți: de la asistență în timp util la partener activ

Gemini 3 introduce o evoluție în capacitățile de dezvoltare ale gestionați instrucțiuni complexe și generați componente de la zerocu scopul de a facilita crearea de interfețe web interactive și de a crește autonomia sistemelor. Compania subliniază acest lucru Acest model reprezintă cel mai mare progres în codificarea bazată pe vibrații și codarea bazată pe agenți.menite să îmbunătățească eficiența și productivitatea celor care construiesc soluții cu instrumentele lor.

Rezultatele obținute în teste de specialitate, precum 1487 de puncte ELO în WebDev Arena, 54,2% în Terminal-Bench 2.0 și 76,2% în SWE-bench Verified, întăresc această poziționare. În plus, Modelul este disponibil pe Google AI Studio, Vertex AI, Gemini CLI și platforma Google Antigravityprecum și în serviciile terților, care lărgesc sfera operațională și permit utilizarea agenților capabili să planifice și să execute activități software în mod cuprinzător.

Software — Îmbunătățiți planificarea susținută, gestionarea proceselor complexe și a fluxurilor de lucru zilnice. Fotografie:iStock

CITEȘTE ȘI

Iată cum puteți vedea persoanele pe care le urmăriți pe fiecare profil Instagram: „Prieteni”

Maria Rodríguez Rozo

Planificare pe termen lung și sarcini zilnice automatizate

Gemini 3 se adâncește și în planificarea susținută de-a lungul timpului, menținând consistența în obiective și decizii. În Vending-Bench 2, un test care simulează administrarea automatelor automate timp de douăsprezece luni, modelul dobândește leadership datorită utilizării stabile a instrumentelor și execuției orientate spre rezultate, care arată îmbunătățiri în capacitatea sa de management continuu.

Aceste funcții sunt transferate în activitățile zilnice, unde sistemul poate organiza procese în mai mulți pași, cum ar fi sortarea corespondenței sau crearea de itinerarii de călătorie. Capacitățile agentului sunt disponibile prin Gemini Agent pentru abonații Google AI Ultra, cu planuri de a extinde aceste capabilități la mai multe produse și de a le permite utilizatorilor să delege sarcini sub supraveghere directă.

securitate cibernetică- — Încorporează evaluări ample de securitate și este implementat treptat în mai multe servicii. Fotografie:iStock

CITEȘTE ȘI

Activitatea cerebrală a inteligenței artificiale

Vă va permite inteligența artificială să citiți gândurile? Un om de știință transformă activitatea creierului în text cu ajutorul inteligenței artificiale: „Folosește cu grijă”

Johan Infante Guerrero

Securitate, evaluări externe și disponibilitatea modelului

Dezvoltarea Gemini 3 încorporează un accent sporit pe siguranță, cu teste interne care acoperă un spectru mai larg decât generațiile anterioare. Modelul prezintă îmbunătățiri ale rezistenței la injectare, reducerea răspunsurilor conforme și protecție sporită împotriva tentativelor de exploatare rău intenționată, integrându-se în același timp în cadrul Google Border Security Framework.

Evaluările efectuate împreună cu organisme internaționale și companii independente precum Apollo, Vaultis și Dreadnode completează acest proces. În ceea ce privește desfășurarea, modelul va fi activat pentru utilizatorii aplicației Gemini, abonații Google AI Pro și Ultra în modul Finder AI, dezvoltatorii API în Google Antigravity și companiile care folosesc Vertex AI. Deep Think Mode va continua să fie evaluat înainte de lansarea sa pentru Google AI Ultra, deoarece compania pregătește noi versiuni ale seriei Gemini 3 pentru a-și extinde aplicațiile.

*Acest conținut a fost rescris cu ajutorul inteligenței artificiale, pe baza unui raport de la Google.

Mai multe știri pe EL TIEMPO

Urmăriți toate informațiile despre tehnologie Facebook ŞI Xsau în buletinul nostru informativ săptămânal.

Comentariu

Începe era Gemini 3: AI-ul Google vine cu un raționament multimodal mai bun și cu rezolvarea problemelor complexe

Studiul arată că 66% dintre companiile columbiene au trecut de faza inițială de adoptare a AI

CEO-ul Alphabet avertizează asupra riscurilor financiare, energetice și sociale legate de inteligența artificială

Gemini 3 Pro: noi performanțe în testele de raționament și multimodalitate

Grok 4.1 vine de la xAI: asistentul lui Elon Musk devine mai creativ, inteligent emoțional și mai precis

„Deep Think”: mod extins de raționament pentru provocări mai complexe

Întreruperea globală a Cloudflare: compania raportează recuperarea din „degradarea serviciului intern”, dar avertizează asupra ratelor persistente de eroare

Gemeni 3 este despre învățarea, construirea și planificarea „orice”

Vinerea neagră: ghid pentru a profita de ea fără a afecta planeta sau a fi înșelat

Dezvoltare software și agenți: de la asistență în timp util la partener activ

Iată cum puteți vedea persoanele pe care le urmăriți pe fiecare profil Instagram: „Prieteni”

Planificare pe termen lung și sarcini zilnice automatizate

Vă va permite inteligența artificială să citiți gândurile? Un om de știință transformă activitatea creierului în text cu ajutorul inteligenței artificiale: „Folosește cu grijă”

Securitate, evaluări externe și disponibilitatea modelului

Mai multe știri pe EL TIEMPO

Articole Similare

Leave a Comment Cancel reply