Tech

Che cos'è Gemini, l'ultima risposta di Google a ChatGPT

Mountain View ha lanciato un nuovo modello di intelligenza artificiale nella speranza di imporsi, definitivamente, nel settore: le sue capacità, sulle prime, sembrano sbalorditive
© Google
Red. Online
06.12.2023 19:30

Gemini. Un anno dopo il lancio di ChatGPT, il chatbot di OpenAI che ha rivoluzionato il settore, Google ha svelato la sua ultima «arma» per riaffermare la propria posizione di leader dell'intelligenza artificiale. Un'ambizione che, stando a quanto hanno condiviso quelli di Mountain View, sembrerebbe perfettamente realizzabile. Gemini, infatti, è capace di lavorare con testi, immagini e video. Il motore di Gemini, un algoritmo, potrebbe essere la rivoluzione più importante per il colosso californiano dopo PageRank, che a suo tempo consentì al motore di ricerca di conquistare, di fatto, la totalità del mercato. Permettendo appunto a Google di diventare un'azienda globale.

© Google
© Google

Una prima versione di Gemini verrà distribuita a partire da oggi all'interno della versione in inglese di Bard, il chatbot di Google, in oltre 170 Paesi e territori. Nei prossimi mesi, secondo il colosso, Gemini sarà sempre più integrato in altri prodotti Google. Come la ricerca generativa, gli annunci pubblicitari e Chrome. Sempre da oggi, ancora, una versione più compatta di Gemini fornirà suggerimenti per le risposte ai messaggi per gli ultimi smartphone della casa, i Pixel 8. La versione più potente del sistema, invece, debutterà nel 2024, sempre che i controlli di fiducia e sicurezza vengano superati.

Gemini, ha spiegato Google, è nato «multimodale». Ovvero, è stato addestrato sulla base di immagini, video e audio. Non solo sui testi, insomma. «È il nostro modello più grande e più capace; è anche il più generale», ha spiegato Eli Collins, vicepresidente dei prodotti di Google DeepMind, durante un appuntamento con la stampa. Le versioni di Gemini esistenti sono tre. Ultra, la più grande e più capace. Nano, la più piccola ma anche la più efficiente. Pro, di dimensioni e capacità intermedie.

Da oggi, Bard sarà alimentato da Gemini Pro. Secondo l'azienda, consentirà al chatbot di fare ragionamenti più profondi. Bard, fra le altre cose, migliorerà anche in ambiti considerati più «umani», come la pianificazione e il brainstorming. Google, in questo senso, ha organizzato varie dimostrazioni per illustrare alla stampa (e al mondo) le capacità di Gemini. Capacità che, se confermate, sono sbalorditive. Due ricercatori di Google, addirittura, hanno anche mostrato come Gemini potrebbe rilevarsi utile per la ricerca scientifica, rispondendo a domande su un documento di ricerca con grafici ed equazioni.

A detta di Collins, Gemini Pro ha superato GPT-3.5, il modello con cui inizialmente era alimentato ChatGPT, in sei degli otto benchmark utilizzati per testare l'intelligenza dei software AI. Gemini Ultra, il modello in arrivo l'anno prossimo, ha addirittura ottenuto un punteggio del 90% nel benchmark Massive Multitask Language Understanding, sviluppato dagli accademici per testare i modelli linguistici in matematica, diritto e storia degli Stati Uniti. È un punteggio, questo, superiore a qualsiasi altro modelli AI, GPT-4 di OpenAI compreso. 

A proposito di GPT-4: quando ha debuttato, a inizio marzo, ha favorito non poche riflessioni circa il momento, esatto, in cui l'intelligenza artificiale saprà rivaleggiare con la nostra, intesa come umana. OpenAI ha sempre descritto GPT-4 come multimodale, in grado di elaborare anche immagini e audio. L'azienda, tuttavia, non ha mai chiarito se anche l'addestramento è avvenuto utilizzando altresì dati sonori e visivi. 

È probabile, considerando la durata media dell'addestramento di questi modelli, che Gemini sia costato a Google centinaia di milioni di dollari. Il che, come detto, rilancia le ambizioni del colosso di Mountain View. Che, con questo lancio, intende distogliere l'attenzione da OpenAI e iniziare a spostare gli equilibri (nuovamente) verso la grande G. Google, in effetti, si trovava già in una situazione di leadership nel settore dell'intelligenza artificiale: banalmente, aveva sviluppato alcune tecniche riprese proprio da ChatGPT. Eppure, aveva ritardato il lancio dei suoi chatbot per il timore che potessero dire o fare cose inappropriate, perfino pericolose. 

Collins, al riguardo, ha chiarito che Gemini è stato testato utilizzando una serie di comandi sviluppati dall'Allen Institute for AI. Non solo, l'azienda sta collaborando con ricercatori esterni in quello che potremmo definire uno stress test, nel quale il modello viene spinto a comportarsi in maniera scorretta e a esporre i propri punti deboli. Considerando quanto è potente Gemini, è chiaro che l'asticella in termini di qualità e sicurezza deve giocoforza essere altissima.

© Google
© Google

Il progetto Gemini è stato annunciato una prima volta a maggio, quando Google era in piena «guerra di rincorsa» per contrastare la popolarità di ChatGPT. I cui modelli, GPT-3.5 e GPT-4, sono stati integrati nel motore di ricerca di Microsoft, Bing. La quota di Google nel mercato globale delle ricerche online è ancora superiore al 90%, ma il fatto che il colosso ora abbia accelerato significa che Mountain View sta ancora cercando di raggiungere (per poi superare) OpenAI.

Una risposta legata, va da sé, anche alla creazione della divisione DeepMind, nata ad aprile per guidare lo sviluppo di Gemini dalla fusione di Google Brain e da DeepMind. Il nome, infine, non è certo casuale: vuole sottolineare da un lato il gemellaggio fra i due principali laboratori di intelligenza di intelligenza artificiale in seno a Google, Brain e DeepMind appunto, e dall'altro l'omonimo progetto della NASA che, di fatto, aprì la strada allo sbarco sulla Luna con il programma Apollo.