Gemini (modello linguistico)
Gemini software | |
---|---|
Genere | Modello linguistico di grandi dimensioni (non in lista) |
Sviluppatore | Google DeepMind |
Data prima versione | 6 dicembre 2023 |
Ultima versione | 6 dicembre 2023 |
Sistema operativo | |
Licenza | Software proprietario (licenza non libera) |
Lingua | Inglese |
Sito web | deepmind.google/technologies/gemini/ |
Gemini è una famiglia di modelli linguistici di grandi dimensioni multimodali sviluppata da Google DeepMind, che rappresenta il successore di LaMDA e PaLM 2. Presentato nelle tre versioni Gemini Ultra, Gemini Pro e Gemini Nano, è stato annunciato il 6 dicembre 2023, come contendente di GPT-4 di OpenAI.
Storia
[modifica | modifica wikitesto]Sviluppo
[modifica | modifica wikitesto]Google ha annunciato Gemini durante la presentazione di apertura del Google I/O del 10 maggio 2023. È stato presentato dall'amministratore delegato di Google Sundar Pichai come un successore più potente di PaLM 2, anch'esso presentato nello stesso evento, pur essendo ancora nelle fasi iniziali di sviluppo.[1][2] A differenza di altri LLM, Gemini presentava delle caratteristiche peculiari in quanto non era addestrato solo su un corpus di testo, ma era progettato per essere multimodale, potendo elaborare più tipi di dati contemporaneamente, come testo, immagini, audio, dati SEO, video e linguaggi di programmazione.[3][4] È nato da una collaborazione tra DeepMind e Google Brain, due rami di Google successivamente fusi in Google DeepMind.[5] In un'intervista con Wired, il CEO di DeepMind Demis Hassabis ha evidenziato le capacità evolute di Gemini, in grado secondo lui di surclassare ChatGPT di OpenAI, basato su GPT-4 e la cui crescente popolarità era stata aggressivamente contrastata da Google con LaMDA e Bard. Hassabis ha evidenziato i punti di forza del programma AlphaGo di DeepMind, che ha attirato l'attenzione di tutto il mondo nel 2016 quando ha sconfitto il campione di go Lee Sedol, affermando che Gemini avrebbe combinato la potenza di AlphaGo e di altri LLM di Google-DeepMind.[6]
Nell'agosto 2023, il sito web The Information ha pubblicato un rapporto che svelava la tabella di marcia di Google per Gemini, rivelando che la società aveva come obiettivo una data di lancio verso la fine del 2023. Secondo il rapporto, Google sperava di superare OpenAI e altri concorrenti combinando le funzionalità di testo conversazionale presenti nella maggior parte degli LLM con la generazione di immagini basata sull’intelligenza artificiale, consentendogli di creare immagini contestuali e di adattarsi a una gamma più ampia di casi d’uso.[7] Come per Bard,[8] il co-fondatore di Google Sergey Brin è stato richiamato per assistere allo sviluppo di Gemini, insieme a centinaia di altri ingegneri di Google Brain e DeepMind.[9] Dato che Gemini era addestrato sulle trascrizioni dei video di YouTube, sono stati coinvolti anche dei legali per filtrare qualsiasi materiale potenzialmente protetto da copyright. Dylan Patel e Daniel Nishball, della società di ricerca SemiAnalysis, hanno pubblicato un post dichiarando che il rilascio di Gemini avrebbe "mangiato il mondo" e surclassato GPT-4, spingendo il CEO di OpenAI Sam Altman a ridicolizzare i due su X (ex Twitter).[10][11] Elon Musk, co-fondatore di OpenAI, è intervenuto chiedendo: "I numeri sono sbagliati?"[12]
Con la notizia dell'imminente lancio di Gemini, OpenAI ha accelerato il suo lavoro sull'integrazione di GPT-4 con funzionalità multimodali simili a quelle di Gemini.[13] The Information riportava a settembre che a diverse società era stato concesso l'accesso anticipato a "una versione anticipata" di LLM, che Google intendeva rendere disponibile ai clienti tramite il servizio Vertex AI di Google Cloud. La pubblicazione affermava inoltre che Google puntava con Gemini a competere sia con GPT-4 che con GitHub Copilot di Microsoft.[14][15] Il 2 dicembre, ha riferito che Google aveva ritardato il lancio di Gemini dalla settimana successiva al gennaio 2024 a causa di problemi con gli input non in inglese, aggiungendo che erano stati pianificati tre eventi di lancio a New York City, Washington, DC e California.[16][17]
Lancio
[modifica | modifica wikitesto]Il 6 dicembre 2023, Pichai e Hassabis hanno annunciato "Gemini 1.0" in una conferenza stampa virtuale. Erano proposti tre modelli: Gemini Ultra, progettato per "compiti altamente complessi"; Gemini Pro, progettato per "una vasta gamma di compiti"; e Gemini Nano, progettato per "uso su dispositivi locali". Al momento del lancio, Gemini Pro e Nano erano integrati rispettivamente nello smartphone Bard e Pixel 8 Pro, mentre Gemini Ultra finalizzato a supportare "Bard Advanced" e diventare disponibile per gli sviluppatori di software all'inizio del 2024. Altri prodotti che Google intendeva incorporare Gemini in Google includevano Search, Ads, Chrome, Duet AI su Google Workspace e AlphaCode 2.[18] Presentato come il "modello di intelligenza artificiale più grande e capace" di Google, la società ha dichiarato che Gemini, disponibile solo in inglese, non sarebbe stato reso pubblicamente disponibile fino all'anno successivo a causa della necessità di "test di sicurezza approfonditi".[19][20][21][22]
Secondo delle fonti, Gemini Ultra avrebbe superato GPT-4 su una varietà di benchmark di settore, mentre Gemini Pro avrebbe mostrato prestazioni migliori di GPT-3.5. Gemini Ultra è stato anche il primo modello linguistico a superare gli esperti umani nel test Massive Multitask Language Understanding (MMLU) da 57 soggetti, ottenendo un punteggio del 90%. I clienti Google Cloud avranno accesso al modello Pro il 13 dicembre In conformità con l' ordine esecutivo 14110 firmato dal presidente Joe Biden in ottobre, Google ha dichiarato che condividerà i risultati dei test del modello Ultra con il governo federale degli Stati Uniti . Allo stesso modo, la società è stata impegnata in discussioni con il governo del Regno Unito per conformarsi ai principi stabiliti durante l’ AI Safety Summit a Bletchley Park a novembre.[23][24]
Prima del suo lancio, Hugh Langley di Business Insider ha evidenziato come Gemini rappresenti un momento decisivo per Google, dicendo: "Se Gemini risplenderà, aiuterà Google a cambiare la narrativa secondo cui è stato colto di sorpresa da Microsoft e OpenAI. Se deluderà, sosterrà i critici che sostengono che Google è in ritardo."[25]
Note
[modifica | modifica wikitesto]- ^ Nico Grant, Google Builds on Tech's Latest Craze With Its Own A.I. Products, in The New York Times, 10 maggio 2023, ISSN 0362-4331 . URL consultato il 21 agosto 2023 (archiviato dall'url originale il 10 maggio 2023).
- ^ Sabrina Ortiz, Every major AI feature announced at Google I/O 2023, su ZDNet, 10 maggio 2023. URL consultato il 21 agosto 2023 (archiviato dall'url originale il 10 maggio 2023).
- ^ Calvin Wankhede, What is Google Gemini: The next-gen language model that can do it all, su Android Authority, 4 giugno 2023. URL consultato il 21 agosto 2023 (archiviato dall'url originale il 5 giugno 2023).
- ^ Dan Milmo, Google says new AI model Gemini outperforms ChatGPT in most tests, in The Guardian, 6 dicembre 2023, ISSN 0261-3077 . URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Steven Levy, Sundar Pichai on Google;s AI, Microsoft's AI, OpenAI, and ... Did We Mention AI?, in Wired, 11 settembre 2023. URL consultato il 12 settembre 2023 (archiviato dall'url originale l'11 settembre 2023).
- ^ Will Knight, Google DeepMind's CEO Says Its Next Algorithm Will Eclipse ChatGPT, in Wired, 26 giugno 2023. URL consultato il 21 agosto 2023 (archiviato dall'url originale il 26 giugno 2023).
- ^ Jon Victor, How Google is Planning to Beat OpenAI, su The Information, 15 agosto 2023. URL consultato il 21 agosto 2023 (archiviato dall'url originale il 15 agosto 2023).
- ^ Nico Grant, Google Calls In Help From Larry Page and Sergey Brin for A.I. Fight, in The New York Times, 20 gennaio 2023, ISSN 0362-4331 . URL consultato il 6 febbraio 2023 (archiviato dall'url originale il 20 gennaio 2023).
- ^ Miles Kruppa e Deepa Seetharaman, Sergey Brin Is Back in the Trenches at Google, in The Wall Street Journal, 21 luglio 2023, ISSN 0099-9660 . URL consultato il 7 settembre 2023 (archiviato dall'url originale il 21 luglio 2023).
- ^ Hasan Howdhury, AI bros are at war over declarations that Google's upcoming Gemini AI model smashes OpenAI's GPT-4, su Business Insider, 29 agosto 2023. URL consultato il 7 settembre 2023 (archiviato dall'url originale il 29 agosto 2023).
- ^ Maggie Harrison, OpenAI Rages at Report that Google's New AI Crushes GPT-4, in Fortune, 31 agosto 2023. URL consultato il 7 settembre 2023 (archiviato dall'url originale il 31 agosto 2023).
- ^ elonmusk, Are the numbers wrong? (Tweet), su Twitter, X, 29 agosto 2023 (archiviato dall'url originale il 1º settembre 2023).
- ^ Jon Victor, OpenAI Hustles to Beat Google to Launch 'Multimodal' LLM, su The Information, 18 settembre 2023. URL consultato il 15 ottobre 2023 (archiviato dall'url originale il 18 settembre 2023).
- ^ Google nears release of AI software Gemini, The Information reports, Reuters, 14 settembre 2023. URL consultato il 2 ottobre 2023 (archiviato dall'url originale il 15 settembre 2023).
- ^ Beatrice Nolan, Google is quietly handing out early demos of its GPT-4 rival called Gemini. Here's what we know so far about the upcoming AI model., su Business Insider, 23 settembre 2023. URL consultato il 16 ottobre 2023 (archiviato dall'url originale il 23 settembre 2023).
- ^ Jon Victor e Amir Efrati, Google Preps Public Preview of Gemini AI After Postponing In-Person Launch Events, su The Information, 2 dicembre 2023. URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 2 dicembre 2023).
- ^ Katherine Tangalakis-Lippert, Google has quietly pushed back the launch of next-gen AI model Gemini until next year, report says, su Business Insider, 2 dicembre 2023. URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 3 dicembre 2023).
- ^ David Pierce, Google launches Gemini, the AI model it hopes will take down GPT-4, su The Verge, 6 dicembre 2023. URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Miles Kruppa, Google Announces AI System Gemini After Turmoil at Rival OpenAI, in The Wall Street Journal, 6 dicembre 2023, ISSN 0099-9660 . URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Michael Liedtike e Matt O'Brien, Google launches Gemini, upping the stakes in the global AI race, Associated Press, 6 dicembre 2023. URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Benj Edwards, Google launches Gemini—a powerful AI model it says can surpass GPT-4, su Ars Technica, 6 dicembre 2023. URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Brian Fung e Catherine Thorbecke, Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT, su cnn.com, CNN Business, 6 dicembre 2023. URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Cade Metz e Nico Grant, Google Updates Bard Chatbot With 'Gemini' A.I. as It Chases ChatGPT, in The New York Times, 6 dicembre 2023, ISSN 0362-4331 . URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Will Knight, Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT, in Wired, 6 dicembre 2023. URL consultato il 6 dicembre 2023 (archiviato dall'url originale il 6 dicembre 2023).
- ^ Hugh Langley, Google VP teases Gemini's multimodal future: 'I've seen some pretty amazing things.', su Business Insider, 12 ottobre 2023. URL consultato il 15 ottobre 2023 (archiviato dall'url originale il 12 ottobre 2023).
Collegamenti esterni
[modifica | modifica wikitesto]- (EN) Sito ufficiale, su deepmind.google.
- Press release via The Keyword
- Announcement video on YouTube
- White paper from Google DeepMind