Ricerca nel sito web

Copilot, Gemini o ChatGPT: qual è la migliore intelligenza artificiale conversazionale per te?


Punti chiave

  • La modalità vocale avanzata di ChatGPT consente conversazioni naturali e discussioni profonde con gli utenti sfruttando la potenza di inferenza di GPT-4o.
  • Gemini Live di Google offre accesso gratuito in oltre 40 lingue ed è disponibile tramite le app mobili Gemini.
  • Anche le interazioni vocali Copilot di Microsoft sono gratuite ma attualmente disponibili solo in Australia, Canada, Nuova Zelanda, Regno Unito e Stati Uniti.

Chi ha bisogno di istruzioni basate su testo quando puoi semplicemente parlare con la tua IA preferita? L'interazione vocale è la nuova funzionalità che gli sviluppatori stanno cercando di aggiungere ai loro modelli, con la modalità vocale avanzata di ChatGPT, l'interazione vocale naturale di Copilot e Gemini Live in testa.

I chatbot stanno crescendo rapidamente

Sono passati meno di due anni dal debutto di ChatGPT e stiamo già assistendo a un cambiamento fondamentale dei chatbot basati sull'intelligenza artificiale nel modo in cui comunicano con gli esseri umani. Poiché questi modelli si sono evoluti rapidamente e hanno acquisito capacità multimodali, non sono più strettamente vincolati a suggerimenti e risposte basati su testo. Oggi possono conversare con te come faresti con un'altra persona e, nel caso di Gemini Live, lo fanno in più di 40 lingue. Ovviamente, i suggerimenti scritti tradizionali hanno ancora il loro posto – voglio dire, nessuno si siede e detta migliaia di righe di codice Python a un chatbot – ma le interazioni vocali e le IA conversazionali sono destinate a rivoluzionare ulteriormente il modo in cui interagiamo con il mondo moderno.

OpenAI è stato il primo a portare la tecnologia sul mercato con la modalità vocale avanzata, ma è stato rapidamente seguito da Gemini Live di Google e, più recentemente, da Natural Voice Interactions di Meta. Ogni sistema offre il proprio insieme unico di funzionalità e vincoli. Questa guida ti aiuterà a fornirti le informazioni e gli approfondimenti necessari per scegliere quello migliore per le tue esigenze specifiche.

Modalità vocale avanzata ChatGPT

La modalità vocale avanzata (AVM) di ChatGPT sfrutta l'ultimo modello linguistico di grandi dimensioni di OpenAI, GPT-4o, per facilitare conversazioni più naturali, avanti e indietro con te, l'utente. Ciò lo rende ideale per attività che richiedono interazione in tempo reale, come il brainstorming o la discussione di argomenti complessi. E, poiché ha GPT-4o sotto il cofano, AVM è in grado di discutere con competenza una vasta gamma di argomenti, dalla biochimica alla filosofia giapponese del XIV secolo. Inoltre, può fornire risposte approfondite su quegli argomenti per i quali altre IA forniranno brevi riassunti. Personalmente, trovo che offra una forte combinazione di comprensione del linguaggio naturale, adattabilità e personalizzazione, insieme a un’ampia base di conoscenze.

AVM è stata la prima funzionalità di intelligenza artificiale conversazionale a raggiungere il mercato. Ha debuttato per la prima volta a maggio all'evento Spring Update di OpenAI prima di essere rilasciato come beta per selezionare gli abbonati ChatGPT Plus a luglio per test e feedback. Alla fine è stato lanciato alla fine di settembre per gli abbonati Plus e Teams. È accessibile tramite le app mobili ChatGPT e il portale desktop, ma sfortunatamente non è ancora disponibile se utilizzi il livello gratuito di ChatGPT. Né è ancora disponibile nell’UE, nel Regno Unito, in Svizzera, Islanda, Norvegia e Liechtenstein. Se vivi in una di queste regioni, dovrai continuare a digitare.

Gemelli in diretta

Gemini Live è la risposta di Google alla modalità vocale avanzata. È costruito sul modello Gemini 1.5 Pro, che è il più avanzato di Google fino ad oggi. L'azienda ha presentato Live a maggio all'I/O 2024 e lo ha inizialmente provato con gli abbonati Gemini Advanced ad agosto prima di rilasciarlo gratuitamente a tutti gli utenti a fine settembre. Questo da solo dà a Gemini Live un vantaggio rispetto ad AVM secondo me, perché non devo sborsare $20 al mese per provarlo.

Sebbene Gemini 1.5 Pro non possa raggiungere gli stessi benchmark di GPT-4o, offre una serie di funzionalità che AVM non offre. Non posso esagerare, è gratuito da utilizzare tramite l'app Google o le app Gemini iOS e Android dedicate. Non ci sono restrizioni regionali in quanto sono presenti AVM. L'unico posto in cui non puoi ottenere Gemini Live è sul desktop, anche se secondo quanto riferito Google sta lavorando per aggiungere questa funzionalità in futuro. Gemini Live è attualmente disponibile in cinque lingue oltre all'inglese: francese, tedesco, portoghese, hindi e spagnolo e nelle prossime settimane si espanderà a quasi quattro dozzine di lingue.

Voce del copilota

Copilot Voice è una delle numerose nuove funzionalità che hanno recentemente debuttato insieme alla rinnovata interfaccia personale Copilot, che funziona su un'istanza personalizzata di GPT-4. Come AVM e Live, ti consente di conversare in modo naturale con l'intelligenza artificiale invece di digitare le tue domande. Come gli altri, Voice è progettato principalmente per rispondere a domande generali e agire come un assistente digitale, tuttavia, poiché funziona su GPT-4, ha accesso all'ampio corpus di formazione di quel modello. E a differenza di Live, Voice è disponibile tramite il portale desktop Copilot.

Microsoft lo definisce "il modo più intuitivo e naturale per fare brainstorming in movimento, porre una domanda veloce o anche solo sfogarsi alla fine di una dura giornata". Perché chi ha bisogno di veri amici quando puoi semplicemente urlare al tuo computer tascabile mentre torni a casa in metropolitana?

È gratuito, a differenza di AVM, anche se attualmente è limitato alle conversazioni in inglese e solo se vivi in Australia, Canada, Nuova Zelanda, Regno Unito o Stati Uniti. Microsoft sta lavorando per espandere sia le funzionalità linguistiche della funzionalità che la disponibilità geografica nelle prossime settimane.

Quale intelligenza artificiale vocale è adatta a te?

Questa è una domanda che dipende da una serie di variabili, ad esempio quanto sei disposto a pagare, cosa intendi fare con l'intelligenza artificiale e a quale ecosistema di marchi ti iscrivi. Per quanto mi riguarda, preferisco Google Live. Non solo perché è gratuito, ma perché sono già profondamente integrato nell'ecosistema Google. Voglio dire, utilizzo Gemini su un telefono Android e sto scrivendo questo post su un Chromebook Acer.

Se fossi un utente Windows, sarei più propenso a utilizzare Voice, se non altro per ridurre al minimo i potenziali punti di attrito con il resto delle app che già utilizzo. Se utilizzassi iOS, beh, aspetterei pazientemente che Apple Intelligence arrivi con il suo Siri potenziato dall'intelligenza artificiale e estremamente aggiornato. Se, d'altra parte, hai effettivamente bisogno delle capacità di inferenza e delle prestazioni incredibili fornite da ChatGPT e hai $20 che ti bruciano un buco in tasca, la modalità vocale avanzata è probabilmente la strada da percorrere.

Articoli correlati