Dr Commodore
LIVE

OpenAI lancia il nuovo modello gpt-realtime: promette una rivoluzione nella sintesi vocale

Le intelligenze artificiali continuano ad evolversi, e l’ultima trovata di OpenAI apre delle strade incredibili per la sintesi vocale: ha lanciato un nuovo modello di ChatGPT chiamato gpt-realtime, il cui obiettivo è cambiare in maniera radicale il modo in cui si comunica con l’AI, a un prezzo inferiore rispetto al passato (29 euro per milioni di token vocali in entrata e 59 euro per quelli in uscita).

Le migliorie di gpt-realtime, il nuovo modello di OpenAI

Il nuovo gpt-realtime vanterà un ecosistema di voci in cui saranno incluse non solo le sei voci del predecessore – aggiornate per avere una maggiore espressività e naturalezza, tanto che sarà difficile distinguerle da quelle di una persona vera – ma anche due new entry, Marin e Cedar.

L’API è stata potenziata in modo da includere diverse funzionalità inedite, come: il supporto dei server remoti MCP e alle chiamate telefoniche (tramite il protocollo SIP), l’uso immagini come input e il salvataggio di prompt già scritti per poterli riutilizzare in futuro. L’AI riuscirà inoltre a completare incarichi più complessi senza fare troppi errori, grazie all’interpretazione più precisa dei messaggi di sistema e delle varie istruzioni fornitegli dagli sviluppatori.

oai realtime api ga blog header

Nei test ha conseguito infatti dei risultati più che ottimi: nel big bench audio ha raggiunto un’accuratezza dell’82,8%, mentre nel MultiChallenge audio benchmark e nel ComplexFuncBench l’accuratezza è rispettivamente del 30,5% e del 66,5%. Dati che lo rendono di molto superiore al predecessore, che nelle tre categorie aveva raggiunto accurate inferiori, ovvero 65,6%, 20,6% e 66,5%.

Leggi anche ChatGPT avrebbe istigato al s******o un adolescente: i genitori denunciano Sam Altman e OpenAI.

Articoli correlati

Yoel Carlos Schincaglia

Yoel Carlos Schincaglia

Nato il 14 febbraio 1997 a Bentivoglio, in provincia di Bologna. Grande appassionato principalmente di anime, poi anche di videogiochi e manga. Credo nella canzone che ho nel cuore!

Condividi