ChatGPT ganha voz mais natural e passa a ouvir e responder ao mesmo tempo

A OpenAI iniciou a liberação gradual de um novo modelo de voz para o ChatGPT que promete tornar as conversas com inteligência artificial muito mais próximas das interações humanas. Batizada internamente de GPT-Bidi-1, a tecnologia permite que a IA fale e escute simultaneamente, eliminando as limitações das atuais conversas por voz.
O recurso começou a ser disponibilizado para um grupo restrito de usuários das versões web e mobile da plataforma e ainda não foi anunciado oficialmente pela empresa.
Conversas mais fluidas e sem interrupções
A principal novidade do novo sistema é a capacidade de manter um diálogo contínuo, sem a necessidade de alternar rigidamente entre quem fala e quem escuta.
Na prática, se o usuário interromper uma resposta do ChatGPT para mudar de assunto ou acrescentar uma informação, a inteligência artificial consegue acompanhar a conversa de forma instantânea, sem travamentos ou reinicializações do contexto.
A tecnologia também passa a identificar pausas naturais durante a fala, evitando respostas precipitadas e tornando a experiência mais próxima de uma conversa entre pessoas.
IA passa a lembrar melhor do contexto
Outra melhoria importante envolve a retenção de contexto. O GPT-Bidi-1 consegue manter a linha de raciocínio por mais tempo durante conversas extensas, reduzindo um dos principais problemas das versões anteriores, que frequentemente perdiam informações discutidas minutos antes.
Além disso, o sistema foi projetado para reconhecer pausas prolongadas sem interromper o usuário, aguardando o momento adequado para responder.
Novo modelo terá diferentes níveis de desempenho
Segundo informações divulgadas por especialistas que analisaram versões preliminares do sistema, o GPT-Bidi-1 foi desenvolvido especificamente para processamento de áudio em tempo real, diferentemente do atual assistente de voz baseado em adaptações de modelos de texto.
A ferramenta deverá operar em três níveis de desempenho:
- High (Alta): respostas mais completas e aprofundadas;
- Medium (Média): equilíbrio entre velocidade e qualidade;
- Instant (Instantânea): foco em respostas rápidas e baixa latência.
A proposta é permitir que o usuário escolha entre maior profundidade de análise ou velocidade de resposta, dependendo da necessidade.
Mudanças também chegam à interface
A novidade traz alterações visuais dentro do ChatGPT. Quando ativado, o novo modelo aparece na lista de opções de inteligência artificial disponíveis e utiliza uma identidade visual própria, diferenciando-se dos modos atuais.
A expectativa é que a tecnologia seja ampliada gradualmente ao longo dos próximos meses e também chegue a outras ferramentas da OpenAI, incluindo soluções voltadas para programação e futuras integrações por API.
OpenAI aposta na voz como futuro da inteligência artificial
O lançamento reforça a estratégia da OpenAI de transformar a voz em uma das principais formas de interação com sistemas de inteligência artificial. Com conversas mais naturais, memória aprimorada e respostas em tempo real, a empresa busca aproximar cada vez mais a experiência digital da comunicação humana.
A expectativa do setor é que tecnologias desse tipo acelerem a adoção da IA em áreas como atendimento ao cliente, educação, produtividade, programação e assistentes pessoais inteligentes.






