Usuários do ChatGPT podem agora enviar áudios diretamente na conversa, tanto no aplicativo quanto na versão web. Anteriormente, o recurso estava disponível em uma interface separada, mas a atualização recente permite iniciar chats por voz ao tocar no ícone de "forma de onda" ao lado do campo de texto.
Com essa nova função, o chatbot promove uma interação mais dinâmica, respondendo em sincronia e apresentando uma transcrição das falas. Essa ferramenta pode ser particularmente útil para a prática de idiomas, preparo para entrevistas ou traduções instantâneas. Em um vídeo promocional, o ChatGPT demonstra sua capacidade de localizar padarias em uma área específica, fornecendo um mapa e detalhando as opções de doces disponíveis.
Para conversar usando o Modo Voz, os usuários devem abrir o ChatGPT e clicar no ícone de voz no canto inferior direito. É possível escolher entre diferentes vozes disponíveis, possibilitando personalizar a interação. A transcrição é visível durante a conversa, permitindo que os usuários retomem o diálogo de onde pararam ao reativar o ícone de voz.
Além disso, a integração desse recurso com a câmera permite que o ChatGPT "veja" o que os usuários estão mostrando, enriquecendo a experiência de interação. Essa funcionalidade é uma resposta ao uso crescente de plataformas que unem voz e imagens, como o Google Gemini Live.
Preferências e personalização
No Gemini, a configuração de voz é realizada em poucos passos: o usuário deve acessar o aplicativo e clicar na imagem do perfil para ajustar as preferências de voz. Essa combinação de recursos visa tornar as conversas mais naturais e eficazes, alinhando-se às últimas tendências em comunicação assistida por inteligência artificial.







