Há uma nova tendência na IA: o uso do aprendizado profundo para criação de dubladores digitais realistas para assistentes digitais, personagens de videogame e vídeos corporativos. Estamos entrando em uma nova era onde o conteúdo (como o jogo Witcher 3) será constantemente aumentado e estendido por meio do uso de ferramentas de IA. Chegamos a mencionar isso aqui na The Shift, em um artigo sobre a explosão de uso de Voice AI, e quando citamos que a brasileira Omnilogic vem trabalhando em protótipos de síntese neural de voz para módulos conversacionais em um artigo sobre o crescimento do uso do vídeo sintético.
Criar vozes humanas, aparentemente reais, que possam gerar um vínculo emocional com os clientes em diálogos fluidos, sem fricção, ainda que em uma interação homem/máquina, é agora a nova fronteira. As vozes de IA são baratas, escalonáveis e fáceis de trabalhar. Ao contrário da gravação de um dublador humano, as vozes sintéticas também podem atualizar seu roteiro em tempo real, abrindo novas oportunidades para personalizar vendas e publicidade.
Não por acaso, a Amazon acrescentou as vozes da ex-estrela da NBA Shaquille O’Neal e da atriz indicada ao Oscar Melissa McCarthy às opções de voz Alexa , que podem ser ativadas respectivamente com as frases “Hey Shaq” ou “Hey Melissa”. Tudo para deixar os usuário, e clientes, mais felizes.
A empresa norte–americana VocaliD e a canadense Resemble AI têm se destacado nesse mercado, junto a marcas que buscam manter um som consistente em milhões de interações com os clientes. Outros setores que estão implementando IA de conversação em suas cargas de trabalho, como serviços bancários e financeiros, varejo e comércio eletrônico, agências governamentais e saúde também poderão se beneficiar de interações mais naturais.
OK. A ascensão dessas vozes falsas hiperrealistas não é isenta de consequências. Dubladores profissionais já começam a se perguntar o que isso significa para seus meios de subsistência. Estão preocupados.
Embora ainda seja difícil manter o realismo de uma voz durante longos períodos de tempo que podem ser necessários para um audiolivro ou podcast, esse dia chegará. Hoje, os avanços no aprendizado profundo tornaram possível replicar muitas das sutilezas da fala humana. As vozes sintéticas param e respiram em todos os lugares certos. E podem mudar seu estilo ou emoção, principalmente em clipes de áudio curtos. Muitos se tornaram indistinguíveis dos humanos.
Preocupados estão também os profissionais da área de segurança. Avanços recentes no aprendizado profundo estão tornando possível replicar muitas das sutilezas da fala humana, aumentando as chances de sucesso das vozes falsas ao serem usadas em chamadas fraudulentas e outros golpes. É preciso tomar medidas para lidar com essa nova tecnologia e as ameaças que ela traz. Na verdade, empresas em todo o mundo já estão fazendo isso há algum tempo.
É tudo mentira? É. Mas nem todos os usos são ruins. Está na hora de criar pesos e contrapesos, até para viabilizar aplicações positivas de mídia sintética nos negócios
Enquanto as técnicas para criar vídeos falsos melhoram, pesquisadores se empenham para criar detectores de deepfakes com Inteligência Artificial
Dra Clarissa Véliz, pesquisadora de ética em IA da Universidade de Oxford, defende que indústria adote padrões como os da medicina
Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso