As máquinas estão cada vez melhores em entender a complexidade da linguagem humana. Cada vez que alguém treina um modelo, estamos um passo mais perto de integrar nossas máquinas com mais eficiência em nossas vidas. Acontece que a maioria dos modelos e dos conjuntos de dados usados para treiná-los estão em inglês. Treinar um modelo em português, por exemplo, tem desafiado os cientistas de dados. Os conjuntos de dados existentes são, em sua maioria, proprietários e os poucos abertos, listados no fórum do AI Lab, versam sobre domínios específicos como saúde e gestão do pessoal e projetos.
Foi tentando resolver esse problema que, no seu primeiro ano, completados este mês, o Centro de Inteligência Artificial (C4AI), parceria entre IBM, USP e Fapesp, investiu na construção de três conjuntos de dados a partir de pesquisas concentradas tanto na modalidade escrita, quanto falada do português.
"Vemos essas iniciativas como estruturantes para o mercado, uma vez que os data sets poderão ser usados livremente tanto por acadêmicos quanto por empresas", comenta Claudio Pinhanez, gerente de pesquisa em Inteligência Conversacional do IBM Research Brasil e vice-diretor do C4AI.
Este é um conteúdo exclusivo para assinantes.
Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.
É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.
Apesar da escassez de exits e da instabilidade política, quase metade dos investidores planeja ampliar aportes. O foco agora está na digitalização de setores tradicionais da economia
Estudos mostram que agentes de IA podem automatizar crédito, compliance e análise financeira, mas o setor ainda enfrenta barreiras para escalar a tecnologia
Pesquisas recentes sugerem que a tecnologia pode reduzir os custos de coordenação dentro das organizações — permitindo que equipes maiores, diversas e conectadas trabalhem com mais eficiência.
O paradoxo da IA nas empresas: decisões mais rápidas, aprendizado mais lento.
Redes autônomas, nuvens de IA e novos modelos de receita movimentam o setor que já responde por 6,4% do PIB global.
A queda no preço por token amplia demanda e pressiona ROI, enquanto US$ 1,3 trilhão em CapEX redesenha a indústria até 2027.
Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso
