BRANDED CONTENT
APRESENTADO POR 7D Analytics
Bolsos fundos, acesso a talentos e investimentos massivos em infraestrutura de computação explicam apenas parcialmente por que a maioria dos grandes avanços em Inteligência Artificial veio de um grupo seleto de empresas de Big Tech. Outro motivo relevante é o amplo acesso a dados diversos, extensos e de alta qualidade, graças à coleta massiva que fazem como operadoras de plataformas digitais. Todo esse Big Data é um rico recurso estratégico que pode ser usado para desenvolver e treinar algoritmos complexos de aprendizado de máquina — mas é um recurso que está fora do alcance da maioria das empresas.
Agora, o Aprendizado Federado (FL) começa a ser apontado como uma alternativa atraente a esse cenário (a exemplo do que já vem acontecendo no mercado de Machine Learning), permitindo que uma parte maior da economia colha os benefícios da IA, ao reduzir as restrições de acesso a dados e de recursos computacionais para o treinamento IA. Como?
“Permitindo que um modelo seja treinado em vários servidores descentralizados, controlados por diferentes organizações, cada um com seus próprios dados locais”, explica Eduardo Abbud, sócio fundador da 7D Analytics. “Uma abordagem colaborativa para treinar modelos de IA pode gerar melhores resultados, mas exige encontrar parceiros com dados que complementem os que a empresa já possui”, completa.
Recentemente, pesquisadores da Universidade de Cambridge e Flower Labs mostraram que é possível usar abordagens distribuídas e baratas de treinamento e acesso a dados para pré-treinamento colaborativo, reproduzível e dimensionável de LLMs, na escala de /bilhões de parâmetros. Esses pesquisadores estão convencidos de que o futuro do pré-treinamento de LLM está nas fontes de dados distribuídas que o Aprendizado Federado pode reunir.
A principal inovação está em como o treinamento acontece. Em vez de enviar os dados brutos para um local central, cada nó treina uma cópia local do LLM em seus próprios dados. Então, apenas as atualizações do modelo (significativamente menores do que os próprios dados brutos) são compartilhadas com um servidor central. Este servidor agrega essas atualizações para melhorar o modelo LLM global.
Esta abordagem distribuída oferece duas vantagens:
Mas também apresenta algum desafios. Entre eles:
Ao fazer a transição para uma estrutura de aprendizagem federada, os LLMs podem utilizar uma gama mais ampla de fontes de dados e recursos computacionais, promovendo inovação e inclusão no desenvolvimento de IA.
Um exemplo? O setor de saúde apresenta um caso de uso convincente para aprendizado federado no desenvolvimento de Large Language Model (LLM). Imagine uma rede de hospitais e clínicas equipadas com dispositivos de ponta capazes de processar dados de pacientes localmente. Essas instituições, vinculadas por rígidas regulamentações de privacidade de dados, podem colaborar para treinar um LLM para prever resultados de pacientes. Essa abordagem oferece uma solução poderosa que alavanca o conhecimento coletivo da rede enquanto protege a privacidade do paciente.
* Conteúdo produzido em parceria com a 7D Analytics, pelo programa de Marketing Services da The Shift. A 7D Analytics é uma consultoria especializada em advanced analytics, otimização matemática, e elaboração de modelos preditivos e prescritivos para fenômenos naturais, sociais e econômicos, otimização aplicada aos negócios, supply chain management e soluções personalizadas de Data Science.
Modelos tradicionais de previsão de demanda funcionam. Mas combiná-los com diferentes abordagens de IA cria algo mais poderoso: sistemas que podem prever, prescrever e gerar soluções em tempo real
O treinamento descentralizado em fontes de dados distribuídas pode democratizar o treinamento de LLMs, tornando-os acessíveis a players menores, preservando a privacidade e com boa relação custo-benefício, mas os desafios permanecem.
LLMs ainda são ruins em raciocínio multi-hop. Precisamos de melhores mecanismos de recuperação e capacidades de raciocínio. E o novo benchmark FRAMES pode nos ajudar a avançar
Combinados, Machine Learning e GenAI podem revelar insights ocultos sobre o que realmente gera satisfação e produtividade.
Pesquisadores chineses conseguiram abordar a previsão quantitativa de mudanças de regime para vários tipos de dinâmica em redes usando Machine Learning.
A IA orientada a objetivos é a próxima fronteira. Não apenas prever o futuro, mas moldá-lo.
Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso