s
INTELIGÊNCIA ARTIFICIAL

O futuro dos Transformers na IA e sua evolução

Estudos mostram que memória de longo prazo para Transformers permite lidar com contextos mais longos

Dois artigos de pesquisa recém-publicados podem significar muito para a arquitetura central dos Transformers, de modo a garantir a eles uma memória de longo prazo, torná-los melhores em lidar com contextos mais longos e se tornarem mais eficientes. Você confiaria mais na IA se os LLMs se lembrassem de conversas anteriores, aprendessem com elas e citassem as fontes? Pois é.

A proposta de pesquisadores da Sakana AI e do Institute of Science Tokyo é o Transformer², um framework de autoadaptação projetado para melhorar o desempenho dos LLMs, abrindo caminho para sistemas de IA dinâmicos e auto-organizados. Diferentemente dos sistemas de IA tradicionais que são pré-treinados para tarefas específicas, o Transformer² ajusta dinamicamente suas configurações internas para lidar com diversos desafios, que vão desde

  • Matemática: resolver problemas complexos com precisão.
  • Codificação: auxiliar desenvolvedores com geração e depuração de código.
  • Raciocínio: enfrentar desafios lógicos com proficiência semelhante à humana.
  • Compreensão visual: analisar imagens e padrões complexos de forma efetiva.

Modelos autoadaptativos visam solucionar os desafios apresentados pelos métodos tradicionais de ajuste fino, que geralmente são computacionalmente intensivos e estáticos em sua capacidade de lidar com diversas tarefas. Para desenvolver o Transformers², a equipe de IA da Sakana se inspirou em como o cérebro humano se reconecta após uma lesão. Primeiro, o modelo analisa a tarefa recebida para entender seus requisitos antes de tentar aprender; então, se ajusta dinamicamente e fornece resultados personalizados para essa tarefa.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Deep techs na América Latina: ambição global, desafios locais

Inteligência Artificial

Deep techs na América Latina: ambição global, desafios locais

Mesmo com talento e ciência de ponta, a América Latina ainda enfrenta barreiras como pouco investimento e falta de ambição global para escalar suas deep techs. Brasil é destaque, mas falta paciência dos investidores

Software virou mão de obra. Quanto custa o trabalho da IA?

Inteligência Artificial

Software virou mão de obra. Quanto custa o trabalho da IA?

Agentes autônomos desafiam o manual do SaaS e expõem a batalha entre ROI, narrativas de valor e dumping algorítmico.

Transformação digital na América Latina: o salto bilionário guiado pelo Brasil

Inteligência Artificial

Transformação digital na América Latina: o salto bilionário guiado...

De IA a inclusão financeira, a região prepara salto de eficiência — com o Brasil na linha de frente

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Inteligência Artificial

Empresas adotam IA sem plano e colhem riscos em vez de retorno

Apesar da popularização das ferramentas de IA, ainda falta clareza, políticas e treinamento. O uso incorreto expõe empresas a riscos e desperdícios de potencial.

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Inteligência Artificial

O dilema da IA em Life Sciences: maturidade alta, retorno baixo

Apesar da adoção de IA, pilotos no setor ainda focam em tarefas simples, longe de impactar modelos operacionais

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no Brasil

Inteligência Artificial

Saúde, Indústria e Agronegócio puxam registros de patentes de IA no...

Enquanto EUA e China aceleram, o Brasil patina: apenas 8 patentes de IA concedidas em cinco anos