Dois artigos de pesquisa recém-publicados podem significar muito para a arquitetura central dos Transformers, de modo a garantir a eles uma memória de longo prazo, torná-los melhores em lidar com contextos mais longos e se tornarem mais eficientes. Você confiaria mais na IA se os LLMs se lembrassem de conversas anteriores, aprendessem com elas e citassem as fontes? Pois é.
A proposta de pesquisadores da Sakana AI e do Institute of Science Tokyo é o Transformer², um framework de autoadaptação projetado para melhorar o desempenho dos LLMs, abrindo caminho para sistemas de IA dinâmicos e auto-organizados. Diferentemente dos sistemas de IA tradicionais que são pré-treinados para tarefas específicas, o Transformer² ajusta dinamicamente suas configurações internas para lidar com diversos desafios, que vão desde
Modelos autoadaptativos visam solucionar os desafios apresentados pelos métodos tradicionais de ajuste fino, que geralmente são computacionalmente intensivos e estáticos em sua capacidade de lidar com diversas tarefas. Para desenvolver o Transformers², a equipe de IA da Sakana se inspirou em como o cérebro humano se reconecta após uma lesão. Primeiro, o modelo analisa a tarefa recebida para entender seus requisitos antes de tentar aprender; então, se ajusta dinamicamente e fornece resultados personalizados para essa tarefa.
Este é um conteúdo exclusivo para assinantes.
Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.
É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.
Jason Corey, VP do Americas Office of Technology da Red Hat, explica por que o open source entrega mais segurança, como agentes de IA podem modernizar sistemas legados sem interromper serviços e o que coloca o Brasil na vanguarda
O bloqueio dos modelos mais avançados da Anthropic acelerou uma mudança na arquitetura corporativa de IA. A pergunta central deixou de ser qual modelo é melhor e passou a ser quem controla o acesso a ele.
Em painel no 6° Congresso de Internet, promovido pela Abranet, o ministro Floriano Azevedo Marques detalhou as regras do TSE sobre Inteligência Artificial, defendeu a "moratória" de conteúdo sintético e explicou por que a IA não poder...
Em 12 de junho, o governo dos EUA obrigou a Anthropic a desligar Fable 5 e Mythos 5 no mundo todo, 72 horas após o lançamento. Para quem opera sobre IA de fronteira, o acesso passou a ser ativo revogável sem aviso.
Token é pingo de torneira: um não custa nada, milhões por dia viram a conta do mês. Assim a IA chegou a 25% dos orçamentos de TI para 2027, desafiando a indústria a ser mais transparente
Versão Claude Fable 5 estreia um jeito novo de vender IA avançada: quase toda a capacidade do modelo, com um filtro de segurança decidindo o que fica de fora.
Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso
