Dois artigos de pesquisa recém-publicados podem significar muito para a arquitetura central dos Transformers, de modo a garantir a eles uma memória de longo prazo, torná-los melhores em lidar com contextos mais longos e se tornarem mais eficientes. Você confiaria mais na IA se os LLMs se lembrassem de conversas anteriores, aprendessem com elas e citassem as fontes? Pois é.
A proposta de pesquisadores da Sakana AI e do Institute of Science Tokyo é o Transformer², um framework de autoadaptação projetado para melhorar o desempenho dos LLMs, abrindo caminho para sistemas de IA dinâmicos e auto-organizados. Diferentemente dos sistemas de IA tradicionais que são pré-treinados para tarefas específicas, o Transformer² ajusta dinamicamente suas configurações internas para lidar com diversos desafios, que vão desde
Modelos autoadaptativos visam solucionar os desafios apresentados pelos métodos tradicionais de ajuste fino, que geralmente são computacionalmente intensivos e estáticos em sua capacidade de lidar com diversas tarefas. Para desenvolver o Transformers², a equipe de IA da Sakana se inspirou em como o cérebro humano se reconecta após uma lesão. Primeiro, o modelo analisa a tarefa recebida para entender seus requisitos antes de tentar aprender; então, se ajusta dinamicamente e fornece resultados personalizados para essa tarefa.
Este é um conteúdo exclusivo para assinantes.
Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.
É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.
Em 12 de junho, o governo dos EUA obrigou a Anthropic a desligar Fable 5 e Mythos 5 no mundo todo, 72 horas após o lançamento. Para quem opera sobre IA de fronteira, o acesso passou a ser ativo revogável sem aviso.
Token é pingo de torneira: um não custa nada, milhões por dia viram a conta do mês. Assim a IA chegou a 25% dos orçamentos de TI para 2027, desafiando a indústria a ser mais transparente
Versão Claude Fable 5 estreia um jeito novo de vender IA avançada: quase toda a capacidade do modelo, com um filtro de segurança decidindo o que fica de fora.
Na véspera da abertura da Copa do Mundo no Brasil, o Google reuniu executivos, parceiros e convidados em São Paulo para anunciar lançamentos que vão de IA aplicada ao futebol e à saúde até novos recursos do Gemini, do YouTube e da Bu...
De deepfakes de executivos a agentes de IA manipulados por instruções ocultas, os ataques de identidade digital evoluíram, mas os programas de defesa da maioria das organizações ainda operam no passado
Pesquisa global com quase 12 mil profissionais mostra que 74% dos trabalhadores já usam IA regularmente — mas a maioria das organizações ainda não sabe como converter esse uso em valor real
Aproveite nossas promoções de renovação
Clique aquiPara continuar navegando como visitante, vá por aqui.
Cadastre-se grátis, leia até 5 conteúdos por mês,
e receba nossa newsletter diária.
Já recebe a newsletter? Ative seu acesso
