s
INTELIGÊNCIA ARTIFICIAL

Estamos entrando na era da “IA faz-tudo”

Nos próximos anos, a multimodalidade será norma para os LLMs, que vão ser treinados para responder a prompts de texto, imagem, código, voz e vídeo.

Anote aí: a multimodalidade será a norma da próxima era dos grandes modelos de linguagem (os LLMs). O que significa que eles serão treinados para lidar com combinações de texto, imagem, vídeo e prompts de código, abrindo muitos novos casos de uso e experiências de usuário. A OpenAI já trabalha nessa direção. E, não por acaso, o Google criou o Gemini para ser multimodal desde o lançamento.

"A IA multimodal se tornará o padrão, mesmo para aplicativos regulares de chatbot”, opina Robert Nishihara, CEO da Anyscale, a empresa por trás da estrutura de desenvolvimento Ray, que impulsionou grande parte do boom da IA Generativa.

O pulo do gato será a criação de LLMs multimodais desde sua concepção, exigindo mudanças ao nível de arquitetura. Embora já existam alguns modelos multimodais hoje, os recursos para lidar com diferentes tipos de dados foram costurados em cima de LLMs baseados em texto. Pesquisadores chineses endereçam bem essa necessidade de mudança de arquitetura em um paper apresentando o OneLLM, um grande modelo de linguagem multimodal (MLLM) que suporta oito modalidades diferentes de dados. Ficou curioso? Experimente a partir do que já foi liberado sobre o OneLLM no GitHub.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Dados: o alto custo do GPT-4o

Inteligência Artificial

Dados: o alto custo do GPT-4o

Considerando que o ChatGPT está cada vez mais integrado em tecnologias como a da Apple é preciso entender o que estamos "trocando" no momento que usamos a aplicação gratuitamente.

Adoção de IA Generativa cresce e começa a gerar valor

Inteligência Artificial

Adoção de IA Generativa cresce e começa a gerar valor

A GenAI chegou de rolo compressor para mexer nos negócios. Mas ela é tão útil assim? Só experimentando para saber, como mostramos a seguir.

Como aproveitar o melhor da IA

Inteligência Artificial

Como aproveitar o melhor da IA

Um caminho é entender como aproveitar melhor dados corporativos em um foundation model que seja só seu.

É muito fácil contornar proteções de chatbots de IA

Inteligência Artificial

É muito fácil contornar proteções de chatbots de IA

LMMs em uso hoje são altamente vulneráveis a jailbreaks básicos, e alguns fornecem resultados prejudiciais mesmo sem tentativas dedicadas a burlar seus controles, revela pesquisa.

Desalinhamento na OpenAI

Inteligência Artificial

Desalinhamento na OpenAI

Após uma semana do lançamento do ChatGPT 4o a OpenAI se envolveu em uma série de polêmicas envolvendo o fechamento da equipe de Superalinhamento e um processo da atriz Scarlett Johansson.

Enfim o primeiro AI OS?

Inteligência Artificial

Enfim o primeiro AI OS?

Os anúncios da Microsoft durante a conferência Build mostram que estamos quase chegando a um OS 100% integrado com IA.