s
INTELIGÊNCIA ARTIFICIAL

Modelos de linguagem têm limite?

O lançamento do Phi-3 e do Snowflake Arctic mostra como os novos modelos de linguagem estão cada vez mais avançados.

A expectativa de que os modelos de linguagem se tornem ainda mais poderosos e versáteis ganhou novo impulso na última semana com os lançamentos do Phi-3 e do Snowflake Arctic.

O Phi-3 pertence a uma família de modelos de linguagem criados pela Microsoft para serem pequenos (a ponto de rodarem bem em smartphones), mas treinados em dados da mais alta qualidade. O objetivo é o de que o baixo custo e a portabilidade dos Small Language Models (SLM) de alto desempenho ajudem a IA a funcionar localmente na eletrônica inteligente do dia-a-dia. Sobre ele é relevante saber que:

  • Tem 3,8 bilhões de parâmetros treinados em 3,3 trilhões de tokens. Mas apesar de seu tamanho reduzido, tem desempenho equivalente a modelos maiores como Mixtral 8x7B e GPT- 3.5 , atingindo 69% no MMLU e 8,38 no MT-bench.
  • Está disponível no Azure, Hugging Face e Ollama.
  • Sua criação se baseou no que as iterações anteriores aprenderam. Enquanto Phi-1 se concentrou na codificação e Phi-2 começou a aprender a raciocinar, Phi-3 é melhor em codificação e raciocínio.
  • O sucesso do modelo é atribuído ao seu conjunto de dados de treinamento exclusivo, uma versão ampliada daquele usado para phi -2, que inclui dados da web altamente filtrados e dados sintéticos. O modelo também foi projetado para robustez, segurança e formato de chat.

Ah, com a família Phi, a Microsoft também construiu o Orca-Math, um modelo focado na resolução de problemas matemáticos.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

O futuro dos Transformers na IA e sua evolução

Inteligência Artificial

O futuro dos Transformers na IA e sua evolução

Estudos mostram que memória de longo prazo para Transformers permite lidar com contextos mais longos

Sua empresa está preparada para implementar a Inteligência Artificial com sucesso?

Inteligência Artificial

Sua empresa está preparada para implementar a Inteligência Artificia...

Conheça quais são as seis perguntas que lideranças devem fazer antes de comprar ou desenvolver uma IA para sua organização

Inteligência Artificial: A corrida por AI Reasoning esquenta de vez

Inteligência Artificial

Inteligência Artificial: A corrida por AI Reasoning esquenta de vez

Com o lançamento do modelo R1, da DeepSeek, e a OpenAI correndo atrás, a disputa para construir uma IA que imita os pensamentos de um ser humano se intensifica

OpenAI defende modelo econômico para manter EUA na liderança global de IA

Inteligência Artificial

OpenAI defende modelo econômico para manter EUA na liderança global...

A OpenAI propõe a criação de "zonas econômicas de IA" e novos centros de dados para garantir que os EUA não percam a corrida pela supremacia em Inteligência Artificial

Large Concept Models: O que são LCMs, como funcionam e qual a diferença para LLMs

Inteligência Artificial

Large Concept Models: O que são LCMs, como funcionam e qual a diferen...

Os Large Concept Models prometem transformar a inteligência artificial ao trabalhar com ideias e conceitos, e não apenas com palavras isoladas

Agentes de IA, a verdadeira revolução para pequenas e médias empresas

Inteligência Artificial

Agentes de IA, a verdadeira revolução para pequenas e médias empres...

Eles não apenas escreverão e-mails ou criarão conteúdo. Também executarão processos empresariais inteiros de forma autônoma, reduzindo custos em 30%, aumentando a produtividade em até 40%.