s
INTELIGÊNCIA ARTIFICIAL

Modelos de linguagem têm limite?

O lançamento do Phi-3 e do Snowflake Arctic mostra como os novos modelos de linguagem estão cada vez mais avançados.

A expectativa de que os modelos de linguagem se tornem ainda mais poderosos e versáteis ganhou novo impulso na última semana com os lançamentos do Phi-3 e do Snowflake Arctic.

O Phi-3 pertence a uma família de modelos de linguagem criados pela Microsoft para serem pequenos (a ponto de rodarem bem em smartphones), mas treinados em dados da mais alta qualidade. O objetivo é o de que o baixo custo e a portabilidade dos Small Language Models (SLM) de alto desempenho ajudem a IA a funcionar localmente na eletrônica inteligente do dia-a-dia. Sobre ele é relevante saber que:

  • Tem 3,8 bilhões de parâmetros treinados em 3,3 trilhões de tokens. Mas apesar de seu tamanho reduzido, tem desempenho equivalente a modelos maiores como Mixtral 8x7B e GPT- 3.5 , atingindo 69% no MMLU e 8,38 no MT-bench.
  • Está disponível no Azure, Hugging Face e Ollama.
  • Sua criação se baseou no que as iterações anteriores aprenderam. Enquanto Phi-1 se concentrou na codificação e Phi-2 começou a aprender a raciocinar, Phi-3 é melhor em codificação e raciocínio.
  • O sucesso do modelo é atribuído ao seu conjunto de dados de treinamento exclusivo, uma versão ampliada daquele usado para phi -2, que inclui dados da web altamente filtrados e dados sintéticos. O modelo também foi projetado para robustez, segurança e formato de chat.

Ah, com a família Phi, a Microsoft também construiu o Orca-Math, um modelo focado na resolução de problemas matemáticos.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

Por dentro da transformação AI-First na Evertec + Sinqia

Inteligência Artificial

Por dentro da transformação AI-First na Evertec + Sinqia

Se você está tentando descobrir como tornar a IA uma parte essencial do DNA da sua empresa, em vez de apenas mais uma iniciativa tecnológica, esta conversa oferece um modelo viável.

Na berlinda, o rumo à superinteligência

Inteligência Artificial

Na berlinda, o rumo à superinteligência

A Apple diz que os LLMs não conseguem realmente raciocinar, enquanto Sam Altman declara que a "singularidade suave" será inevitável até 2030. Quem tem razão?

“Quem lidera precisa entender IA – não para codificar, mas para direcionar”

Inteligência Artificial

“Quem lidera precisa entender IA – não para codificar, mas para d...

Em entrevista à The Shift, Marcelo Braga, presidente da IBM Brasil, defende que a IA não é só uma tecnologia, mas uma transformação estrutural que exige experimentação, letramento no topo e uma nova forma de liderar

Indicadores para medir a IA em termos humanos

Inteligência Artificial

Indicadores para medir a IA em termos humanos

Em meio a tantas promessas e exageros sobre o que a Inteligência Artificial pode fazer, o índice da OCDE é ferramenta valiosa para a tomada de decisões informada, separando o hype da realidade.

IA no organograma: os novos cidadãos corporativos das empresas

Inteligência Artificial

IA no organograma: os novos cidadãos corporativos das empresas

Agentes de IA já dividem tarefas com humanos e exigem novas estruturas de trabalho, gestão e confiança nas organizações

Brasil acelera na adoção de IA: 61% dos CEOs já usam agentes inteligentes

Inteligência Artificial

Brasil acelera na adoção de IA: 61% dos CEOs já usam agentes inteli...

Estudo do IBM Institute for Business Value mostra que os líderes brasileiros estão à frente da média global no uso de Inteligência Artificial, reconfigurando estratégias, processos e culturas para não ficarem para trás