s
INTELIGÊNCIA ARTIFICIAL

Modelos de linguagem têm limite?

O lançamento do Phi-3 e do Snowflake Arctic mostra como os novos modelos de linguagem estão cada vez mais avançados.

A expectativa de que os modelos de linguagem se tornem ainda mais poderosos e versáteis ganhou novo impulso na última semana com os lançamentos do Phi-3 e do Snowflake Arctic.

O Phi-3 pertence a uma família de modelos de linguagem criados pela Microsoft para serem pequenos (a ponto de rodarem bem em smartphones), mas treinados em dados da mais alta qualidade. O objetivo é o de que o baixo custo e a portabilidade dos Small Language Models (SLM) de alto desempenho ajudem a IA a funcionar localmente na eletrônica inteligente do dia-a-dia. Sobre ele é relevante saber que:

  • Tem 3,8 bilhões de parâmetros treinados em 3,3 trilhões de tokens. Mas apesar de seu tamanho reduzido, tem desempenho equivalente a modelos maiores como Mixtral 8x7B e GPT- 3.5 , atingindo 69% no MMLU e 8,38 no MT-bench.
  • Está disponível no Azure, Hugging Face e Ollama.
  • Sua criação se baseou no que as iterações anteriores aprenderam. Enquanto Phi-1 se concentrou na codificação e Phi-2 começou a aprender a raciocinar, Phi-3 é melhor em codificação e raciocínio.
  • O sucesso do modelo é atribuído ao seu conjunto de dados de treinamento exclusivo, uma versão ampliada daquele usado para phi -2, que inclui dados da web altamente filtrados e dados sintéticos. O modelo também foi projetado para robustez, segurança e formato de chat.

Ah, com a família Phi, a Microsoft também construiu o Orca-Math, um modelo focado na resolução de problemas matemáticos.

Este é um conteúdo exclusivo para assinantes.

Cadastre-se grátis para ler agora
e acesse 5 conteúdos por mês.

É assinante ou já tem senha? Faça login. Já recebe a newsletter? Ative seu acesso.

A IA está em todo lugar: o problema agora é estratégia

Inteligência Artificial

A IA está em todo lugar: o problema agora é estratégia

Pesquisa global com quase 12 mil profissionais mostra que 74% dos trabalhadores já usam IA regularmente — mas a maioria das organizações ainda não sabe como converter esse uso em valor real

O trabalho invisível da IA Física

Inteligência Artificial

O trabalho invisível da IA Física

Empresas contratam trabalhadores domésticos para coletar os dados que vão treinar humanoides. A disputa por esse ativo pode definir os vencedores da próxima onda da IA.

Adotar IA ficou simples. Sustentar operações inteligentes, não

Inteligência Artificial

Adotar IA ficou simples. Sustentar operações inteligentes, não

A ISO/IEC 42001 reconhece o que muitas empresas ainda ignoram: IA é sistema crítico de operação, não ferramenta de produtividade.

Por Jesse Fernandes *
A IA Visual entra na produção

Inteligência Artificial

A IA Visual entra na produção

O valor da IA Visual está mudando. O que começou criando imagens agora ajuda a construir produtos, softwares e modelos usados nos processos de engenharia e manufatura.

IA muda primeiro emprego; não como acreditávamos

Inteligência Artificial

IA muda primeiro emprego; não como acreditávamos

Empresas com IA integrada estão contratando mais profissionais juniores, enquanto as tarefas que formavam esses profissionais estão desaparecendo ao mesmo tempo.

De plataforma de design a ponto de encontro de criatividade e produtividade: a virada do Canva

Inteligência Artificial

De plataforma de design a ponto de encontro de criatividade e produtiv...

Com 5.000 funcionários em uma semana dedicada à IA e US$ 4 bilhões em receita, a empresa redefine o que significa colocar o cliente no centro