Resolver problemas complexos de roteamento é o objetivo do cuOpt, lançado pela NVIDIA em novembro de 2021. O modelo oferece otimização quase em tempo real, considerando múltiplas restrições. E, ano a ano, vem ganhando recursos que têm ampliado o seu desempenho e os seus casos de uso, e o tornado mais acessível e fácil de usar, como os avanços recentes em LLM e programação linear apresentados dias atrás, durante a GTC 2024.
Como um NVIDIA AI Foundation Model, o cuOpt é otimizado para trabalho conjunto com IA Generativa empresarial. Portanto, era de se esperar que a empresa, em algum momento, pensaria na criação de um “cuOpt AI Agent”.
Embora não exista uma definição amplamente aceita para agentes com LLM, eles podem ser descritos como um sistema que pode usar um LLM para raciocinar sobre um problema, criar um plano para resolver o problema e executar o plano com a ajuda de um kit de ferramentas – no nosso caso, um pipeline RAG para gerar respostas sensíveis ao contexto, um intérprete de código para resolver tarefas programáticas complexas e uma API do microsserviço cuOpt.
Com um agente desenvolvido com LLM, toda a complexidade do Problema de Roteamento de Veículos (VRP) pode ser tratada usando uma combinação de duas técnicas:
- Decomposição de tarefas e perguntas
- Reflexão ou crítica
Embora os LLMs não possam raciocinar completamente como os humanos, sua “fluência na linguagem” pode ser explorada para conseguir isso. A receita geralmente inclui um LLM, várias “ferramentas” e um executor de ferramentas.
Lembra da nossa conversa recente sobre o uso de LLMs para a resolução de problemas de negócios complexos, especialmente quando envolvem múltiplas variáveis e restrições? Pois é, a NVIDIA parece ter encontrado um caminho útil, aproveitando-os como front-end amigável para os usuários.
“O agente conseguiu interpretar o problema, considerar as restrições, fazer a otimização, e montar uma resposta legível para seres humanos. O que já é sensacional”, comenta Ricardo Taborda, cofundador da 7D Analytics. “Mais. Ele informa, claramente, que não é uma boa ideia dar um desconto de 5% para aumentar a demanda de um dos produtos em 2 mil unidades. O que não é uma resposta trivial.”
“Algo desse tipo abre espaço para muitas aplicações de IA Generativa, principalmente em supply chain”, completa. A otimização de rotas é um deles. Para determinar a rota mais eficiente e econômica de transporte de carga, a IA pode ser programada para analisar informações como condições de tráfego, clima e restrições de transporte, como interdições de ruas e obras. Por meio de algoritmos avançados de roteamento inteligente, a IA considera essas variáveis, o que permite calcular as melhores rotas para os motoristas. A IA Generativa se encarrega de agilizar os processos de entrada de dados para o modelo, diante de um evento inesperado, por exemplo, e da interpretação das diferentes respostas, para um agente humano poder tomar a melhor decisão. Mas há outros.