Solução de IA

Crie uma Solução RAG Multiagente na OCI

Introdução

A geração aumentada de recuperação (RAG) pode ser útil para consultas diretas. Mas e se as consultas forem complexas, exigindo raciocínio e tomada de decisões em várias etapas? É quando, por exemplo, um chatbot de suporte que pudesse solucionar problemas, não apenas recuperar perguntas frequentes, seria mais útil.

Nessa solução, configuraremos um pipeline de RAG multiagente e o implementaremos na Oracle Cloud Infrastructure (OCI) com o Oracle Database 23ai para responder de forma inteligente a uma consulta. Os agentes do modelo de grande linguagem (LLM) planejam, pesquisam e raciocinam a resposta da IA; esse processo de cadeia de pensamento (CoT) emula a capacidade de resolução de problemas dos humanos. Uma interface Gradio orquestra o processamento de dados; diversas fontes de dados são carregadas, ingeridas e armazenadas como vetores usando ferramentas de código aberto. O Gradio também fornece uma interface de bate-papo para inserir uma consulta em linguagem natural.

Com a visualização de CoT no Gradio, você verá as etapas e decisões tomadas por cada agente para entregar a resposta final sintetizada. Essa solução fornece um exemplo fácil de seguir de como a IA autônoma pode aprimorar as capacidades de raciocínio de modelos locais e baseados em nuvem.

Demonstração

Demonstração: Crie uma solução RAG multiagente na OCI (1:26)

Pré-requisitos e configuração

  1. Conta Oracle Cloud —página de cadastro
  2. OCI Generative AI — documentação
  3. OCI Generative AI Agents — documentação
  4. Oracle Database 23ai — documentação
  5. Docling — documentação
  6. Gradio — documentação
  7. Trafilatura — documentação