Skip to content

RAG et Knowledge Bases dans Amazon Bedrock

RAG et Bases de Connaissances dans Amazon Bedrock

Le RAG (Retrieval-Augmented Generation), ou génération augmentée par récupération, est un concept central d’Amazon Bedrock. Il permet à un modèle de base de produire des réponses enrichies par des informations externes, sans nécessiter de fine-tuning, offrant ainsi des réponses plus précises et contextuelles à des questions spécifiques.

Qu’est-ce que le RAG ?

Le RAG combine deux éléments principaux :

  1. Récupération : le modèle interroge une source de données externe pour obtenir des informations pertinentes.

  2. Génération : le modèle utilise ces informations pour produire une réponse enrichie et contextualisée.

Exemple pratique :
Un utilisateur demande : « Quelle est la politique de remboursement pour le produit Z ? ». Le modèle de base n’a pas cette information spécifique, mais grâce au RAG, il va chercher les documents internes de l’entreprise pour générer une réponse précise : « La politique de remboursement du produit Z prévoit un retour sous 30 jours avec remboursement intégral. »

Fonctionnement des bases de connaissances

Pour utiliser le RAG, il faut créer une base de connaissances qui sera consultée par le modèle :

  • Les documents sont stockés sur Amazon S3, mais peuvent aussi provenir d’autres sources.

  • Ces documents sont transformés en vecteurs d’encastrement (embeddings), des représentations numériques permettant au modèle de retrouver rapidement l’information pertinente.

  • Lorsqu’une question est posée, le système transforme la question en vecteur, recherche les informations proches dans la base et génère une réponse enrichie avec le modèle de fondation.

Exemple pratique :
Une entreprise agroalimentaire peut créer une base de connaissances avec les fiches techniques de ses produits et les recommandations de stockage. Lorsqu’un employé demande : « Quelle est la durée de conservation du produit X ? », le RAG va rechercher l’information dans les fiches techniques et générer une réponse précise.

Bases de données vectorielles pour RAG

La performance du RAG repose sur le choix de la base de données vectorielle :

  • Amazon OpenSearch Service : rapide, scalable et adapté aux millions de vecteurs pour des recherches en production.

  • Amazon Aurora ou PostgreSQL : utile pour des données structurées et des requêtes relationnelles.

  • Amazon Neptune Analytics : pour des RAG basés sur des graphes, idéal pour des relations complexes.

  • S3 Vectors : solution économique avec un stockage durable et des performances rapides.

  • Options externes : MongoDB, Redis ou Pinecone peuvent être intégrées selon les besoins.

Exemple pratique :
Pour un service d’assistance technique, OpenSearch peut stocker tous les guides utilisateurs et documents de dépannage afin que le RAG fournisse des réponses rapides aux questions des clients.

Sources de données compatibles

Amazon Bedrock peut exploiter diverses sources pour créer sa base de connaissances :

  • Amazon S3 pour fichiers et documents variés,

  • SharePoint, Confluence ou Salesforce pour contenus collaboratifs,

  • Pages web et flux RSS pour récupérer des informations publiques ou actualisées,

  • et toute source compatible ajoutée par AWS dans le futur.

Exemple pratique :
Une entreprise de tourisme peut combiner les brochures PDF internes, les guides de voyages externes et les pages web des offices du tourisme pour créer une base de connaissances riche, permettant à un chatbot de répondre aux questions des clients sur les destinations et les activités.

Cas d’utilisation typiques

RAG et les bases de connaissances permettent de développer des solutions avancées dans plusieurs domaines :

  1. Service client : un chatbot peut répondre à des questions sur les produits, services, guides d’utilisation ou FAQ.

  2. Recherche juridique : fournir des analyses à partir de lois, réglementations et documents d’experts.

  3. Santé et sciences : répondre à des questions médicales ou scientifiques en se basant sur articles et rapports spécialisés.

  4. Éducation et formation : générer des réponses contextualisées à partir de manuels, guides pédagogiques et notes de cours.

Exemple pratique :
Une société d’assurance peut créer un chatbot RAG qui consulte les contrats, clauses et documents internes pour répondre à des questions comme : « Quels sont les documents nécessaires pour déclarer un sinistre habitation ? ».

Points clés à retenir

  • Le RAG enrichit le modèle de base avec des données externes sans le fine-tuner.

  • Les bases de connaissances utilisent des embeddings vectoriels pour une recherche rapide et précise.

  • Le choix de la base de données vectorielle dépend du volume de données, du type de requêtes et de la rapidité souhaitée.

  • Les sources de données sont multiples et peuvent être internes ou externes.

  • Les cas d’usage sont variés : service client, juridique, santé, éducation, marketing, etc.

Grâce à RAG, vos modèles génératifs deviennent capables de répondre à des besoins très spécifiques avec des données actualisées, tout en garantissant la sécurité de vos informations dans votre environnement AWS.

--

Ce billet de blog fait partie du cours AWS AI Practitioner en français disponible sur Udemy et sur la plateforme LeCloudFacile.com.