Tous les templates
Knowledge managementAvancé

Template : Base de connaissance interne RAG (Notion + GPT)

Un assistant IA qui ingère votre Notion, l'indexe en vector DB et répond aux questions de vos équipes avec sources citées. Réduit drastiquement les questions Slack répétitives.

Setup : 1-2 joursGain : 8-15h/semaine

Outils nécessaires

Étapes de mise en place

1

Ingestion Notion

Workflow n8n schedulé chaque nuit : récupère via API toutes les pages des databases Notion à indexer. Filtrage par dernière modification pour ne ré-ingérer que les changements.

2

Chunking sémantique

Chaque page est découpée en chunks de 500-800 tokens, avec overlap de 100 tokens. Préservez les frontières de titres (H1, H2). Métadonnées : page_title, section, last_modified, url Notion.

3

Embeddings

Pour chaque chunk, appel OpenAI text-embedding-3-small (cost 0.02$/M tokens). Stockage dans Pinecone (index 1536 dims) avec les métadonnées.

4

Endpoint de question

Webhook n8n qui reçoit une question utilisateur. Embedding de la question, recherche des 10 top chunks similaires, optionnel re-ranking avec Cohere Rerank pour garder les 4 meilleurs.

5

Génération de réponse

Appel GPT-4o-mini avec un prompt : 'Tu es l'assistant interne. Réponds uniquement avec les sources fournies. Si la réponse n'y est pas, dis-le. Cite les sources avec les URLs Notion.'

6

Interface Slack

Bot Slack qui forward chaque question @assistant vers le webhook. Affichage de la réponse + sources cliquables dans le thread.

Conseil d'expert

Le RAG en interne échoue dans 60% des cas pour une seule raison : qualité de la base source. Si votre Notion est un foutoir, votre assistant le sera aussi. Avant de déployer, faites un cleanup : pages obsolètes archivées, titres clairs, structure cohérente. Démarrez sur un périmètre restreint (1-2 départements, 100-500 pages) avant d'étendre. Mesurez le taux de 'réponse correcte avec source' (objectif >85%) et le taux d'hallucination (objectif <3%) sur un jeu d'évaluation de 50 questions tests. Re-évaluez chaque mois.

Résultats attendus

Questions Slack répétitives : -60 à -80%. Temps perdu par les nouveaux embauchés à chercher l'info : -70%. Coût mensuel à 1000 requêtes : 5-30€ (embeddings + Pinecone + tokens). ROI typique : 1 mois pour une équipe de 30+ personnes.

Variantes possibles

  • Multi-source : ingestion Notion + Google Drive + GitHub Wiki
  • Permissions : filtrage des chunks selon les droits de l'utilisateur Slack
  • Feedback loop : 👍/👎 sur chaque réponse pour améliorer le retrieval
  • Version interne d'un chatbot client (B2B SaaS support automatisé)

Templates liés