Knowledge managementAvancé

Template : Base de connaissance interne RAG (Notion + GPT)

Un assistant IA qui ingère votre Notion, l'indexe en vector DB et répond aux questions de vos équipes avec sources citées. Réduit drastiquement les questions Slack répétitives.

Setup : 1-2 joursGain : 8-15h/semaine

Outils nécessaires

n8n Notion Pinecone ChatGPT

Étapes de mise en place

Ingestion Notion

Workflow n8n schedulé chaque nuit : récupère via API toutes les pages des databases Notion à indexer. Filtrage par dernière modification pour ne ré-ingérer que les changements.

Chunking sémantique

Chaque page est découpée en chunks de 500-800 tokens, avec overlap de 100 tokens. Préservez les frontières de titres (H1, H2). Métadonnées : page_title, section, last_modified, url Notion.

Embeddings

Pour chaque chunk, appel OpenAI text-embedding-3-small (cost 0.02$/M tokens). Stockage dans Pinecone (index 1536 dims) avec les métadonnées.

Endpoint de question

Webhook n8n qui reçoit une question utilisateur. Embedding de la question, recherche des 10 top chunks similaires, optionnel re-ranking avec Cohere Rerank pour garder les 4 meilleurs.

Génération de réponse

Appel GPT-4o-mini avec un prompt : 'Tu es l'assistant interne. Réponds uniquement avec les sources fournies. Si la réponse n'y est pas, dis-le. Cite les sources avec les URLs Notion.'

Interface Slack

Bot Slack qui forward chaque question @assistant vers le webhook. Affichage de la réponse + sources cliquables dans le thread.

Conseil d'expert

Le RAG en interne échoue dans 60% des cas pour une seule raison : qualité de la base source. Si votre Notion est un foutoir, votre assistant le sera aussi. Avant de déployer, faites un cleanup : pages obsolètes archivées, titres clairs, structure cohérente. Démarrez sur un périmètre restreint (1-2 départements, 100-500 pages) avant d'étendre. Mesurez le taux de 'réponse correcte avec source' (objectif >85%) et le taux d'hallucination (objectif <3%) sur un jeu d'évaluation de 50 questions tests. Re-évaluez chaque mois.

Résultats attendus

Questions Slack répétitives : -60 à -80%. Temps perdu par les nouveaux embauchés à chercher l'info : -70%. Coût mensuel à 1000 requêtes : 5-30€ (embeddings + Pinecone + tokens). ROI typique : 1 mois pour une équipe de 30+ personnes.

Variantes possibles

Multi-source : ingestion Notion + Google Drive + GitHub Wiki
Permissions : filtrage des chunks selon les droits de l'utilisateur Slack
Feedback loop : 👍/👎 sur chaque réponse pour améliorer le retrieval
Version interne d'un chatbot client (B2B SaaS support automatisé)

Templates liés

Support client

Chatbot support client IA avec n8n

Content & Marketing