Template : Base de connaissance interne RAG (Notion + GPT)
Un assistant IA qui ingère votre Notion, l'indexe en vector DB et répond aux questions de vos équipes avec sources citées. Réduit drastiquement les questions Slack répétitives.
Étapes de mise en place
Ingestion Notion
Workflow n8n schedulé chaque nuit : récupère via API toutes les pages des databases Notion à indexer. Filtrage par dernière modification pour ne ré-ingérer que les changements.
Chunking sémantique
Chaque page est découpée en chunks de 500-800 tokens, avec overlap de 100 tokens. Préservez les frontières de titres (H1, H2). Métadonnées : page_title, section, last_modified, url Notion.
Embeddings
Pour chaque chunk, appel OpenAI text-embedding-3-small (cost 0.02$/M tokens). Stockage dans Pinecone (index 1536 dims) avec les métadonnées.
Endpoint de question
Webhook n8n qui reçoit une question utilisateur. Embedding de la question, recherche des 10 top chunks similaires, optionnel re-ranking avec Cohere Rerank pour garder les 4 meilleurs.
Génération de réponse
Appel GPT-4o-mini avec un prompt : 'Tu es l'assistant interne. Réponds uniquement avec les sources fournies. Si la réponse n'y est pas, dis-le. Cite les sources avec les URLs Notion.'
Interface Slack
Bot Slack qui forward chaque question @assistant vers le webhook. Affichage de la réponse + sources cliquables dans le thread.
Conseil d'expert
Le RAG en interne échoue dans 60% des cas pour une seule raison : qualité de la base source. Si votre Notion est un foutoir, votre assistant le sera aussi. Avant de déployer, faites un cleanup : pages obsolètes archivées, titres clairs, structure cohérente. Démarrez sur un périmètre restreint (1-2 départements, 100-500 pages) avant d'étendre. Mesurez le taux de 'réponse correcte avec source' (objectif >85%) et le taux d'hallucination (objectif <3%) sur un jeu d'évaluation de 50 questions tests. Re-évaluez chaque mois.
Résultats attendus
Questions Slack répétitives : -60 à -80%. Temps perdu par les nouveaux embauchés à chercher l'info : -70%. Coût mensuel à 1000 requêtes : 5-30€ (embeddings + Pinecone + tokens). ROI typique : 1 mois pour une équipe de 30+ personnes.
Variantes possibles
- Multi-source : ingestion Notion + Google Drive + GitHub Wiki
- Permissions : filtrage des chunks selon les droits de l'utilisateur Slack
- Feedback loop : 👍/👎 sur chaque réponse pour améliorer le retrieval
- Version interne d'un chatbot client (B2B SaaS support automatisé)