We willen onze eigen kennis doorzoekbaar maken voor AI, maar weten niet welke onderdelen we nodig hebben
Een werkende RAG-pipeline (retrieval-augmented generation) heeft vier blokken: bronnen, ingest met chunking, vector-database, en de query-laag die het model voedt. Voor MKB houd je elk blok zo simpel mogelijk en breid je pas uit als je een echte bottleneck ziet.
Probeer dit eerst zelf
- 1Bronnen: bepaal welke documenten echt mee moeten. Begin met SharePoint, Drive of een specifieke map met handboeken en procedures. Niet alles tegelijk, anders kun je later nooit meer debuggen wat erin zit.
- 2Ingest: kies een tool of script dat de bronnen ophaalt, naar tekst converteert, in chunks knipt, en als embeddings opslaat. Voor MKB is een open-source ingest of een SaaS zoals Vectorize of Carbon meestal genoeg.
- 3Vector-database: voor een paar duizend tot een miljoen chunks zijn pgvector op Postgres, Qdrant en Pinecone redelijk inwisselbaar. Kies degene die past bij waar je andere data al staat.
- 4Query-laag: een dunne app of n8n-flow neemt de gebruikersvraag, zoekt top-k chunks, plakt die als context bij het prompt, en stuurt naar het model. Toon de bronnen onder het antwoord, niet alleen het antwoord.
- 5Eval: test met twintig echte vragen waarvan jij het juiste antwoord kent. Pas dan weet je of de pipeline klopt. Schroom niet om vragen toe te voegen met antwoord 'staat niet in onze docs', want hallucinatie testen telt ook.
Wanneer ons inschakelen
Wil je dat we de eerste pipeline in een dag opzetten met jullie eigen documenten en een eval-set van jullie meest gestelde vragen, dan kunnen we dat verzorgen.
Zie ook
- Mag ik een klantbestand of mail in ChatGPT plakken?Hangt af van het account en de instellingen. Een gratis ChatGPT en een Team-tenant gedragen zich anders dan veel mensen denken.
- Ik wil één pagina AI-beleid voor mijn teamEen echte one-pager werkt beter dan een dik document dat niemand leest. Vier kopjes en concrete voorbeelden.
- Hoe weet ik of een AI-antwoord verzonnen is?Modellen klinken zelfverzekerd, ook als ze fout zijn. Een paar vaste checks vangen de meeste fouten af.
Past het bovenstaande niet?
Beschrijf je situatie hieronder. We sturen jouw input plus de stappen die je al zag naar onze AI en geven gericht vervolg-advies. Als het te risicovol is om zelf te doen, zeggen we dat ook.
Of doe het helemaal niet zelf
Onze Managed IT-klanten zoeken dit soort vragen niet op. Eén aanspreekpunt, vaste prijs per maand, en het is binnen werktijd opgelost.