Sla over naar inhoud

We willen onze eigen kennis doorzoekbaar maken voor AI, maar weten niet welke onderdelen we nodig hebben

Een werkende RAG-pipeline (retrieval-augmented generation) heeft vier blokken: bronnen, ingest met chunking, vector-database, en de query-laag die het model voedt. Voor MKB houd je elk blok zo simpel mogelijk en breid je pas uit als je een echte bottleneck ziet.

Probeer dit eerst zelf

  1. 1Bronnen: bepaal welke documenten echt mee moeten. Begin met SharePoint, Drive of een specifieke map met handboeken en procedures. Niet alles tegelijk, anders kun je later nooit meer debuggen wat erin zit.
  2. 2Ingest: kies een tool of script dat de bronnen ophaalt, naar tekst converteert, in chunks knipt, en als embeddings opslaat. Voor MKB is een open-source ingest of een SaaS zoals Vectorize of Carbon meestal genoeg.
  3. 3Vector-database: voor een paar duizend tot een miljoen chunks zijn pgvector op Postgres, Qdrant en Pinecone redelijk inwisselbaar. Kies degene die past bij waar je andere data al staat.
  4. 4Query-laag: een dunne app of n8n-flow neemt de gebruikersvraag, zoekt top-k chunks, plakt die als context bij het prompt, en stuurt naar het model. Toon de bronnen onder het antwoord, niet alleen het antwoord.
  5. 5Eval: test met twintig echte vragen waarvan jij het juiste antwoord kent. Pas dan weet je of de pipeline klopt. Schroom niet om vragen toe te voegen met antwoord 'staat niet in onze docs', want hallucinatie testen telt ook.

Wanneer ons inschakelen

Wil je dat we de eerste pipeline in een dag opzetten met jullie eigen documenten en een eval-set van jullie meest gestelde vragen, dan kunnen we dat verzorgen.

Zie ook

Past het bovenstaande niet?

Beschrijf je situatie hieronder. We sturen jouw input plus de stappen die je al zag naar onze AI en geven gericht vervolg-advies. Als het te risicovol is om zelf te doen, zeggen we dat ook.

Wie ben je?

Voor de AI-vraag hebben we je e-mailadres en bedrijfsnaam nodig, zo kunnen we opvolgen als de AI er niet uitkomt, en voorkomt het misbruik van de tool.

Maximaal 2 vragen per uur en 5 per dag, bewust beperkt zodat de AI snel en goed blijft. Voor meer help je jezelf en ons door direct contact op te nemen.

Of doe het helemaal niet zelf

Onze Managed IT-klanten zoeken dit soort vragen niet op. Eén aanspreekpunt, vaste prijs per maand, en het is binnen werktijd opgelost.