Retrieval-Augmented Generation

RAG Mimarisi
Kurumsal bilginiz, AI'ın hafızası

Şirket dokümanlarınızı, veritabanlarınızı ve web kaynaklarınızı LLM'lere bağlayın. Hibrit arama, reranking ve kaynak gösterimi ile güvenilir, denetlenebilir cevaplar.

8 adımda uçtan uca RAG

Kaynak dokümanlardan kullanıcıya kadar tüm akış FlexAI tarafından yönetilir.

1
📥
Ingest
PDF, Word, Excel, web, SQL kaynakları toplanır
2
🔍
Parse
Metin, tablo, görsel ayrıştırılır; OCR uygulanır
3
✂️
Chunk
Parent-child / semantic / fixed bölümleme
4
🧮
Embed
Vektör temsilleri üretilir (Jina, Voyage, OpenAI)
5
🗄️
Index
Weaviate, Qdrant, Milvus vb. vektör DB'ye yazılır
6
🔎
Retrieve
Hibrit arama: vector + BM25 keyword
7
📊
Rerank
Cross-encoder ile en alakalı parça öne alınır
8
💬
Generate
LLM kaynak referanslı yanıt üretir

Production-grade RAG tüm kontrolleriyle

📥
Çoklu Kaynak Ingestion
PDF (taranmış dahil), Word, Excel, PowerPoint, Markdown, HTML, JSON, CSV, Notion, Confluence, SharePoint, S3, Google Drive, web crawler, SQL/NoSQL veritabanı, REST API. Otomatik scheduled re-ingest.
PDF + OCRWeb CrawlSQL
✂️
Akıllı Chunking
Parent-child (büyük bağlam, küçük arama birimi), semantic (anlam bütünlüğüne göre), recursive splitter, fixed-size, code-aware, markdown header tabanlı. Chunk overlap ve özet eklentisi.
Parent-ChildSemanticRecursive
🧮
Embedding Modelleri
Jina, Voyage, OpenAI text-embedding-3, Cohere embed-multilingual, BGE, E5, Türkçe optimize modeller. Çok dilli arama, model değişiminde otomatik re-embed.
MultilingualTürkçeHot-swap
🗄️
Vektör Veritabanları
Weaviate (varsayılan), Qdrant, Milvus, pgvector, Pinecone, Chroma, Elasticsearch, OpenSearch, MyScale, AnalyticDB, TiDB, Tencent VDB. 30+ seçenek, tek konfig değişikliği.
30+ DBSelf-hostedCloud
🔎
Hibrit Arama
Vektör araması (semantic) + BM25 (keyword). Dinamik ağırlıklandırma, metadata filtering (tarih, etiket, kategori, yetki). Hassas terim eşleşmesi + anlam yakınlığı bir arada.
Vector + BM25Metadata Filter
📊
Reranking
Cross-encoder modelleri (bge-rerank, cohere-rerank, jina-rerank) ile retrieve edilen parçalar yeniden sıralanır. False positive'ler ayıklanır, top-k'da gerçekten alakalı parçalar kalır.
Cross-encoderCohereJina
📝
Kaynak Gösterimi
Her cevap, hangi dokümanın hangi sayfasından / paragrafından üretildiğini gösterir. Tıklanabilir alıntılar, halüsinasyon riskini elimine eder, denetim için audit trail.
CitationsPage-levelAudit
🛡️
Yetki & İzolasyon
Knowledge base'ler tenant ve user-grup düzeyinde izole. Doküman bazında ACL, sorgu sırasında yetkilendirme filtresi. Veri sızıntısı engellenir.
RBACPer-doc ACL
🔄
Sürekli Güncelleme
Otomatik re-ingestion (scheduled veya webhook tetikli), incremental update, doküman versiyonu takibi. Bilgi tabanı her zaman güncel.
ScheduledWebhookVersioned

RAG ile neler yapılır?

📋
Müşteri Destek Asistanı
Tüm ürün dokümantasyonu, SLA, fiyat listesi, troubleshooting kılavuzları indekslenir. Müşteri sorusuna anlık, kaynak gösterimli yanıt; ticket çözüm süresi %70 düşer.
🏥
Klinik Karar Destek
İlaç prospektüsleri, klinik protokoller, hasta dosyaları, literatür. Hekim doğal dille sorar; yan etki, doz aşımı, etkileşim bilgileri kaynaklarıyla sunulur.
⚖️
Hukuki Doküman Analizi
Sözleşmeler, mevzuat, içtihatlar, dilekçe örnekleri. Avukat "X maddesinde benzer durum var mı?" diye sorar; ilgili emsal kararlarla yanıtlanır.
🏦
Düzenleyici Uyum
BDDK, SPK, KVKK, GDPR mevzuatı + iç politikalar. Uyum ekibi değişiklikleri takip eder, farkları otomatik raporlar.
🏭
Saha Operatörü Asistanı
Makina kullanım kılavuzları, bakım prosedürleri, arıza geçmişi. Mobil uygulamadan QR ile cihaz tarayan saha personeli adım adım rehber alır.
💼
İç Bilgi Tabanı
Wiki, Confluence, Notion, Google Drive içerikleri. Yeni çalışan onboarding, IT helpdesk, HR sorgularında %80 self-service.

🧪
Test & Değerlendirme
Prompt iterasyonu, retrieval kalitesi, halüsinasyon oranı için yerleşik metrikler:
Retrieval Recall@Kİlk K içinde ground-truth oranı
FaithfulnessYanıtın kaynaklara uyumu
Answer RelevanceSorudan sapma kontrolü
Context PrecisionGereksiz parça oranı
A/B TestingPrompt & chunk strateji karşılaştırması
🔐
Veri Egemenliği
RAG verisi kontrolünüzde, kapalı devre çalışır:
Self-hostedKendi sunucunuzda / cloud'unuzda
Air-gap Desteğiİnternetsiz ortam
Yerel EmbeddingOllama / vLLM ile lokal model
Veri ŞifrelemeAt-rest + in-transit
KVKK / GDPRTam uyum, audit log

Kendi verinizle canlı RAG demosu

Bize 5-10 sayfalık bir doküman gönderin, 24 saat içinde size özel RAG asistanı kuralım.