Knowledge 服务概览

MolanDev Knowledge 是一款企业级 RAG (检索增强生成) 知识库服务,提供从文档摄入、向量化存储到智能检索问答的完整解决方案。

为什么需要 Knowledge?

在企业知识管理场景中,传统关键词检索已无法满足需求:

语义理解缺失 — 关键词匹配无法理解查询意图
知识碎片化 — 文档分散在各处,缺乏统一检索
回答不可溯源 — 大模型幻觉问题严重

Knowledge 通过 RAG 技术 将企业私有文档与大语言模型结合,提供准确、可溯源的智能问答能力。

核心能力

📄 智能文档摄入

支持 PDF、Word、Excel、PPT、HTML、Markdown 等主流格式,自动完成格式转换、结构感知分片、向量化存储。

多格式转换 — MarkItDown、LibreOffice、MinerU 三引擎智能路由
结构感知分片 — 理解 Markdown 章节结构,保留语义完整性
位置追踪 — 记录分片在原文中的精确位置,支持高亮定位

🔍 混合检索

向量语义检索 + 关键词全文检索双路召回,RRF 融合算法,结合重排序模型精排优化。

向量检索 — 基于语义相似度,理解查询意图
关键词检索 — Elasticsearch 全文检索,精确匹配专有名词
重排序 — 集成 qwen3-rerank 模型,精排提升相关性
上下文补全 — 自动扩展相邻分片,构建完整语义片段

💬 RAG 问答

支持 Standard 和 Agentic 两种 RAG 模式,满足简单问答与复杂多轮对话需求。

Standard RAG — 固定检索 → 生成流程,适合常规问答
Agentic RAG — LLM 自主决定检索时机,适合复杂多轮对话
多轮对话 — 历史问题组合检索,上下文连贯
流式响应 — SSE 实时输出,体验流畅
深度思考 — 支持模型推理过程展示
引用溯源 — 回答关联原文,可信可查

技术栈

组件	技术选型	说明
框架	Spring Boot + Spring AI	AI 能力集成
向量数据库	PgVector	基于 PostgreSQL 的向量扩展
全文检索	Elasticsearch	关键词检索,用于混合检索
备选检索	Lucene	轻量级关键词检索,适用于低配服务器/Demo 测试
Embedding	OpenAI 兼容接口	支持 Ollama、各大云厂商
重排序	qwen3-rerank	阿里云 DashScope
LLM	OpenAI 兼容接口	支持 OpenAI、DeepSeek、通义千问等
持久化	MySQL + MyBatis-Plus	元数据、会话管理

架构概览

Knowledge 服务采用分层架构设计:

与 MolanDev 框架集成

Knowledge 服务与 MolanDev 框架深度集成:

单体/微服务自由切换 — 同一套代码,部署模式灵活选择
统一认证授权 — 复用框架的 RBAC 权限体系
文件服务集成 — 文档存储复用框架的文件管理能力
多数据源支持 — 知识库数据可独立数据源

快速导航

文档	说明
架构设计	深入了解系统架构与核心流程
快速入门	5 分钟快速搭建知识库服务
文档摄入	文档转换、分片、向量化流程
检索系统	向量检索、混合检索、重排序
RAG 问答	Standard RAG 与 Agentic RAG 模式
配置说明	完整配置项说明与场景化配置

下一步

阅读架构设计了解系统整体架构
跟随快速入门快速上手使用