Knowledge 服务概览
MolanDev Knowledge 是一款企业级 RAG (检索增强生成) 知识库服务,提供从文档摄入、向量化存储到智能检索问答的完整解决方案。
为什么需要 Knowledge?
在企业知识管理场景中,传统关键词检索已无法满足需求:
- 语义理解缺失 — 关键词匹配无法理解查询意图
- 知识碎片化 — 文档分散在各处,缺乏统一检索
- 回答不可溯源 — 大模型幻觉问题严重
Knowledge 通过 RAG 技术 将企业私有文档与大语言模型结合,提供准确、可溯源的智能问答能力。
核心能力
📄 智能文档摄入
支持 PDF、Word、Excel、PPT、HTML、Markdown 等主流格式,自动完成格式转换、结构感知分片、向量化存储。
- 多格式转换 — MarkItDown、LibreOffice、MinerU 三引擎智能路由
- 结构感知分片 — 理解 Markdown 章节结构,保留语义完整性
- 位置追踪 — 记录分片在原文中的精确位置,支持高亮定位
🔍 混合检索
向量语义检索 + 关键词全文检索双路召回,RRF 融合算法,结合重排序模型精排优化。
- 向量检索 — 基于语义相似度,理解查询意图
- 关键词检索 — Elasticsearch 全文检索,精确匹配专有名词
- 重排序 — 集成 qwen3-rerank 模型,精排提升相关性
- 上下文补全 — 自动扩展相邻分片,构建完整语义片段
💬 RAG 问答
支持 Standard 和 Agentic 两种 RAG 模式,满足简单问答与复杂多轮对话需求。
- Standard RAG — 固定检索 → 生成流程,适合常规问答
- Agentic RAG — LLM 自主决定检索时机,适合复杂多轮对话
- 多轮对话 — 历史问题组合检索,上下文连贯
- 流式响应 — SSE 实时输出,体验流畅
- 深度思考 — 支持模型推理过程展示
- 引用溯源 — 回答关联原文,可信可查
技术栈
| 组件 | 技术选型 | 说明 |
|---|---|---|
| 框架 | Spring Boot + Spring AI | AI 能力集成 |
| 向量数据库 | PgVector | 基于 PostgreSQL 的向量扩展 |
| 全文检索 | Elasticsearch | 关键词检索,用于混合检索 |
| 备选检索 | Lucene | 轻量级关键词检索,适用于低配服务器/Demo 测试 |
| Embedding | OpenAI 兼容接口 | 支持 Ollama、各大云厂商 |
| 重排序 | qwen3-rerank | 阿里云 DashScope |
| LLM | OpenAI 兼容接口 | 支持 OpenAI、DeepSeek、通义千问等 |
| 持久化 | MySQL + MyBatis-Plus | 元数据、会话管理 |
架构概览
Knowledge 服务采用分层架构设计:
与 MolanDev 框架集成
Knowledge 服务与 MolanDev 框架深度集成:
- 单体/微服务自由切换 — 同一套代码,部署模式灵活选择
- 统一认证授权 — 复用框架的 RBAC 权限体系
- 文件服务集成 — 文档存储复用框架的文件管理能力
- 多数据源支持 — 知识库数据可独立数据源
快速导航
| 文档 | 说明 |
|---|---|
| 架构设计 | 深入了解系统架构与核心流程 |
| 快速入门 | 5 分钟快速搭建知识库服务 |
| 文档摄入 | 文档转换、分片、向量化流程 |
| 检索系统 | 向量检索、混合检索、重排序 |
| RAG 问答 | Standard RAG 与 Agentic RAG 模式 |
| 配置说明 | 完整配置项说明与场景化配置 |