Skip to content

Knowledge 服务概览

MolanDev Knowledge 是一款企业级 RAG (检索增强生成) 知识库服务,提供从文档摄入、向量化存储到智能检索问答的完整解决方案。

为什么需要 Knowledge?

在企业知识管理场景中,传统关键词检索已无法满足需求:

  • 语义理解缺失 — 关键词匹配无法理解查询意图
  • 知识碎片化 — 文档分散在各处,缺乏统一检索
  • 回答不可溯源 — 大模型幻觉问题严重

Knowledge 通过 RAG 技术 将企业私有文档与大语言模型结合,提供准确、可溯源的智能问答能力。

核心能力

📄 智能文档摄入

支持 PDF、Word、Excel、PPT、HTML、Markdown 等主流格式,自动完成格式转换、结构感知分片、向量化存储。

  • 多格式转换 — MarkItDown、LibreOffice、MinerU 三引擎智能路由
  • 结构感知分片 — 理解 Markdown 章节结构,保留语义完整性
  • 位置追踪 — 记录分片在原文中的精确位置,支持高亮定位

🔍 混合检索

向量语义检索 + 关键词全文检索双路召回,RRF 融合算法,结合重排序模型精排优化。

  • 向量检索 — 基于语义相似度,理解查询意图
  • 关键词检索 — Elasticsearch 全文检索,精确匹配专有名词
  • 重排序 — 集成 qwen3-rerank 模型,精排提升相关性
  • 上下文补全 — 自动扩展相邻分片,构建完整语义片段

💬 RAG 问答

支持 Standard 和 Agentic 两种 RAG 模式,满足简单问答与复杂多轮对话需求。

  • Standard RAG — 固定检索 → 生成流程,适合常规问答
  • Agentic RAG — LLM 自主决定检索时机,适合复杂多轮对话
  • 多轮对话 — 历史问题组合检索,上下文连贯
  • 流式响应 — SSE 实时输出,体验流畅
  • 深度思考 — 支持模型推理过程展示
  • 引用溯源 — 回答关联原文,可信可查

技术栈

组件技术选型说明
框架Spring Boot + Spring AIAI 能力集成
向量数据库PgVector基于 PostgreSQL 的向量扩展
全文检索Elasticsearch关键词检索,用于混合检索
备选检索Lucene轻量级关键词检索,适用于低配服务器/Demo 测试
EmbeddingOpenAI 兼容接口支持 Ollama、各大云厂商
重排序qwen3-rerank阿里云 DashScope
LLMOpenAI 兼容接口支持 OpenAI、DeepSeek、通义千问等
持久化MySQL + MyBatis-Plus元数据、会话管理

架构概览

Knowledge 服务采用分层架构设计:

与 MolanDev 框架集成

Knowledge 服务与 MolanDev 框架深度集成:

  • 单体/微服务自由切换 — 同一套代码,部署模式灵活选择
  • 统一认证授权 — 复用框架的 RBAC 权限体系
  • 文件服务集成 — 文档存储复用框架的文件管理能力
  • 多数据源支持 — 知识库数据可独立数据源

快速导航

文档说明
架构设计深入了解系统架构与核心流程
快速入门5 分钟快速搭建知识库服务
文档摄入文档转换、分片、向量化流程
检索系统向量检索、混合检索、重排序
RAG 问答Standard RAG 与 Agentic RAG 模式
配置说明完整配置项说明与场景化配置

下一步