🤖 Powered by RAG + OpenClaw

基于本地文档的智能问答

上传 PDF、Word、Excel、PPT,AI 自动理解文档结构,支持精确引用和来源追溯,开箱即用。


// Features

为什么选择这套方案?

📄

多格式支持

支持 PDF、Word、Excel、PPT、Markdown 等主流文档格式,自动解析文本和表格结构。

🎯

精确引用

每个答案都有来源标注,点击可直接跳转到原文对应位置,支持页码精确定位。

🔒

本地部署

所有数据存储在本地,无需上传到云端,保障企业敏感信息安全。

快速响应

基于向量检索和混合索引,毫秒级返回检索结果,即问即答无需等待。

🌳

智能结构理解

采用 PageIndex 树状索引技术,理解文档的章节层次,适合长文档深度分析。

💬

飞书集成

通过 OpenClaw 直接接入飞书,在飞书里 @ 机器人即可提问,结果自动推送。


// Architecture

系统架构

📥 文档接入层
PyMuPDF / python-docx
🔧 索引构建层
LangChain / m3e-base
💾 向量数据库
ChromaDB / PageIndex
🔍 混合检索
向量 + BM25 + RRF
✍️ 答案生成
LLM + 上下文组装
💬 交互界面
OpenClaw + 飞书

// Quick Start

快速开始

# 1. 安装依赖 pip install chromadb sentence-transformers langchain pip install pymupdf python-docx openpyxl # 2. 索引知识库 python index_knowledge.py --path ./docs/ # 3. 启动问答服务 python qa_server.py # 4. 提问 result = qa_engine.query("这份财报的核心营收是多少?") print(result.answer) print(result.sources) # [{"page": 5, "text": "..."}]

// Design Tokens

设计规范 (Vercel Design System)

Display / 48px / 600 知识问答
Heading / 32px / 600 系统架构
Body / 16px / 400 基于本地文档的智能问答系统,支持多格式文档解析和精确引用。
Small / 14px / 400 这是辅助说明文字,用于卡片描述和次要信息。
Mono / 13px const answer = await rag.query(question);
#171717
#ffffff
#0072f5
#0a72ef
#ebf5ff

准备好构建你的知识问答助手了吗?

基于 awesome-design-md 设计系统 + RAG 架构,快速搭建企业级知识库。