RAG实战 (2 篇)
知识入库:多格式文档的 ETL 与父子切分策略

本文是「智答」RAG 智能问答系统开发系列的**第二篇**。上一篇我们用 30 行代码跑通了 RAG 的最简链路,用的是极度简化的文档处理方案。本篇深入离线链路的上半段:如何把真实世界里格式各异、质量参差的原始文档,加工成干净、结构合理的知识片段——这是整个 RAG 系统质量的真正地基。

Chuanyun RAG实战 2026-03-16 20 0 103 分钟
RAG
【RAG实战】RAG 系统全景导读:从 FAQ 到智能问答的工程跨越

本文是「智答」RAG 智能问答系统开发系列的第一篇。本系列面向有 Python 基础、希望系统入门 RAG 工程开发的程序员,共 6 篇文章,配套一个完整的实践项目——「技术文档智能问答助手」。跟完整个系列,你将得到一个支持多格式文档上传、多轮对话、混合检索的生产级 RAG 系统。

Chuanyun RAG实战 2026-03-13 21 0 67 分钟
RAG