管理员
@admin
博客管理员
@admin
博客管理员
前三篇(第17-19篇)把梯度下降、SGD/Mini-batch、Adam 优化器讲透了。AdamW 里的权重衰减(L2 正则化)反复出现,但一直没有正面讲清楚它的数学原理。这一篇补全这块拼图——从正则化的根本动机讲起,推导 L1 和...
第17篇讲了梯度下降的几何原理,第18篇讲了 SGD 的统计性质和 mini-batch 的噪声正则化效果。两篇都暗含一个缺陷:所有参数用同一个学习率。但神经网络里不同参数的梯度量级可以相差几个数量级——嵌入层参数的梯度极小,某些全连...
上一篇我们推导了梯度下降的数学原理——负梯度是损失下降最快的方向,学习率控制步长,学习率太大振荡、太小收敛慢。
前六篇(第11-16篇)把概率与信息论打透了——随机变量、贝叶斯定理、MLE、交叉熵、KL散度。
上一篇我们讲透了信息熵和交叉熵——熵衡量不确定性,交叉熵衡量"用错分布的代价",最小化交叉熵就是让模型分布靠近真实分布。这一篇深入KL 散度:它是衡量两个概率分布"距离"的工具,交叉熵和它只差一个常数。
上一篇我们推导了 MLE——最大似然估计统一了分类任务的交叉熵损失和回归任务的 MSE 损失。但交叉熵本身来自哪里?为什么叫"交叉"熵?"熵"又是什么?这一篇从信息论的角度重新理解训练损失,把熵、交叉熵、KL 散度这三个概念的关系讲清...
前三篇我们把概率基础、条件概率与贝叶斯定理、常见概率分布都讲透了。现在有一个自然的问题:分布的参数是怎么从数据里估计出来的?
前两篇我们把概率基础(随机变量、期望、方差)和条件概率与贝叶斯定理讲透了。这一篇聚焦具体的概率分布——它们是深度学习里对数据建模的"语言",选择什么分布意味着对数据结构做了什么假设。我们从最直觉的角度讲透每个分布,然后联系到 Deep...
上一篇我们把概率基础打好了——随机变量、期望、方差、五种常见分布。这一篇深入一个更核心的概念:条件概率。语言模型的每一次预测,本质上就是在计算条件概率;贝叶斯定理告诉我们如何从已有证据出发更新信念。搞懂这两个概念,你就能真正理解语言模...
前十篇我们把基础数学工具(符号、对数、函数、导数、链式法则)和线性代数(向量、矩阵、点积、高维空间、低秩分解)都打好了底。
上一篇我们搞清楚了高维空间的直觉——token 嵌入向量为什么需要 7168 维,以及高维空间的四个反直觉现象。最后我们提到了一个关键观察:7168 维的向量,其实际信息量远小于 7168 维,真正的语义结构分布在一个低维子空间里。
前八篇我们把基础数学工具打好了——符号系统、对数、函数、导数、链式法则,以及线性代数的向量、矩阵运算、点积与注意力机制。
前两篇我们把向量和矩阵的基础打好了。这一篇聚焦在一个操作上:点积。它看起来简单,就是对应元素相乘再相加,但它是整个注意力机制的心脏。这篇文章会把点积的几何意义、数学性质、工程考量和在 DeepSeek V3 里的具体形态全部讲透,字数...
上一篇我们把向量讲透了——它是深度学习里特征的基本表示单位,点积是衡量相似度的核心工具。这一篇我们来讲矩阵。矩阵是神经网络的"变换引擎",全连接层、注意力机制、MoE 路由,骨子里全是矩阵乘法。
前五篇我们把基础数学工具(符号、对数、函数、导数、链式法则)打好了底。从这篇开始进入第二阶段:线性代数。很多人觉得线性代数枯燥,但在深度学习里,它就是神经网络运转的"物理引擎"——每一层的计算、注意力机制、词向量、特征表示,本质上全是...
上一篇我们把导数的直觉和梯度下降的基本思路讲清楚了。这一篇是第一阶段的收官之作,我们要完整推导反向传播算法——用一个真实的两层神经网络,从损失函数出发,一步一步把每个参数的梯度算出来。这是深度学习里最重要的数学推导之一,搞懂它,你对神...
前三篇我们搞定了符号系统、指数对数、以及函数的本质。这一篇我们来讲导数——它是整个深度学习优化过程的数学基础。没有导数,就没有梯度下降,就没有神经网络的训练,就没有 DeepSeek。
前两篇我们搞定了符号语言和指数对数。这一篇我们来讲函数——这个概念你从初中就开始学,但神经网络对"函数"的理解方式,和教科书里的完全不是一回事。把这一层想清楚,你对神经网络结构的理解会有一次质的飞跃。
上一篇我们把论文里的符号语言扫了一遍,认识了 Σ、argmax、∝ 这些"字母"。这一篇我们来讲指数和对数,这是贯穿整个深度学习的数学工具——从损失函数到注意力机制,从概率模型到信息熵,几乎到处都有它们的身影。
本篇目标:理解 MDP 的完整数学定义,搞清楚"马尔可夫性"的直觉含义,以及状态转移、奖励函数、折扣因子、策略这些概念在数学上是怎么表达的。不会只堆公式,每个概念都会给你一个能抓得住的直觉。
假设你现在在玩《超级马里奥》,第一次上手,你完全不知道怎么操作。 你按了一下右键,马里奥往右走了——好像没什么问题。你又按了跳跃,马里奥跳过了一个坑——不错。然后你一头撞上了一个蘑菇怪,扣血了。你心里记住了:遇到蘑菇怪要跳过去。...
算法面试本质是**模式识别**——遇到题目,快速匹配已知解题模板,再加以变通。盲目刷题不如系统训练题型。
我第一次打开一篇深度学习论文的时候,不是被里面的思想吓到的,而是被那些符号吓跑的。 满屏的 Σ、∈、argmax、∝,还有各种上下标叠在一起,看起来像是某种外星语言。但其实,这些符号背后的逻辑并不难,它们本质上只是一种"简写系统...
把之前构建的 LangChain 应用推上生产环境。覆盖流式响应的端到端实现、LangServe 一键部署 LCEL 链、LangSmith 生产级监控调试、Token 成本管控、缓存策略,以及 FastAPI + Docker + ...
理解 LangGraph 解决了什么问题,掌握图(Graph)、节点(Node)、边(Edge)、状态(State)四个核心概念,能够用 LangGraph 构建带条件分支、循环推理和人工干预的复杂智能体。
从零开始掌握 RAG(检索增强生成)的完整技术链路。理解为什么需要 RAG、每个环节的设计选择背后的原理,能够独立构建一个生产可用的本地文档问答系统,并了解常见的检索质量优化手段。
从"手动控制工具调用循环"升级到"让模型自主决策"。深入理解 LangChain Agent 的架构设计、两种主流 Agent 类型的选型逻辑、AgentExecutor 的核心参数与行为控制,以及如何调试和优化 Agent 的执行过程。
彻底掌握 LangChain 的工具调用体系。从"工具是什么"到"手动实现完整的工具调用循环",覆盖工具定义的所有方式、如何把工具绑定给模型、Function Call 的底层机制、工具执行的错误处理,以及在不使用 Agent 的情况...
彻底解决多轮对话的上下文管理问题。从"为什么大模型没有记忆"到"生产级多用户会话管理",覆盖 LangChain 1.0 的官方 Memory 方案、多种存储后端、消息裁剪策略,以及跨会话持久化的完整实现。
系统掌握 LangChain 的输出解析体系。从"模型只会返回字符串"到"模型输出直接变成可用的 Python 对象",覆盖所有内置 Parser 的原理与用法、解析失败的处理策略、自定义 Parser 的实现,以及在实际项目中的选型决策。
深透理解 LCEL(LangChain Expression Language)的设计哲学和底层机制,掌握 Runnable 接口体系、所有核心组合原语的使用方式,能够构建从简单到复杂的各类处理链,并学会调试、测试和错误处理。
深入掌握 LangChain 的模型接口层,学会四种调用方式、结构化输出、多模型切换,以及在生产环境中的常用配置技巧
彻底解决提示词的工程化管理问题。从"散落在代码各处的 f-string",升级到"可复用、可组合、可测试的提示词模块"。内容覆盖 PromptTemplate 的所有核心用法、消息体系、Few-shot 构建、多轮对话上下文注入,以及...
系列定位:本系列面向已经熟悉大模型 API 调用、做过智能体开发的工程师,帮助你快速理解 LangChain 1.0 的核心价值,并平滑迁移到这套生态。 本篇目标:建立对 LangChain 的整体认知,搞清楚它解决了什么问题、1....
第1篇:从零开始——读懂论文里那些让人头疼的数学符号 系列简介:这个系列的终极目标是帮你看懂 DeepSeek V3 和 R1 的论文。我们不会一上来就冲进复杂的公式,而是从最基础的数学语言开始,一步一步把底层的砖头垒好。第一篇...
快速查阅手册 下面整理一个符号速查表,后面看论文时可以随时翻: 符号 名称 含义 例子 $\sum$ Sigma 求和 $\sum_{i=1}^n x_i$ $\prod$ Pi 求积 $\prod_{i=1}^n ...
这个系列的终极目标是帮你看懂 DeepSeek V3 和 R1 的论文。我们不会一上来就冲进复杂的公式,而是从最基础的数学语言开始,一步一步把底层的砖头垒好。第一篇,我们先来搞定那些拦在门口的"符号怪兽"。
2025 阅读清单 今年计划阅读的书籍: 技术类 《流畅的 Python》 《设计模式》 《代码整洁之道》 非技术类 《思考,快与慢》 《人类简史》 《原则》 读书是最好的投资。 希望今年能坚持下来!
Django 入门 Django 是 Python 最流行的 Web 框架之一。 安装 pip install django django-admin startproject myproject cd myproject pytho...
欢迎! 这是我的个人博客,使用 Django 搭建。 功能特性 ✅ Markdown 写作 ✅ 嵌套评论系统 ✅ 用户注册登录 ✅ 文章分类和标签 ✅ 点赞功能 ✅ 搜索功能 代码示例 def hello(): print...