管理员

@admin

博客管理员

2026年02月 加入
发布的文章 (40)
【AI数学入门】第20篇:正则化与负载均衡——L1、L2 与 DeepSeek MoE 的 Expert 均衡损失

前三篇(第17-19篇)把梯度下降、SGD/Mini-batch、Adam 优化器讲透了。AdamW 里的权重衰减(L2 正则化)反复出现,但一直没有正面讲清楚它的数学原理。这一篇补全这块拼图——从正则化的根本动机讲起,推导 L1 和...

2026-03-06 22 0
【AI数学入门】第19篇:Adam 优化器——DeepSeek 训练用的是什么?它的数学原理

第17篇讲了梯度下降的几何原理,第18篇讲了 SGD 的统计性质和 mini-batch 的噪声正则化效果。两篇都暗含一个缺陷:所有参数用同一个学习率。但神经网络里不同参数的梯度量级可以相差几个数量级——嵌入层参数的梯度极小,某些全连...

2026-03-06 14 0
【AI数学入门】第18篇:随机梯度下降与 Mini-batch——为什么不用全量数据?

上一篇我们推导了梯度下降的数学原理——负梯度是损失下降最快的方向,学习率控制步长,学习率太大振荡、太小收敛慢。

2026-03-06 12 0
【AI数学入门】第17篇:梯度下降——沿着坡走到最低点

前六篇(第11-16篇)把概率与信息论打透了——随机变量、贝叶斯定理、MLE、交叉熵、KL散度。

2026-03-06 10 0
【AI数学入门】第16篇:KL散度——DeepSeek R1 强化学习中的约束项从何而来?

上一篇我们讲透了信息熵和交叉熵——熵衡量不确定性,交叉熵衡量"用错分布的代价",最小化交叉熵就是让模型分布靠近真实分布。这一篇深入KL 散度:它是衡量两个概率分布"距离"的工具,交叉熵和它只差一个常数。

2026-03-06 13 0
【AI数学入门】第15篇:信息熵与交叉熵——语言模型损失函数的数学根源

上一篇我们推导了 MLE——最大似然估计统一了分类任务的交叉熵损失和回归任务的 MSE 损失。但交叉熵本身来自哪里?为什么叫"交叉"熵?"熵"又是什么?这一篇从信息论的角度重新理解训练损失,把熵、交叉熵、KL 散度这三个概念的关系讲清...

2026-03-06 15 0
【AI数学入门】第14篇:最大似然估计(MLE)——模型是怎么"学"出来的?

前三篇我们把概率基础、条件概率与贝叶斯定理、常见概率分布都讲透了。现在有一个自然的问题:分布的参数是怎么从数据里估计出来的?

2026-03-06 7 0
【AI数学入门】第13篇:常见概率分布——正态、均匀、伯努利分布的直觉

前两篇我们把概率基础(随机变量、期望、方差)和条件概率与贝叶斯定理讲透了。这一篇聚焦具体的概率分布——它们是深度学习里对数据建模的"语言",选择什么分布意味着对数据结构做了什么假设。我们从最直觉的角度讲透每个分布,然后联系到 Deep...

2026-03-06 6 0
【AI数学入门】第12篇:条件概率与贝叶斯定理——AI 推理的核心思想

上一篇我们把概率基础打好了——随机变量、期望、方差、五种常见分布。这一篇深入一个更核心的概念:条件概率。语言模型的每一次预测,本质上就是在计算条件概率;贝叶斯定理告诉我们如何从已有证据出发更新信念。搞懂这两个概念,你就能真正理解语言模...

2026-03-06 6 1
【AI数学入门】第11篇:概率基础——随机变量、分布与期望

前十篇我们把基础数学工具(符号、对数、函数、导数、链式法则)和线性代数(向量、矩阵、点积、高维空间、低秩分解)都打好了底。

2026-03-06 6 0
【AI数学入门】第10篇:低秩分解(Low-Rank)——DeepSeek 用它压缩了什么?

上一篇我们搞清楚了高维空间的直觉——token 嵌入向量为什么需要 7168 维,以及高维空间的四个反直觉现象。最后我们提到了一个关键观察:7168 维的向量,其实际信息量远小于 7168 维,真正的语义结构分布在一个低维子空间里。

2026-03-06 4 0
【AI数学入门】第9篇:高维空间的直觉——为什么嵌入向量有 7168 维?

前八篇我们把基础数学工具打好了——符号系统、对数、函数、导数、链式法则,以及线性代数的向量、矩阵运算、点积与注意力机制。

2026-03-06 5 0
【AI数学入门】第8篇:点积与相似度——注意力机制的核心操作

前两篇我们把向量和矩阵的基础打好了。这一篇聚焦在一个操作上:点积。它看起来简单,就是对应元素相乘再相加,但它是整个注意力机制的心脏。这篇文章会把点积的几何意义、数学性质、工程考量和在 DeepSeek V3 里的具体形态全部讲透,字数...

2026-03-06 5 0
【AI数学入门】第7篇:矩阵运算——乘法、转置与神经网络的全连接层

上一篇我们把向量讲透了——它是深度学习里特征的基本表示单位,点积是衡量相似度的核心工具。这一篇我们来讲矩阵。矩阵是神经网络的"变换引擎",全连接层、注意力机制、MoE 路由,骨子里全是矩阵乘法。

2026-03-06 3 0
【AI数学入门】第6篇:向量是什么——从箭头到特征表示

前五篇我们把基础数学工具(符号、对数、函数、导数、链式法则)打好了底。从这篇开始进入第二阶段:线性代数。很多人觉得线性代数枯燥,但在深度学习里,它就是神经网络运转的"物理引擎"——每一层的计算、注意力机制、词向量、特征表示,本质上全是...

2026-03-06 4 0
【AI数学入门】第5篇:偏导数与链式法则——反向传播的数学基石

上一篇我们把导数的直觉和梯度下降的基本思路讲清楚了。这一篇是第一阶段的收官之作,我们要完整推导反向传播算法——用一个真实的两层神经网络,从损失函数出发,一步一步把每个参数的梯度算出来。这是深度学习里最重要的数学推导之一,搞懂它,你对神...

2026-03-06 4 0
【AI数学入门】第4篇:导数入门——变化率与梯度下降的直觉理解

前三篇我们搞定了符号系统、指数对数、以及函数的本质。这一篇我们来讲导数——它是整个深度学习优化过程的数学基础。没有导数,就没有梯度下降,就没有神经网络的训练,就没有 DeepSeek。

2026-03-06 3 0
【AI数学入门】第3篇:函数与映射——从 f(x) 到神经网络的本质

前两篇我们搞定了符号语言和指数对数。这一篇我们来讲函数——这个概念你从初中就开始学,但神经网络对"函数"的理解方式,和教科书里的完全不是一回事。把这一层想清楚,你对神经网络结构的理解会有一次质的飞跃。

2026-03-06 3 0
【AI数学入门】第2篇:指数与对数——为什么深度学习这么爱用 log?

上一篇我们把论文里的符号语言扫了一遍,认识了 Σ、argmax、∝ 这些"字母"。这一篇我们来讲指数和对数,这是贯穿整个深度学习的数学工具——从损失函数到注意力机制,从概率模型到信息熵,几乎到处都有它们的身影。

2026-03-06 3 0
【强化学习入门系列】 第2篇:马尔可夫决策过程(MDP)——强化学习的数学语言

本篇目标:理解 MDP 的完整数学定义,搞清楚"马尔可夫性"的直觉含义,以及状态转移、奖励函数、折扣因子、策略这些概念在数学上是怎么表达的。不会只堆公式,每个概念都会给你一个能抓得住的直觉。

2026-03-04 6 0
【强化学习入门系列】第1篇:什么是强化学习?从游戏说起

假设你现在在玩《超级马里奥》,第一次上手,你完全不知道怎么操作。 你按了一下右键,马里奥往右走了——好像没什么问题。你又按了跳跃,马里奥跳过了一个坑——不错。然后你一头撞上了一个蘑菇怪,扣血了。你心里记住了:遇到蘑菇怪要跳过去。...

2026-03-04 7 0
算法面试两周系统冲刺训练计划

算法面试本质是**模式识别**——遇到题目,快速匹配已知解题模板,再加以变通。盲目刷题不如系统训练题型。

2026-03-04 6 0
【AI数学入门】第1篇:从零开始——读懂论文里那些让人头疼的数学符号

我第一次打开一篇深度学习论文的时候,不是被里面的思想吓到的,而是被那些符号吓跑的。 满屏的 Σ、∈、argmax、∝,还有各种上下标叠在一起,看起来像是某种外星语言。但其实,这些符号背后的逻辑并不难,它们本质上只是一种"简写系统...

2026-03-03 6 0
【LangChain 1.0系列第十一篇】《生产化部署——LangServe + LangSmith 监控调试》

把之前构建的 LangChain 应用推上生产环境。覆盖流式响应的端到端实现、LangServe 一键部署 LCEL 链、LangSmith 生产级监控调试、Token 成本管控、缓存策略,以及 FastAPI + Docker + ...

2026-03-03 9 0
【LangChain 1.0系列第十篇】 LangGraph 初探——构建复杂的有状态智能体

理解 LangGraph 解决了什么问题,掌握图(Graph)、节点(Node)、边(Edge)、状态(State)四个核心概念,能够用 LangGraph 构建带条件分支、循环推理和人工干预的复杂智能体。

2026-03-03 8 0
【LangChain 1.0系列第九篇】RAG 入门——给模型接上你的私有知识库

从零开始掌握 RAG(检索增强生成)的完整技术链路。理解为什么需要 RAG、每个环节的设计选择背后的原理,能够独立构建一个生产可用的本地文档问答系统,并了解常见的检索质量优化手段。

2026-03-02 12 0
【LangChain 1.0系列第八篇】Agent 开发——让模型自主决策调用工具

从"手动控制工具调用循环"升级到"让模型自主决策"。深入理解 LangChain Agent 的架构设计、两种主流 Agent 类型的选型逻辑、AgentExecutor 的核心参数与行为控制,以及如何调试和优化 Agent 的执行过程。

2026-03-02 8 0
【LangChain 1.0系列第七篇】工具调用——Tool 的定义、注册与执行

彻底掌握 LangChain 的工具调用体系。从"工具是什么"到"手动实现完整的工具调用循环",覆盖工具定义的所有方式、如何把工具绑定给模型、Function Call 的底层机制、工具执行的错误处理,以及在不使用 Agent 的情况...

2026-03-02 10 0
【LangChain 1.0系列第六篇】记忆模块——给对话加上上下文管理

彻底解决多轮对话的上下文管理问题。从"为什么大模型没有记忆"到"生产级多用户会话管理",覆盖 LangChain 1.0 的官方 Memory 方案、多种存储后端、消息裁剪策略,以及跨会话持久化的完整实现。

2026-03-02 4 0
【LangChain 1.0系列第五篇】OutputParser——让模型输出变成可用的数据

系统掌握 LangChain 的输出解析体系。从"模型只会返回字符串"到"模型输出直接变成可用的 Python 对象",覆盖所有内置 Parser 的原理与用法、解析失败的处理策略、自定义 Parser 的实现,以及在实际项目中的选型决策。

2026-03-02 5 0
【LangChain 1.0】系列第四篇:LCEL——LangChain 的核心设计思想

深透理解 LCEL(LangChain Expression Language)的设计哲学和底层机制,掌握 Runnable 接口体系、所有核心组合原语的使用方式,能够构建从简单到复杂的各类处理链,并学会调试、测试和错误处理。

2026-03-02 7 0
【LangChain 1.0】系列第二篇:统一模型接口——ChatModel 与 LLM 的使用

深入掌握 LangChain 的模型接口层,学会四种调用方式、结构化输出、多模型切换,以及在生产环境中的常用配置技巧

2026-03-02 12 1
【LangChain 1.0】系列第三篇:提示词工程的工程化——PromptTemplate 详解

彻底解决提示词的工程化管理问题。从"散落在代码各处的 f-string",升级到"可复用、可组合、可测试的提示词模块"。内容覆盖 PromptTemplate 的所有核心用法、消息体系、Few-shot 构建、多轮对话上下文注入,以及...

2026-03-02 14 0
【LangChain 1.0】系列第一篇:告别手写 API 调用——LangChain 1.0 是什么,解决了什么问题

系列定位:本系列面向已经熟悉大模型 API 调用、做过智能体开发的工程师,帮助你快速理解 LangChain 1.0 的核心价值,并平滑迁移到这套生态。 本篇目标:建立对 LangChain 的整体认知,搞清楚它解决了什么问题、1....

2026-03-02 38 0
符号

第1篇:从零开始——读懂论文里那些让人头疼的数学符号 系列简介:这个系列的终极目标是帮你看懂 DeepSeek V3 和 R1 的论文。我们不会一上来就冲进复杂的公式,而是从最基础的数学语言开始,一步一步把底层的砖头垒好。第一篇...

2026-02-28 10 0
测试

快速查阅手册 下面整理一个符号速查表,后面看论文时可以随时翻: 符号 名称 含义 例子 $\sum$ Sigma 求和 $\sum_{i=1}^n x_i$ $\prod$ Pi 求积 $\prod_{i=1}^n ...

2026-02-28 6 0
前言:为什么符号是第一道坎?

这个系列的终极目标是帮你看懂 DeepSeek V3 和 R1 的论文。我们不会一上来就冲进复杂的公式,而是从最基础的数学语言开始,一步一步把底层的砖头垒好。第一篇,我们先来搞定那些拦在门口的"符号怪兽"。

2026-02-28 17 0
我的 2025 年阅读清单

2025 阅读清单 今年计划阅读的书籍: 技术类 《流畅的 Python》 《设计模式》 《代码整洁之道》 非技术类 《思考,快与慢》 《人类简史》 《原则》 读书是最好的投资。 希望今年能坚持下来!

2026-02-28 5 0
Python Django 入门教程

Django 入门 Django 是 Python 最流行的 Web 框架之一。 安装 pip install django django-admin startproject myproject cd myproject pytho...

2026-02-28 8 0
欢迎来到我的博客

欢迎! 这是我的个人博客,使用 Django 搭建。 功能特性 ✅ Markdown 写作 ✅ 嵌套评论系统 ✅ 用户注册登录 ✅ 文章分类和标签 ✅ 点赞功能 ✅ 搜索功能 代码示例 def hello(): print...

2026-02-28 46 0