我的博客

前三篇我们把概率基础、条件概率与贝叶斯定理、常见概率分布都讲透了。现在有一个自然的问题：分布的参数是怎么从数据里估计出来的？

admin AI算法数学入门 2026-03-06 7 0 38 分钟

AI 数学

前两篇我们把概率基础（随机变量、期望、方差）和条件概率与贝叶斯定理讲透了。这一篇聚焦具体的概率分布——它们是深度学习里对数据建模的"语言"，选择什么分布意味着对数据结构做了什么假设。我们从最直觉的角度讲透每个分布，然后联系到 DeepSeek V3/R1 里的具体用途。

admin AI算法数学入门 2026-03-06 6 0 41 分钟

AI 数学

【AI数学入门】第12篇：条件概率与贝叶斯定理——AI 推理的核心思想

上一篇我们把概率基础打好了——随机变量、期望、方差、五种常见分布。这一篇深入一个更核心的概念：条件概率。语言模型的每一次预测，本质上就是在计算条件概率；贝叶斯定理告诉我们如何从已有证据出发更新信念。搞懂这两个概念，你就能真正理解语言模型在做什么，以及 DeepSeek R1 的训练为什么要用强...

admin AI算法数学入门 2026-03-06 6 1 37 分钟

AI 数学

【AI数学入门】第11篇：概率基础——随机变量、分布与期望

前十篇我们把基础数学工具（符号、对数、函数、导数、链式法则）和线性代数（向量、矩阵、点积、高维空间、低秩分解）都打好了底。

admin AI算法数学入门 2026-03-06 6 0 36 分钟

AI 数学

【AI数学入门】第10篇：低秩分解（Low-Rank）——DeepSeek 用它压缩了什么？

上一篇我们搞清楚了高维空间的直觉——token 嵌入向量为什么需要 7168 维，以及高维空间的四个反直觉现象。最后我们提到了一个关键观察：7168 维的向量，其实际信息量远小于 7168 维，真正的语义结构分布在一个低维子空间里。

admin AI算法数学入门 2026-03-06 4 0 37 分钟

AI 数学

【AI数学入门】第9篇：高维空间的直觉——为什么嵌入向量有 7168 维？

前八篇我们把基础数学工具打好了——符号系统、对数、函数、导数、链式法则，以及线性代数的向量、矩阵运算、点积与注意力机制。