符号

符号是语言的一部分,因此统一符号有助于顺畅高效、无歧义的交流。不少同一个事物在不同的地方使用了不同的符号,这里对应用数学时(对于纯数学内容由于符号过多暂不统一)所用到的常用数学符号进行统一,今后网站将尽量使用本页面的符号体系。

a 标量
\boldsymbol{a}向量
A矩阵
\mathsf{A}张量
I, I_nn维)单位矩阵
\boldsymbol{a}_{-i} 向量\boldsymbol a除第i个元素的所有元素
\boldsymbol A_{i,:}, \boldsymbol A_{:,i}矩阵A的第i行,矩阵A的第i
A^\mathsf{T}矩阵A的转置
A^\mathsf{V}, \operatorname{Vec}(A)矩阵A的拉直向量,A列向量依次拼接所成
\det{A}矩阵A的行列式
\boldsymbol{f}^\prime(\boldsymbol x), \dfrac{\partial\boldsymbol f}{\partial\boldsymbol x}映射\boldsymbol f:\mathbb R^n\to\mathbb R^m的Jacobi矩阵J\in\mathbb R^{m\times n}
\nabla_x y y关于x的梯度,当y为函数时,维度和x相同,当y为从\mathbb R^n映到\mathbb R^m的映射时,维度为n\times m

有时需要作更细致的区分时,用直立体代表随机变量,用斜体代表非随机变量,如下。(一般为方便考虑,少用这种设定;此外,同一个场合一个变量有时看作是随机变量有时看作是非随机变量,依情况而定)常见的例子如,\mathbb E_{\mathrm x\sim N(0,1)}[\mathrm x]=0

\mathrm{a}标量随机变量
\mathbf{a}向量随机变量
\mathrm{A}矩阵随机变量

概率论与信息论相关

\mathrm a\perp \mathrm b \mathrm a,\mathrm b 独立
\mathrm a{\perp} \mathrm b\mid \mathrm c \mathrm a,\mathrm b 在给定\mathrm c下条件独立
P(a)离散随机变量的概率质量函数
p(a)随机变量\mathrm a的概率分布
\mathbb P, \mathbb E概率,期望
\operatorname{Cov}, \operatorname{Var}协方差,方差
H(\mathrm{x}) 随机变量\mathrm x的香农熵
D_\mathrm{KL}(P\| Q)分布PQ的KL散度

其它符号

A\odot B矩阵AB的逐元素乘积(Hadamard乘积)
A\otimes B矩阵AB的Kronecker乘积
A^+矩阵A的Moore-Penrose广义逆
x^+ x 的正数部分,即\max(0,x)
\|\boldsymbol x\|, \|\boldsymbol x\|_p向量\boldsymbol x的范数
\mathbb I(\mathrm{condition})条件为真则为1,否则为0
\mathcal{D}数据集
\mathcal{N}正态分布