在学习PyTorch
框架下的自动求导(autograd
)功能,首先要对矩阵求导有一个了解
矩阵求导的本质
这位答主写的非常到位了,直接贴文章链接:矩阵求导的本质与分子布局、分母布局的本质,以及矩阵求导公式的数学推导
以下仅仅是记一下结论:
一、向量变元的实值标量函数
f(xxx),xxx=[x1,x2,⋯,xn]T
1. 四个法则
1.1 常数求导
∂xxx∂c=000n×1
1.2 线性法则
∂xxx∂[c1f(xxx)+c2g(xxx)]=c1∂xxx∂f(xxx)+c2∂xxx∂g(xxx)
1.3 乘积法则
∂xxx∂[f(xxx)g(xxx)]=∂xxx∂f(xxx)g(xxx)+f(xxx)∂xxx∂g(xxx)
1.4 商法则
∂xxx∂[g(xxx)f(xxx)]=g2(xxx)1[∂xxx∂f(xxx)g(xxx)−f(xxx)∂xxx∂g(xxx)]