ODE解的反向传播训练连续深度的网络的主要技术难点是计算ODE解的反向

点击下载：中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）Neural Ordinary Differential Equations

正在加载图片...

ODE解的反向传播训练连续深度的网络的主要技术难，点是计算ODE解的反向转播。直接按照前向传播的计算路径反向传播是一个很直观的想法，但是会带来较高的存储成本并引入额外的数值误差。论文采取了使用伴随方法(adjoint method)[Pontryagin et al.,1962)】计算梯度的策略。该方法通过时间上反向求解另一个增广ODE来逼近计算梯度。之后的梯度即可进一步用于参数的更新该方法的代价与问题规模成线性关系，内存消耗较低，并能够控制数值误差。ODE解的反向传播训练连续深度的网络的主要技术难点是计算ODE解的反向转播。直接按照前向传播的计算路径反向传播是一个很直观的想法，但是会带来较高的存储成本并引入额外的数值误差。论文采取了使用伴随方法 (adjoint method)[(Pontryagin et al., 1962)]计算梯度的策略。该方法通过时间上反向求解另一个增广ODE来逼近计算梯度。之后的梯度即可进一步用于参数的更新该方法的代价与问题规模成线性关系，内存消耗较低，并能够控制数值误差

<<向上翻页向下翻页>>

点击下载：中国科学技术大学：《信息检索与数据挖掘》课程教学资源（研讨汇报）Neural Ordinary Differential Equations