通常大家把最终模型视作对输入数据的函数,目的是优化函数输出。但在训练阶段,大家把待定模型看作是队其各参数的函数,根据已知的采样点来确定参数。
因此最简单粗暴的想法就是寻找该模型对各参数的偏导数的零点。这就是梯度下降的目标,也是为什么大家喜欢用卷积网络和sigmoid这类函数的原因:导数太tm好求啊。
首页 >
通常大家把最终模型视作对输入数据的函数,目的是优化函数输出。但在训练阶段,大家把待定模型看作是队其各参数的函数,根据已知的采样点来确定参数。
因此最简单粗暴的想法就是寻找该模型对各参数的偏导数的零点。这就是梯度下降的目标,也是为什么大家喜欢用卷积网络和sigmoid这类函数的原因:导数太tm好求啊。