提纲
Last updated
Was this helpful?
Last updated
Was this helpful?
下溢(underflow):当接近零的数被四舍五入为零时发生下溢。
上溢(overflow):当大量级的数被近似为$\infty$或 $-\infty$时发生上溢。
例子:
问题:softmax函数有上溢和下溢
解决方案:用$softmax(x-max_i x_i)$替代$softmax(x)$可以解决上溢问题和因分母下溢而导致被零除的可能性。
未解决:分子中的下溢仍可以导致整体表达式被计算为零,计算其log时会错误地得到$-\infty$。
解决方案:
条件数表征函数相对于输入的微小变化而变化的快慢程度。
参考资料:https://blog.csdn.net/u011584941/article/details/44625779
概念:
目标函数、损失函数
一维:导数、梯度下降、临界点(驻点)、局部极小点、局部极大点、鞍点、全局最小点
多维:偏导数、梯度、方向导数、最速下降法(梯度下降)、学习率
输入和输出都为向量的函数的所有偏导数组成的矩阵为Jacobian矩阵。
二阶导数组成的矩阵为Hessian矩阵。
Hessian矩阵等价于梯度的Jacobian矩阵。
二阶方向导数的公式:
参考:https://blog.csdn.net/tina_ttl/article/details/51202566
二阶导数测试
牛顿法
Lipschitz 连续
约束优化、可行点
KKT条件、广义Lagrange函数、等式约束、不等式约束、KKT乘子