在 ML 中,梯度下降: w_(n+1) = w_n - alpha \nabla f 。 alpha < 2/L ( Lipschitz 常数)时收敛。