感觉一个很有意思的问题,对于逻辑回归来说,在进行gradient descent时,是可以通过矩阵求导的方式来做的,但需要注意的是,假设h_theta_X - Y(比如100*1)是一个列向量,我们感兴趣的是sigmoid(h_theta_X-Y)(也是100*1)对X的倒数,所以这里会得到一个100*100的矩阵,但仅在对角线上有值,其他均为0。感觉一个很有意思的问题,对于逻辑回归来说,在进行gradient descent时,是可以通过
感觉一个很有意思的问题,对于逻辑回归来说,在进行gradient descent时,是可以通过矩阵求导的方式来做的,但需要注意的是,假设h_theta_X - Y(比如100*1)是一个列向量,我们感兴趣的是sigmoid(h_theta_X-Y)(也是100*1)对X的倒数,所以这里会得到一个100*100的矩阵,但仅在对角线上有值,其他均为0。感觉一个很有意思的问题,对于逻辑回归来说,在进行gradient descent时,是可以通过