Ne peut pas comprendre la fonction de coût pour la régression linéaire

je ne comprends vraiment pas l'équation suivante, en particulier 1/(2m).

Quel est le but de cette équation? Et d'où vient 1/(2m) vient?

J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2

Veuillez expliquer. Comment ça en jette???

25
demandé sur saurabh agarwal 2014-01-13 23:05:26
la source

2 ответов

La fonction de coût est

J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2

Par h_theta(x^i) nous indiquons les sorties du modèle pour x^i, donc h_theta(x^i) - y^i c'est son erreur (en supposant que y^i est une sortie correcte).

Maintenant, nous calculons le carré de cette erreur [ h_theta(x^i) - y^i ]^2 (ce qui supprime le signe, car cette erreur pourrait être à la fois positive et négative) et la somme sur tous les échantillons, et pour la lier d'une façon ou d'une autre nous la normalisons - simplement en divisant par m, nous avons donc moyenne (parce que nous diviser par nombre d'échantillons) au carré (parce que nous le carré) erreur (parce que nous calculer une erreur):

1/m * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2

2 qui apparaît dans l'avant est utilisé uniquement pour la simplification de la dérivée, parce que lorsque vous tenterez de le minimiser, vous utiliserez la méthode de descente la plus raide, qui est basée sur la dérivée de cette fonction. Dérivé de a^22a, et notre fonction est un carré de quelque chose, alors ce 2 s'annuler. C'est la seule raison de son existence.

77
répondu lejlot 2016-05-10 02:06:28
la source

vous voulez construire un modèle qui répartira uniformément les erreurs entre vos points de données, donc la somme des erreurs=0 et la moyenne des erreurs=0; Vous devriez aussi construire le modèle qui a les plus petites erreurs, ce qui équivaut à minimiser l'erreur quadratique moyenne.

0
répondu user9789322 2018-05-14 18:46:40
la source

Autres questions sur