Comment lire la matrice de confusion des classificateurs dans WEKA
Désolé, je suis nouveau à WEKA et je viens d'apprendre.
dans mon arbre de décision (J48) sortie de classificateur, il y a une matrice de confusion:
a b <----- classified as
130 8 a = functional
15 150 b = non-functional
- Comment puis-je lire cette matrice? Quelle est la différence entre a et b?
- Aussi, quelqu'un peut-il m'expliquer ce que les valeurs de domaine?
2 réponses
je l'avais mis de cette façon:
La matrice de confusion est Weka établissement de rapports sur la façon dont cette bonne J48 modèle est en fonction de ce qu'il obtient le droit, et ce à quoi il se trompe.
Dans vos données, la variable cible était "fonctionnelle" ou "non-fonctionnel"; le côté droit de la matrice vous dit que la colonne "a" est fonctionnelle, et "b" est non-fonctionnelle.
les colonnes vous disent comment votre modèle a classé vos échantillons - c'est ce que le modèle prédite:
- la première colonne contient tous les échantillons que votre modèle pense être " a " - 145 d'entre eux, total
- la deuxième colonne contient tous les échantillons dont votre modèle pense qu'ils sont "b" - 158 d'entre eux
Les lignes, d'autre part, de représenter la réalité:
- La première ligne contient tous les échantillons qui sont vraiment "un" - 138, total
- La deuxième ligne contient tous les échantillons qui sont vraiment "b" - 165 d'entre eux
connaissant les colonnes et les lignes, vous pouvez creuser dans les détails:
- en haut à gauche, 130, y a-t-il des choses que votre modèle pense être "a" qui sont vraiment "un" <- ces étaient correctes
- en bas à gauche, 15, y a-t-il des choses que votre modèle pense être "a" mais qui sont vraiment "b" <- un type de l'erreur
- en haut à droite, 8, y a-t-il des choses que votre modèle pense être "b" mais qui sont vraiment "a" <- un autre type d'erreur
- en bas à droite, 150 sont les choses que votre modèle pense sont "b" sont vraiment "b"
donc, en haut à gauche et en bas à droite de la matrice montrent des choses que votre modèle obtient droit.
en Bas à gauche et en haut à droite de la matrice sont de montrer où votre modèle est confus.