Différence entre les algorithmes D'extraction séquentielle en circuit fermé et en circuit ouvert

je veux utiliser des algorithmes pour extraire mes données.

j'ai trouvé un modèle d'exploration de cadre sur: http://www.philippe-fournier-viger.com/spmf/index.php?link=algorithms.php

j'ai essayé plusieurs algorithmes, L'algorithme BIDE+ exécute le mieux.

l'algorithme de BIDE+ est pour l'extraction des motifs séquentiels fermés fréquents à partir d'une base de données de séquence.

quelqu'un Peut m'expliquer la définition de "fermé" motifs séquentiels et ceux qui sont en cours?

25
demandé sur Cœur 2013-04-22 14:57:14
la source

3 ответов

Heureux que vous êtes à l'aide de mon logiciel SPMF.

assistance d'un modèle séquentiel est le nombre de séquences qui contient le modèle séquentiel.

motif séquentiel fréquent est un motif qui apparaît au moins dans les séquences" minsup " d'une base de données séquentielle, où minsup est un paramètre défini par l'utilisateur.

fréquent circuit séquentiel fermé est un motif séquentiel fréquent tel qu'il n'est pas inclus dans un autre motif séquentiel ayant exactement le même support.

Algorithmes PrefixSpan trouve des motifs séquentiels fréquents. Des algorithmes tels que BIDE + trouve des patrons séquentiels fermés fréquents. BIDE+ est généralement beaucoup plus rapide que le Préfixspan car il utilise des techniques de taille pour éviter de générer tous les motifs séquentiels. En outre, l'ensemble de modèles est généralement beaucoup plus petit que L'ensemble des modèles séquentiels donc BIDE+ est également plus efficace de mémoire.

une autre chose importante à savoir est que les modèles séquentiels fermés sont une représentation compacte et sans perte de tous les modèles séquentiels. Cela signifie que l'ensemble des motifs séquentiels fermés est généralement beaucoup plus petit, mais il est sans perte, ce qui signifie qu'il permet de récupérer l'ensemble des motifs séquentiels (aucune information n'est perdue), ce qui est très pratique.

je peux vous donner un simple exemple.

considérons 4 séquences:

a  b  c  d  e
a  b  d
b  e  a  
b  c  d  e

supposons que minsup = 2.

b c est un motif séquentiel fréquent car il apparaît en deux séquences (il a un support de 2). b c n'est pas un motif séquentiel fermé parce qu'il est contenu dans un motif séquentiel plus grand b c d avoir le même soutien.

b c d a un support de 2. Il ne s'agit pas non plus d'un modèle séquentiel fermé parce qu'il est contenu dans un plus grand le modèle séquentiel b c d e avoir le même soutien. b c d e est un motif séquentiel fermé parce qu'il n'est pas inclus dans un autre motif séquentiel ayant le même support.

au fait, vous pouvez aussi vérifier mon sondage sur le modèle séquentiel d'exploration. Il donne une bonne introduction sur ce sujet et les différents algorithmes.

42
répondu Phil 2017-10-25 10:36:07
la source
2
répondu babalu 2013-04-25 22:42:34
la source

utilisez Google pour"articles fréquents fermés". Il y aura beaucoup de pages expliquant cela, comme le fera n'importe quel livre d'exploration de données (Rechercher l'algorithme D'APRIORI).

"Fermé", dit qu'il n'y a pas de plus grand jeu d'éléments assistance. Il peut y avoir des itemsets plus grands, mais ils doivent avoir moins de soutien.

dans la plupart des cas, il suffit d'examiner les items maximaux ou fermés seulement.

1
répondu Anony-Mousse 2013-04-23 11:59:42
la source