Quelles sont les différences entre Pandas et NumPy+SciPy en Python? [fermé]

ils semblent tous les deux excessivement similaires et je suis curieux de savoir quel paquet serait plus bénéfique pour l'analyse des données financières.

161
demandé sur piRSquared 2012-06-18 08:45:48

3 réponses

en effet, pandas fournit des outils de manipulation de données de haut niveau construits sur le dessus de NumPy. Num Py est en soi un outil de niveau assez bas, et sera très similaire à L'utilisation de MATLAB. pandas d'autre part fournit des fonctionnalités riches de séries chronologiques, l'alignement des données, NA-friendly statistiques, groupby, fusionner et méthodes de jointure, et beaucoup d'autres commodités. Il est devenu très populaire ces dernières années dans les applications financières. Je vais avoir un chapitre consacré à l'analyse des données financières en utilisant pandas dans mon prochain livre.

249
répondu Wes McKinney 2012-06-18 19:32:13

Numpy est requis par pandas (et par pratiquement tous les outils numériques pour Python). Scipy n'est pas strictement nécessaire pour pandas mais est répertorié comme une "dépendance optionnelle". Je ne dirais pas que les pandas sont une alternative à la Numpy et/ou Scipy. Plutôt, c'est un outil supplémentaire qui fournit une façon plus rationalisée de travailler avec des données numériques et tabulaires en Python. Vous pouvez utiliser les structures de données de pandas mais puiser librement sur les fonctions de Numpy et Scipy pour les manipuler.

50
répondu BrenBarn 2012-06-18 04:51:10

Pandas offrent un excellent moyen de manipuler les tables, comme vous pouvez rendre binning facile ( binning une base de données dans pandas en Python ) et de calculer des statistiques. Une autre chose qui est grande dans pandas est la classe de panneau que vous pouvez joindre la série de couches avec des propriétés différentes et le combiner en utilisant la fonction groupby.

3
répondu Iury Sousa 2017-05-23 12:02:48