Quelles sont les différences entre Pandas et NumPy+SciPy en Python? [fermé]
ils semblent tous les deux excessivement similaires et je suis curieux de savoir quel paquet serait plus bénéfique pour l'analyse des données financières.
3 réponses
en effet, pandas fournit des outils de manipulation de données de haut niveau construits sur le dessus de NumPy. Num Py est en soi un outil de niveau assez bas, et sera très similaire à L'utilisation de MATLAB. pandas d'autre part fournit des fonctionnalités riches de séries chronologiques, l'alignement des données, NA-friendly statistiques, groupby, fusionner et méthodes de jointure, et beaucoup d'autres commodités. Il est devenu très populaire ces dernières années dans les applications financières. Je vais avoir un chapitre consacré à l'analyse des données financières en utilisant pandas dans mon prochain livre.
Numpy est requis par pandas (et par pratiquement tous les outils numériques pour Python). Scipy n'est pas strictement nécessaire pour pandas mais est répertorié comme une "dépendance optionnelle". Je ne dirais pas que les pandas sont une alternative à la Numpy et/ou Scipy. Plutôt, c'est un outil supplémentaire qui fournit une façon plus rationalisée de travailler avec des données numériques et tabulaires en Python. Vous pouvez utiliser les structures de données de pandas mais puiser librement sur les fonctions de Numpy et Scipy pour les manipuler.
Pandas offrent un excellent moyen de manipuler les tables, comme vous pouvez rendre binning facile ( binning une base de données dans pandas en Python ) et de calculer des statistiques. Une autre chose qui est grande dans pandas est la classe de panneau que vous pouvez joindre la série de couches avec des propriétés différentes et le combiner en utilisant la fonction groupby.