preguntar acerca de dataframe

4
réponses

utiliser plusieurs colonnes comme variables avec sapply

J'ai un dataframe et je voudrais appliquer une fonction qui prend les valeurs de trois colonnes et calcule la différence minimale entre les trois valeurs. #dataset df <- data.frame(a= sample(1:100, 10),b = sample(1:100, 10),c= sample(1:100, 10)) …
demandé sur 1970-01-01 00:33:32
2
réponses

Pandas filtrage pour plusieurs sous-chaînes en série

J'ai besoin de filtrer les lignes dans un dataframe pandas de sorte qu'une colonne de chaîne spécifique contienne au moins l'une d'une liste de sous-chaînes fournies. Les sous-chaînes peuvent avoir des caractères inhabituels / regex. La comparaison n …
demandé sur 1970-01-01 00:33:38
4
réponses

Dans R, Comment puis-je calculer des statistiques en pourcentage sur une colonne dans un dataframe? (fonction de tableau étendue avec des pourcentages)

C'est une question simple mais je ne pouvais pas comprendre comment utiliser prop.table pour cela et j'ai besoin de cette fonctionnalité très très souvent. J'ai des données comme ceci > library(ggplot2) > #sample data > head(tips,3) tota …
demandé sur 1970-01-01 00:33:32
3
réponses

Remplir une trame de données dans R dans une boucle

J'essaie de remplir une trame de données à partir d'une boucle for Dans R. les noms des colonnes sont générés dynamiquement dans la boucle et la valeur de certaines des variables de boucle est utilisée comme valeurs lors du remplissage de la trame de …
demandé sur 1970-01-01 00:33:32
2
réponses

Appliquer une fonction à tous les éléments d’une trame de données

j'essaie d'appliquer quelques transformations à tous les éléments d'une base de données. quand j'utilise les fonctions d'application régulières, je récupère une matrice et pas une base de données. Est-il possible d'obtenir un dataframe directement …
demandé sur 1970-01-01 00:33:36
2
réponses

Pandas DataFrame.fusionner MemoryError

but mon but est de fusionner deux images de données par leur colonne commune (noms de gènes) afin que je puisse prendre un produit de chaque score de gène à travers chaque rangée de gènes. Je puis à effectuer un groupby sur les patients et les cel …
demandé sur 1970-01-01 00:33:35
4
réponses

Comment supprimer les accents des valeurs dans les colonnes?

Comment puis-je changer les caractères spéciaux pour les lettres alphabétiques habituelles? C'est mon dataframe: In [56]: cities Out[56]: Table Code Country Year City Value 240 Åland Islands 2014.0 MARIE …
demandé sur 1970-01-01 00:33:36
1
réponses

Python: créer une base de données pandas à partir d’une liste

j'utilise le code suivant pour créer une trame de données à partir d'une liste: test_list = ['a','b','c','d'] df_test = pd.DataFrame.from_records(test_list, columns=['my_letters']) df_test Le code ci-dessus fonctionne très bien. Ensuite, j'ai essa …
demandé sur 1970-01-01 00:33:37
1
réponses

Changer les valeurs dans les pandas DataFrame

j'ai un problème à changer les valeurs d'une base de données. Je veux également consulter au sujet d'un problème que je dois résoudre et la bonne façon d'utiliser les pandas pour le résoudre. Je vais apprécier aide sur les deux. J'ai un fichier cont …
demandé sur 1970-01-01 00:33:33
2
réponses

Pandas, DataFrame: diviser une colonne en plusieurs colonnes

j'ai le texte suivant DataFrame. Je me demande s'il est possible de fractionner la colonne "données" en plusieurs colonnes. E. g., à partir de ceci: ID Date data 6 21/05/2016 A: 7, B: 8, C: 5, D: 5, A: 8 6 21/01/2014 B: 5 …
demandé sur 1970-01-01 00:33:36