preguntar acerca de missing-data

1
réponses

Str.format() déclenche KeyError

Le code suivant déclenche une exception KeyError: addr_list_formatted = [] addr_list_idx = 0 for addr in addr_list: # addr_list is a list addr_list_idx = addr_list_idx + 1 addr_list_formatted.append(""" "{0}" { "gam …
demandé sur 1970-01-01 00:33:30
2
réponses

Quelle est la différence entre et NA?

J'ai un facteur nommé SMOKE avec les niveaux " Y " et "N". Les valeurs manquantes ont été remplacées par NA (à partir du niveau initial "NULL"). Cependant, quand je vois le facteur, j'obtiens quelque chose comme ceci: head(SMOKE) N N <NA> Y Y …
demandé sur 1970-01-01 00:33:33
7
réponses

Insérer des lignes pour les dates/heures manquantes

Je suis nouveau sur R mais je me suis tourné vers lui pour résoudre un problème avec un grand ensemble de données que j'essaie de traiter. Actuellement, j'ai 4 colonnes de données (valeurs Y) définies par rapport aux horodatages d'intervalle des minu …
demandé sur 1970-01-01 00:33:33
6
réponses

Remplacer NAs dans R par la valeur la plus proche

Je cherche quelque chose de similaire à na.locf() dans le paquet zoo, mais au lieu d'utiliser toujours la valeur précédente non-NA, je voudrais utiliser la valeur la plus proche non-NA. Quelques exemples de données: dat <- c(1, 3, NA, NA, 5, 7) …
demandé sur 1970-01-01 00:33:32
7
réponses

Les valeurs manquantes dans l’apprentissage scikits machine

Est-il possible d'avoir des valeurs manquantes dans scikit-learn ? Comment doivent-ils être représentés? Je ne pouvais pas trouver toute la documentation à ce sujet. ... …
demandé sur 1970-01-01 00:33:32
8
réponses

Remplacer les valeurs manquantes par la colonne moyenne

Je ne sais pas comment boucler chaque colonne pour remplacer les valeurs de NA par la moyenne de la colonne. Quand j'essaye de remplacer pour une colonne en utilisant ce qui suit, cela fonctionne bien. Column1[is.na(Column1)] <- round(mean(Column …
demandé sur 1970-01-01 00:33:34
4
réponses

Comment réduire la taille d’une colonne Python dataframe si elle a des valeurs manquantes?

Le code suivant ne fonctionne pas. import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x']) xLower = df["x"].map(lambda x: x.lower()) Comment dois-je modifier pour obtenir xLower = ['un','deux',np.nan]? L'effic …
demandé sur 1970-01-01 00:33:34
9
réponses

Python format chaîne non utilisée arguments nommés

disons que j'ai: action = '{bond}, {james} {bond}'.format(bond='bond', james='james') ce sera de sortie: 'bond, james bond' nous avons: action = '{bond}, {james} {bond}'.format(bond='bond') sortie: KeyError: 'james' y a-t-il une solutio …
demandé sur 1970-01-01 00:33:33
15
réponses

Supprimer les lignes avec tout ou partie des NAs (valeurs manquantes) dans les données.cadre

j'aimerais supprimer les lignes dans ce cadre de données que: a) contenir NA s à travers toutes les colonnes. ci-dessous est mon exemple de base de données. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 …
demandé sur 1970-01-01 00:33:31