Comment supprimer les parenthèses et toutes les données en utilisant Pandas/Python?

j'ai un dataframe où je veux supprimer toutes les parenthèses et des trucs à l'intérieur.

j'ai vérifié : Comment puis-je supprimer un texte entre parenthèses avec un regex?

où la réponse pour supprimer les données était

re.sub(r'([^)]*)', '', filename)

j'ai essayé ce ainsi que

re.sub(r'(.*?)', '', filename)

Cependant, j'ai une erreur: expected a string or buffer

Quand j'ai essayé d'utiliser la colonne df['Column Name'] je suis no item named 'Column Name'

j'ai vérifié la base de données en utilisant df.head() et il montra comme un propre tableau avec les noms de colonnes comme ce que je voulais....cependant quand j'utilise le re expression pour supprimer le (stuff) il ne reconnaît pas le nom de la colonne que j'ai.

j'utilise normalement

df['name'].str.replace(" ()","") 

Toutefois, je veux supprimer les parenthèses et ce qui est à l'intérieur....Comment puis-je faire cela en utilisant regex ou pandas?

Merci!

Voici la solution que j'ai utilisée...merci pour l'aide!

All['Manufacturer Standard Name'] = All['Manufacturer Standard Name'].str.replace(r"(.*)","")
16
demandé sur Community 2014-01-03 04:35:43

1 réponses

df['name'].str.replace(r"\(.*\)","")

vous ne pouvez pas courir re fonctionne directement sur les objets pandas. Vous devez les boucler pour chaque élément à l'intérieur de l'objet. Donc Series.str.replace((r"\(.*\)", "") est juste sucre syntaxique pour Series.apply(lambda x: re.sub(r"\(.*\)", "", x)).

30
répondu dmvianna 2014-01-03 03:09:55