drop_duplicates()
drop_duplicates()
La fonction drop_duplicates de la bibliothèque pandas en Python est utilisée pour supprimer les lignes dupliquées d'un DataFrame.
Syntaxe de drop_duplicates()
Paramètres de drop_duplicates()
subset : Spécifie les colonnes sur lesquelles appliquer la suppression des doublons.
keep : Spécifie quelles occurrences dupliquées doivent être conservées. Les options sont 'first', 'last', et False.
inplace : Supprime les doublons directement dans le DataFrame original sans créer un nouveau DataFrame.
ignore_index : Réinitialise les index du DataFrame résultant après la suppression des doublons.
Voir aussi : all(), any(), append(), count(), enumerate(), extend(), filter(), float() format() input(), int(), isdigit(), isinstance(), items(), join(), endswith(), list(), map(), max(), mean(), min(), pop(), range(), len(), startswith(), zip(), type(), get(), symmetric_difference(), keys(), difference()
Numpy : arange(), array(), delete(), hsplit(), hstack(), linspace(), logical_and(), logical_or(), polyfit()
Pandas : concat(), concatenate(), describe(), dict(), drop_duplicates(), dropna(), fillna(), from_dict(), groupby(), head(), iloc, info(), insert(), isin(), melt(), merge(), pivot_table(), read_csv(), read_excel(), rename(), where()
N'hésitez pas à consulter nos formations sur cette page.