top of page

drop_duplicates()

drop_duplicates()

La fonction drop_duplicates de la bibliothèque pandas en Python est utilisée pour supprimer les lignes dupliquées d'un DataFrame.


Syntaxe de drop_duplicates()


Paramètres de drop_duplicates()


  • subset : Spécifie les colonnes sur lesquelles appliquer la suppression des doublons.


  • keep : Spécifie quelles occurrences dupliquées doivent être conservées. Les options sont 'first', 'last', et False.


  • inplace : Supprime les doublons directement dans le DataFrame original sans créer un nouveau DataFrame.

  • ignore_index : Réinitialise les index du DataFrame résultant après la suppression des doublons.


Voir aussi : all(), any(), append(), count(), enumerate(), extend(), filter(), float() format() input(), int(), isdigit(), isinstance(), items(), join(), endswith(), list(), map(), max(), mean(), min(), pop(), range(), len(), startswith(), zip(), type(), get(), symmetric_difference(), keys(), difference()


Numpy : arange(), array(), delete(), hsplit(), hstack(), linspace(), logical_and(), logical_or(), polyfit()


Pandas : concat(), concatenate(), describe(), dict(), drop_duplicates(), dropna(), fillna(), from_dict(), groupby(), head(), iloc, info(), insert(), isin(), melt(), merge(), pivot_table(), read_csv(), read_excel(), rename(), where()


N'hésitez pas à consulter nos formations sur cette page.

Glossaire pour apprendre à coder sur Python

Apprenez à coder sur Python

avec des experts

Notre organisme de formation spécialisé dans le langage Python et la Data Science forme les débutants et perfectionne les experts sur ce langage informatique. Pourquoi pas vous?

bottom of page