groupby
groupby
La méthode groupby de pandas est utilisée pour regrouper des données dans un DataFrame selon certaines clés. Cette opération est souvent suivie de calculs tels que la somme, la moyenne, le comptage, etc., sur chaque groupe.
Syntaxe de groupby
Supposons que nous avons un DataFrame représentant des ventes dans différentes villes, avec des catégories de produits et des dates. Nous voulons regrouper les données par ville et catégorie de produit.
Paramètres de groupby
by : Regroupe les données selon les valeurs uniques des colonnes spécifiées. Les résultats montrent les ventes agrégées pour chaque combinaison de ville et catégorie.
as_index=False : Les colonnes de groupement sont conservées comme colonnes dans le DataFrame résultant au lieu d'être utilisées comme index.
group_keys=True: Les clés de groupement sont ajoutées au DataFrame résultant. Cela est particulièrement utile avec la méthode apply.
observed=True: Inclut seulement les combinaisons observées de catégories dans les données de groupement, ce qui peut être utile pour les données catégorielles où toutes les combinaisons possibles ne sont pas présentes.
Voir aussi : all(), any(), append(), count(), enumerate(), extend(), filter(), float() format() input(), int(), isdigit(), isinstance(), items(), join(), endswith(), list(), map(), max(), mean(), min(), pop(), range(), len(), startswith(), zip(), type(), get(), symmetric_difference(), keys(), difference()
Numpy : arange(), array(), delete(), hsplit(), hstack(), linspace(), logical_and(), logical_or(), polyfit()
Pandas : concat(), concatenate(), describe(), dict(), drop_duplicates(), dropna(), fillna(), from_dict(), groupby(), head(), iloc, info(), insert(), isin(), melt(), merge(), pivot_table(), read_csv(), read_excel(), rename(), where()
N'hésitez pas à consulter nos formations sur cette page.