La librairie Pandas de Python est très largement utilisée lorsqu’il s’agit de manipuler des tableaux de données. Les méthodes loc et iloc sont incontournable dans cette librairie. Elles sont utilisées pour manipuler les indices et sélectionner des données dans un DataFrame.
La méthode loc permet de sélectionner des lignes et des colonnes grâce à des labels. Elle sera utilisée lors de la manipulation de DataFrames dont les index de colonnes et de lignes sont étiquetés.
Dans cet exemple loc prend en premier paramètre des index de lignes et en deuxième paramètre des index de colonnes.
Dans cet exemple on observe que l’on peut sélectionner un ensemble de lignes et un ensemble de colonnes à l’aide de « : ».
La méthode iloc ressemble à la méthode loc sauf qu’elle utilise des indices entiers et non des labels. Elle sera utilisée lors de la manipulation de DataFrames dont les index de colonnes et de lignes sont numériques.
Dans cet exemple iloc prend en premier paramètre un ensemble de lignes et en deuxième paramètre un ensemble de colonnes.
La méthode iloc est généralement plus performante car l'accès aux données par indices entiers est plus rapide que par des labels. La différence est peu significative sur des jeux de données de petite et moyenne taille.
Il est possible également d’utiliser les deux méthodes pour filtrer les données.
Dans cet exemple, on observe une condition insérer en paramètre des deux méthodes.
Si vous avez d’avantages de questions, n’hésitez pas à nous contacter. Vous pouvez également consulter nos formations python.
Comments