Pour tout analyste de données ou scientifique des données, la visualisation des données est une compétence indispensable. Elle permet de transmettre de manière efficace des informations et des connaissances à partir de données non traitées. À travers ce projet, nous explorerons diverses illustrations en utilisant la bibliothèque `Matplotlib`, l'un des outils les plus répandus en `Python` pour représenter des données numériques.
L'objectif de ce projet est d'introduire les débutants à `Matplotlib` et de leur fournir des exemples concrets de visualisations couramment utilisées. Différents types de visualisations seront abordés, tels que les graphiques linéaires, les graphiques à barres, les histogrammes, les nuages de points et les diagrammes circulaires. Chaque cas sera fourni avec une explication approfondie et du code `Python` pour illustrer la création de la visualisation.
Pourquoi utiliser Matplotlib?
Matplotlib est une bibliothèque Python extrêmement souple et puissante pour visualiser des données. Elle propose une grande diversité de graphiques et de fonctionnalités de personnalisation, ce qui en fait un outil parfait pour les novices et les spécialistes de la visualisation de données. En se familiarisant avec l'utilisation de Matplotlib, les débutants peuvent développer des compétences précieuses pour explorer, analyser et présenter de manière efficace des données.
Dans cet exemple, nous définissons deux listes : jours , qui contient les jours de la semaine, et ventes, qui contient le nombre de ventes pour chaque jour. Ces données seront utilisées pour créer le graphique à barres, où les jours seront sur l'axe des abscisses et le nombre de ventes sur l'axe des ordonnées.
Nous écrivons simplement deux listes, une pour les jours et une pour les ventes, en utilisant la notation des listes en Python.
plt.bar(jours, ventes, color='blue') : Cette fonction crée le graphique à barres en utilisant les jours de la semaine comme catégories sur l'axe des abscisses et les ventes comme valeurs sur l'axe des ordonnées. La couleur des barres est définie sur bleu avec color='blue'.
plt.xlabel('Jours de la semaine') et plt.ylabel('Nombre de ventes') : Ces lignes définissent les étiquettes des axes X et Y respectivement.
plt.title('Ventes par jour de la semaine') : Cette ligne définit le titre du graphique à barres.
plt.grid(axis='y') : Cette ligne active la grille uniquement sur l'axe des ordonnées pour faciliter la lecture des valeurs.
plt.subplot(2, 2, 2) : Cette ligne crée une sous-figure dans une grille de 2 lignes et 2 colonnes, et positionne le diagramme circulaire dans la deuxième cellule de cette grille.
plt.pie(ventes, labels=jours, autopct='%1.1f%%', colors=['gold', 'lightcoral', 'lightskyblue', 'lightgreen', 'lightpink']) : Cette fonction crée le diagramme circulaire en utilisant les données de ventes ventes comme valeurs, les jours de la semaine jours comme étiquettes, le formatage pour afficher les pourcentages autopct='%1.1f%%', et les couleurs définies pour chaque tranche.
plt.title('Répartition des ventes') : Cette ligne définit le titre du diagramme circulaire, indiquant la répartition des ventes par jour de la semaine.
plt.scatter(jours, ventes, color='blue', s=100, alpha=0.7, edgecolors='black', linewidth=1.5) : Cette fonction crée le nuage de points en utilisant les jours de la semaine jours comme valeurs sur l'axe des abscisses et les ventes ventes comme valeurs sur l'axe des ordonnées. Les autres paramètres définissent la couleur des points (color='blue'), leur taille (s=100), leur opacité (alpha=0.7), la couleur des bordures des points (edgecolors='black') et l'épaisseur des bordures (linewidth=1.5).
plt.grid(True) : Active la grille de fond sur le visuel, aidant à visualiser les données et leurs relations.
N'hésitez pas à vous tourner vers nos formations si vous avez des interrogations.
Comments