Visualisation de données statistiques et géographiques:
Ce projet de visualisation de données vise à explorer et analyser des données statistiques et géographiques, en mettant l'accent sur les prix immobiliers aux États-Unis. Le but principal est de fournir une représentation visuelle des données afin de faciliter la compréhension des tendances, des variations et des corrélations entre les différents paramètres. Fonctionnalités principales
- Nettoyage des données : Le projet comprend une étape de nettoyage des données afin de préparer les données brutes pour l'analyse. Cela inclut la manipulation des formats de dates, l'extraction de l'année et du mois à partir des enregistrements, et d'autres opérations de nettoyage nécessaires.
- Regroupement des enregistrements de prix : Les données de prix immobiliers sont regroupées en fonction de différentes catégories, telles que la baisse des prix par rapport à l'année précédente, la baisse des prix par rapport au mois précédent et l'augmentation des prix. Ce regroupement permet d'identifier les variations significatives et de visualiser les changements au fil du temps.
- Visualisations graphiques : Le projet propose plusieurs types de visualisations graphiques pour présenter les données de manière claire et concise. Parmi les visualisations utilisées, on trouve des diagrammes en barres pour comparer les prix immobiliers par année et par mois, des diagrammes en boîte pour analyser les variations des prix selon les catégories, des cartes géographiques pour visualiser les prix immobiliers selon les régions, ainsi que des animations de type Bar Chart Race pour montrer l'évolution des prix immobiliers entre 2016 et 2022.
Le projet utilise plusieurs bibliothèques Python pour l'analyse des données et la visualisation. Voici les principales bibliothèques utilisées :
pandas : pour la manipulation et l'analyse des données. numpy : pour les calculs numériques. seaborn : pour la création de graphiques statistiques attrayants. matplotlib.pyplot : pour la création de graphiques et de visualisations. geopandas : pour la manipulation de données géographiques. shapely.geometry : pour les opérations géométriques sur les données géographiques. ffmpeg-python : pour générer des animations Bar Chart Race.