Analyse des cas de COVID-19#
Ce carnet Jupyter, analyse de données ouvertes disponibles en ligne mises à jour quotidiennement. Il identifie les 10 pays ayant le plus grand nombre total de cas de COVID-19 déclarés depuis 2020.
Les données sont lues sur un site de partage de données ouvertes (mise à jour quotidienne).
Les données relatives à des emplacements qui ne sont pas des pays sont supprimées.
Les données restantes sont analysées, elles sont regroupées par emplacement (
location), sommées et triées par ordre décroissant de leur somme.
Ensuite les 10 premiers pays en nombre total de cas sont affichés sous la forme d’une table, pour sous la forme d’un histogramme.
Les fonctionnalités majeures de ce carnet sont :
Reproductivité par utilisation de données en ligne au format CSV avec le module
pandaAffichage tabulaire et graphique par utilisation du module
pandas
import pandas
import datetime
Lecture des données depuis le site « Our World in Data »#
# Load the dataset from open data source
data_set_url = "https://covid.ourworldindata.org/data/owid-covid-data.csv"
covid_dataset = pandas.read_csv(data_set_url)
Suppression des données non liées à un pays#
# Name of location column that is not a country
not_country_location = [
"World",
"Asia",
"Europe",
"North America",
"South America",
"European Union",
"Africa",
"Oceania",
"Upper middle income",
"High income",
"Lower middle income",
]
# Drop rows with location not a country
covid_dataset = covid_dataset[
~covid_dataset['location'].isin(not_country_location)
]
# set location column as index
covid_dataset = covid_dataset.set_index('location')
Analyse des données#
world_covid_cases = covid_dataset.filter(
["total_cases"]
).groupby("location").max().sort_values("total_cases", ascending=False)
Affichage tabulaire du résultat de l’analyse#
print("Analyse du {}".format(datetime.datetime.today().strftime('%Y-%m-%d')))
world_covid_cases.head(10)
Analyse du 2024-05-31
| total_cases | |
|---|---|
| location | |
| United States | 103436829.0 |
| China | 99356481.0 |
| India | 45038518.0 |
| France | 38997490.0 |
| Germany | 38437756.0 |
| Brazil | 37519960.0 |
| South Korea | 34571873.0 |
| Japan | 33803572.0 |
| Italy | 26722507.0 |
| United Kingdom | 24927820.0 |
Affichage graphique du résultat de l’analyse#
print("Analyse du {}".format(datetime.datetime.today().strftime('%Y-%m-%d')))
world_covid_cases.head(10).plot.barh()
Analyse du 2024-05-31
<Axes: ylabel='location'>