Binder NbViewer

Analyse des cas de COVID-19#

Ce carnet Jupyter, analyse de données ouvertes disponibles en ligne mises à jour quotidiennement. Il identifie les 10 pays ayant le plus grand nombre total de cas de COVID-19 déclarés depuis 2020.

  • Les données sont lues sur un site de partage de données ouvertes (mise à jour quotidienne).

  • Les données relatives à des emplacements qui ne sont pas des pays sont supprimées.

  • Les données restantes sont analysées, elles sont regroupées par emplacement (location), sommées et triées par ordre décroissant de leur somme.

Ensuite les 10 premiers pays en nombre total de cas sont affichés sous la forme d’une table, pour sous la forme d’un histogramme.

Les fonctionnalités majeures de ce carnet sont :

  • Reproductivité par utilisation de données en ligne au format CSV avec le module panda

  • Affichage tabulaire et graphique par utilisation du module pandas

import pandas
import datetime

Lecture des données depuis le site « Our World in Data »#

# Load the dataset from open data source
data_set_url = "https://covid.ourworldindata.org/data/owid-covid-data.csv"
covid_dataset = pandas.read_csv(data_set_url)

Suppression des données non liées à un pays#

# Name of location column that is not a country
not_country_location = [
    "World",
    "Asia", 
    "Europe",
    "North America",
    "South America",
    "European Union",
    "Africa",
    "Oceania",
    "Upper middle income",
    "High income",
    "Lower middle income",
]
# Drop rows with location not a country
covid_dataset = covid_dataset[
    ~covid_dataset['location'].isin(not_country_location)
]
# set location column as index
covid_dataset = covid_dataset.set_index('location')

Analyse des données#

world_covid_cases = covid_dataset.filter(
    ["total_cases"]
).groupby("location").max().sort_values("total_cases", ascending=False)

Affichage tabulaire du résultat de l’analyse#

print("Analyse du {}".format(datetime.datetime.today().strftime('%Y-%m-%d')))
world_covid_cases.head(10)
Analyse du 2024-05-31
total_cases
location
United States 103436829.0
China 99356481.0
India 45038518.0
France 38997490.0
Germany 38437756.0
Brazil 37519960.0
South Korea 34571873.0
Japan 33803572.0
Italy 26722507.0
United Kingdom 24927820.0

Affichage graphique du résultat de l’analyse#

print("Analyse du {}".format(datetime.datetime.today().strftime('%Y-%m-%d')))
world_covid_cases.head(10).plot.barh()
Analyse du 2024-05-31
<Axes: ylabel='location'>
../_images/72d72ec9f187c4d814fb834dae1ff9f040da2b58ad98ca89578e6b3ffe89a218.png