R2.08 - Statistique descriptive
TP 2 - Description bidimensionnelle

A. Ridard

L'objectif est d'illustrer le cours 2 avec Python (une illustration avec Excel est disponible sur Moodle).

Importations pour ce TP

In [2]:
# importation des packages
import numpy as np
import pandas as pd
import seaborn as sns

# importation des modules
import matplotlib.pyplot as plt
import scipy.stats as sps

Charger les données du fichier TP2_Data.xslx dans un DataFrame (on reprend les données du TP1 en se limitant au Bac S).

In [7]:
# importation du fichier Excel

Deux variables qualitatives

Dans cette section, on s'intéresse à la dépendance entre la mention au bac ($X$) et la formation postbac ($Y$).

Afficher le tableau de contingence

In [ ]:
# solution

Afficher le tableau de contingence complété par les marges en lignes et en colonnes

In [ ]:
# solution

Afficher le tableau des profils-lignes

In [ ]:
# solution

Afficher le tableau des profils-colonnes

In [ ]:
# solution

Afficher le tableau des $\displaystyle\frac{n_{i.}n_{.j}}{n}$

In [ ]:
# solution

Calculer $d^2$ qui mesure l'écart à l'indépendance

In [ ]:
# solution

Une variable quantitative et une variable qualitative

Dans cette section, on se demande si la spécialité ($X$) permet d'expliquer la note de maths pour la crypto ($Y$).

Afficher le tableau des effectifs, des moyennes et des variances de $Y$ (pour chaque catégorie de $X$ et au total) (cf. exemple sur Excel)

In [ ]:
# solution

Vérifier la décomposition de la variance : Variance de $Y$ = Variance inter-catégories + Variance intra-catégories

In [ ]:
# solution

Calculer le rapport de corrélation empirique de $Y$ sachant $X$

In [ ]:
# solution