L'objectif est d'illustrer le cours 2 avec Python (une illustration avec Excel est disponible sur Moodle).
# importation des packages
import numpy as np
import pandas as pd
import seaborn as sns
# importation des modules
import matplotlib.pyplot as plt
import scipy.stats as sps
Charger les données du fichier TP2_Data.xslx dans un DataFrame (on reprend les données du TP1 en se limitant au Bac S).
# importation du fichier Excel
Dans cette section, on s'intéresse à la dépendance entre la mention au bac ($X$) et la formation postbac ($Y$).
Afficher le tableau de contingence
# solution
Afficher le tableau de contingence complété par les marges en lignes et en colonnes
# solution
Afficher le tableau des profils-lignes
# solution
Afficher le tableau des profils-colonnes
# solution
Afficher le tableau des $\displaystyle\frac{n_{i.}n_{.j}}{n}$
# solution
Calculer $d^2$ qui mesure l'écart à l'indépendance
# solution
Dans cette section, on se demande si la spécialité ($X$) permet d'expliquer la note de maths pour la crypto ($Y$).
Afficher le tableau des effectifs, des moyennes et des variances de $Y$ (pour chaque catégorie de $X$ et au total) (cf. exemple sur Excel)
# solution
Vérifier la décomposition de la variance : Variance de $Y$ = Variance inter-catégories + Variance intra-catégories
# solution
Calculer le rapport de corrélation empirique de $Y$ sachant $X$
# solution