Partagé Plutôt femme Plutôt homme
18-29 ans 166 384 76
30-44 ans 374 1441 206
45-59 ans 289 1474 147
60 ans et plus 139 1235 107
–> quelles cellules contribuent au khi 2 (déjà abordé mais partiellement)
ED de l’Université de Bordeaux
2026
Claire Kersuzan
PUD-Bx / Progedo · LifeObs / Ined · COMPTRASEC / UB
Karine Onfroy
Bordeaux School Economics (BxSE) / UB
Aujourd’hui, on va apprendre à :
On a appris à :
On a travaillé variable par variable.
On ne s’intéresse plus à une variable seule…
mais à une relation entre deux variables.
La répartition des tâches varie-t-elle selon l’âge ?
selon le type de ménage ?
selon le diplôme ?
selon d’autres caractéristiques ?
Une variable qualitative décrit des catégories.
Exemples dans ERFI :
MA_SEXE : sexe du répondant ;diplome : niveau de diplôme ;age_cat : groupe d’âge ;repas_genre : répartition recodée de la préparation des repas.On peut étudier :
Décrire une variable :
Quelle est la répartition de la préparation des repas ?
Analyser deux variables :
Cette répartition varie-t-elle selon le groupe d’âge ?
Ou encore :
Le type de tâche réalisée varie-t-il selon le niveau de diplôme ?
Question générale :
Les tâches domestiques sont-elles partagées de la même manière selon les groupes d’âge ?
Question statistique :
La distribution de
repas_genreest-elle la même selonage_cat?
Variables mobilisées :
repas_genre : variable qualitative ;age_cat : variable qualitative.Avant de tester, on commence toujours par observer.
On va construire un tableau croisé :
age_cat×repas_genre
La répartition des repas dans le couple varie-t-elle selon le groupe d’âge ?
Exemple :
une case indique combien d’individus d’un groupe d’âge donné sont dans une modalité donnée de répartition des repas.
Pour comparer les groupes, on transforme les effectifs en pourcentages.
Mais attention :
Il faut choisir le bon sens de calcul.
On calcule ici les proportions par groupe d’âge.
Chaque ligne = 100 %
On peut maintenant comparer :
Les pourcentages par ligne permettent de comparer les groupes d’âge.
On peut lire par exemple :
On observe une relation apparente entre l’âge et la répartition des repas.
On aurait aussi pu calculer des pourcentages par colonne.
Partagé Plutôt femme Plutôt homme
18-29 ans 17.148760 8.469343 14.179104
30-44 ans 38.636364 31.782091 38.432836
45-59 ans 29.855372 32.509925 27.425373
60 ans et plus 14.359504 27.238641 19.962687
Que change ce calcul ?
Ici, chaque colonne = 100 %.
On répond à une autre question :
Dans chaque type de répartition, quelle est la composition par âge ?
Ce n’est pas la même logique.
On ne compare plus directement les groupes d’âge entre eux.
On décrit la composition des modalités de repas_genre.
margin = 1 → base de 100 % pour les lignes
→ comparer les groupes
margin = 2 → base de 100 % pour les colonnes
→ décrire la composition des modalités
Le choix dépend toujours de la question posée.
On change maintenant de variables.
Objectif :
Construire le tableau croisé de
diplome×linge_genre.
À faire :
Construire le tableau croisé :
diplome×linge_genre
Ici, on veut comparer la répartition du linge selon le niveau de diplôme.
La variable de comparaison est donc :
diplome
On veut que chaque niveau de diplôme fasse 100 %.
Il faut donc calculer des pourcentages par ligne.
On observe une variation selon le niveau de diplôme.
La part de situations “Partagé” augmente avec le diplôme.
À l’inverse, la part de situations “Plutôt femme” diminue lorsque le niveau de diplôme augmente.
La répartition du linge semble donc plus souvent partagée parmi les personnes les plus diplômées.
Tableau croisé → lecture précise effectifs ou pourcentages.
Mais difficile à interpréter rapidement.
Représenter la relation avec un graphique.
Objectif : voir si la distribution de
repas_genrevarie selonage_cat.
Dans ce code :
ggplot(ERFI_couple, ...) indique le tableau de données utilisé ;aes(x = age_cat, fill = repas_genre) indique les variables représentées ;x = age_cat place les groupes d’âge sur l’axe horizontal ;fill = repas_genre colore les barres selon la répartition des repas ;geom_bar() produit un diagramme en barres ;position = "dodge" place les barres côte à côte.Ici, on compare des effectifs.
À partir du graphique :
Représentation des effectifs → difficile de comparer les groupes :
si les groupes d’âge n’ont pas la même taille, les barres ne sont pas directement comparables.
Raisonner en proportions.
ERFI_couple ;age_cat sur l’axe horizontal ;repas_genre par couleur.Ce qui change :
position = "fill" transforme chaque barre en barre de même hauteur.
Chaque barre représente 100 % du groupe d’âge.
Barres empilées à 100 % → comparer la composition de chaque groupe d’âge.
Pour notre question :
La répartition des repas varie-t-elle selon l’âge ?
→ Graphique empilé à 100 % plus adapté
Des différences entre groupes d’âge :
Mais une question reste ouverte :
ces écarts sont-ils suffisamment importants pour conclure à une association ?
Le diagramme en barres empilées à 100 % est souvent le plus lisible.
Mais d’autres représentations peuvent aider à explorer une relation entre deux variables qualitatives :
mosaic plot
→ visualiser les écarts à l’indépendance
heatmap du tableau croisé
→ repérer rapidement les combinaisons de modalités les plus fréquentes
Le choix du graphique dépend de ce que l’on veut montrer.
Une heatmap permet de représenter les cases du tableau croisé par une intensité visuelle.
Plus une combinaison de modalités est fréquente, plus elle ressort graphiquement.
La heatmap précédente représente les effectifs.
Utile pour repérer les cellules les plus nombreuses.
Mais trompeuse si groupes de taille ≠.
Représentation des pourcentages par ligne.
Observer des différences ne suffit pas toujours.
Dans un échantillon → toujours une part de hasard :
Tests statistiques.
Répondre à une question du type :
Les différences observées sont-elles suffisamment nettes pour être interprétées comme autre chose que du hasard ?
Données d’enquête :
Est-ce que les différences observées peuvent être attribuées au hasard d’échantillonnage ?
Données expérimentales :
Différence avec groupe témoin est-elle compatible avec le hasard, ou suggère-t-elle un effet de l’intervention ?
Un test statistique commence par une hypothèse de départ :
Et si, dans la population, il n’y avait pas de différence ? Et s’il n’y avait pas de relation ?
On appelle cette hypothèse :
l’hypothèse nulle, notée H0
Hypothèse nulle → l’idée qu’il ne se passe rien.
Dans notre exemple :
H0 : la répartition des repas ne varie pas selon l’âge.
age_catetrepas_genresont indépendantes.
Hypothèse alternative → l’idée qu’il existe une différence/relation.
Dans notre exemple :
H1 : la répartition des repas varie selon l’âge.
age_catetrepas_genrene sont pas indépendantes.
À votre avis, que fait un test statistique ?
Test statistique ne prouve pas qu’une hypothèse est vraie.
Il évalue plutôt :
si données observées sont compatibles avec l’hypothèse nulle.
Si données sont très peu compatibles avec H0, on peut rejeter H0.
La p-value correspond à :
la probabilité d’observer des écarts au moins aussi importants que ceux observés, si l’hypothèse nulle était vraie.
Autrement dit :
On fait comme si le hasard était la seule explication… et on regarde si ce qu’on observe est plausible.
Si p-value faible :
écarts observés peu compatibles avec l’hypothèse du hasard.
→ On peut alors rejeter H0.
Si p-value élevée :
les écarts observés restent compatibles avec l’hypothèse du hasard.
→ On ne rejette pas H0.
En SHS → souvent un seuil de 5 %
(seuil variable selon disciplines et contextes).
Ce seuil correspond :
au risque que l’on accepte de rejeter à tort l’hypothèse du hasard (H0)
Si p-value < 0.05 → résultat statistiquement significatif au seuil de 5 %.
Cela signifie :
les écarts observés seraient peu probables si l’hypothèse du hasard (H0) était vraie.
Une p-value ne dit pas :
Elle indique seulement si les écarts observés sont compatibles ou non avec H0.
→ Différence entre deux groupes.
Test donne :
Avec une p-value de 0.03 : → rejet H0 au seuil de 5 % ; > écarts observés peu compatibles avec l’hypothèse du hasard ;
Mais :
Dans des données observationnelles (comme ici) :
on identifie des associations, pas des causalités.
Dans des données expérimentales :
une interprétation causale peut être discutée si le protocole le permet (randomisation, contrôle, etc.)
Dans notre exemple → tester si 2 variables qualitatives sont associées : →age_cat et repas_genre.
Question :
les écarts observés dans le tableau croisé sont-ils compatibles avec l’hypothèse d’indépendance ?
Pour répondre :
test du khi² d’indépendance.
Mais avant de lancer le test khi² → comprendre son principe :
comparer ce que l’on observe avec ce que l’on aurait attendu s’il n’y avait pas de relation.
Le test du khi² est proposé par : Pearson, K. (1900). Philosophical Magazine, 50(302), 157–175.
Les chercheurs observent des écarts… mais sont-ils dus au hasard ?
Le test du khi² consiste à comparer :
Autrement dit : si les variables étaient indépendantes
les valeurs du tableau croisé
Si les variables étaient indépendantes :
à quoi ressemblerait le tableau ?
Si tout était indépendant :
chaque groupe aurait la même répartition
→ on “reproduit” la structure globale dans chaque ligne
Pour chaque case :
| A | B | Total | |
|---|---|---|---|
| Groupe 1 | 40 | 60 | 100 |
| Groupe 2 | 20 | 80 | 100 |
| Total | 60 | 140 | 200 |
Quel serait l’effectif attendu en (Groupe 1, A) ?
→ attendu = 30
→ observé = 40
Il y a un écart
khi² mesure écart entre observé et attendu
Pour chaque case :
→ on fait ça pour toutes les cases
→ puis on additionne
Pourquoi :
on mesure des écarts “comparables”
→ plus χ² est grand : > plus les données s’éloignent du hasard
On a calculé une valeur de χ².
Cette valeur est-elle “grande” ou “petite” ?
Pour répondre, il faut savoir que :
la valeur du χ² ne s’interprète jamais seule.
Elle dépend de :
Les ddl dépendent de la structure du tableau :
ddl = (nombre de lignes - 1) × (nombre de colonnes - 1)
Ils indiquent :
le nombre de valeurs “libres” dans le tableau.
Pourquoi c’est important ?
Parce que la distribution du χ² dépend des ddl.
→ Un χ² de 20 peut être grand… ou pas… selon les ddl.
On ne compare pas directement χ² à un seuil fixe.
On compare :
χ² observé
à ce qu’on attendrait sous H0 pour ces ddl (χ² critique)
on compare donc à une distribution de référence.
Pour un nombre de ddl donné, on peut représenter toutes les valeurs possibles de χ² :
→ On définit une zone de rejet
Zone compatible avec H0 | Zone de rejet
|
-------------------------------|-------------------->
^
χ² critique
^
χ² observé
Plutôt que de comparer à un seuil critique, on utilise la p-value.
p-value correspond à :
la probabilité d’obtenir une valeur de χ² au moins aussi grande que celle observée, si H0 est vraie
Autrement dit :
la probabilité d’être dans la zone de droite.
On ne raisonne donc pas directement avec χ².
On passe par la p-value :
Avant un khi² :
→ en pratique : pas trop de cases avec effectifs faibles
On teste maintenant l’association entre : - age_cat (groupe d’âge) et repas_genre (répartition recodée de la préparation des repas).
La répartition des repas varie-t-elle selon le groupe d’âge ?
Test donne 3 informations principales :
On obtient :
La p-value est très inférieure à 0,05. Rejet de l’hypothèse nulle d’indépendance (H0)
Il existe une association statistiquement significative entre le groupe d’âge et la répartition des repas.
Test du khi² repose sur une condition importante :
les effectifs attendus ne doivent pas être trop faibles.
On vérifie donc les effectifs attendus.
Partagé Plutôt femme Plutôt homme
18-29 ans 100.3591 470.0702 55.57072
30-44 ans 324.0026 1517.5909 179.40643
45-59 ans 306.2074 1434.2398 169.55283
60 ans et plus 237.4309 1112.0990 131.47002
Les effectifs attendus sont tous supérieurs à 5.
Le test du khi² est donc utilisable ici.
On peut interpréter le résultat du test avec confiance du point de vue des conditions d’application.
Ce test :
Le test du khi² indique qu’il existe une association.
Mais il ne dit pas :
quelles cases du tableau expliquent cette association.
Pour cela, on regarde les résidus.
Un résidu compare :
Autrement dit :
Plus le résidu est éloigné de 0, plus la case contribue à l’association.
Les écarts les plus marqués concernent :
Les résidus permettent donc de comprendre où se situe l’association.
Le tableau affiché par chisq.test() correspond à des résidus standardisés.
Mais plusieurs types de résidus existent :
En pratique, les résidus standardisés ou ajustés sont les plus utilisés pour interpréter un khi².
Représenter les résidus sous forme de heatmap. > repérer rapidement quelles cases contribuent le plus à l’association.
Lecture
On reprend l’exercice précédent :
La répartition du linge varie-t-elle selon le niveau de diplôme ?
Variables : diplome et linge_genre
Partagé Plutôt femme Plutôt homme
Au plus brevet 115 1740 56
CAP/Bac pro 173 1903 65
Bac à Bac+2 128 715 47
Bac+3 ou plus 257 677 49
test_khi2_linge <- chisq.test(
table(ERFI_couple$diplome, ERFI_couple$linge_genre)
)
test_khi2_linge
Pearson's Chi-squared test
data: table(ERFI_couple$diplome, ERFI_couple$linge_genre)
X-squared = 325.16, df = 6, p-value < 2.2e-16
χ² = 325,16 ; ddl = 6 ; p-value < 0,001
Association statistiquement significative entre niveau de diplôme et répartition du linge dans le couple
→ On rejette H0 (hypothèse d’indépendance) :
la répartition du linge varie selon le niveau de diplôme.
Les résidus montrent que l’association est surtout portée par certaines catégories.
→ L’écart le plus marqué :
répartition “partagée” chez les plus diplômé·es (surreprésentée)
Les résultats mettent en évidence une association statistiquement significative entre le niveau de diplôme et la répartition du linge au sein du couple, les personnes les plus diplômées déclarant plus souvent une organisation partagée, sans que cette relation ne puisse être interprétée comme causale. {.blockquote}
On a trouvé une p-value très faible.
Avec un grand échantillon :
même de très petits écarts peuvent devenir significatifs
→ le test détecte facilement des différences
→ mais ces différences peuvent être faibles en pratique
Deux groupes :
Échantillon : 15 000 individus
Oui, le test peut être significatif.
Mais :
la différence est très faible (2 points)
→ significatif mais peu important
Après un test significatif, toujours se demander :
Le test du khi² répond à une seule question :
existe-t-il une association ?
Que ne permet-il pas de savoir ?
Le khi² ne permet pas de savoir :
Après avoir établi l’existence d’un lien :
il faut mesurer son intensité
Comment faire ?
On utilise une taille d’effet
Pour le khi² :
le V de Cramer
Le V de Cramer sert à mesurer :
la force du lien entre deux variables qualitatives
Le V de Cramer compare :
ce qu’on observe
à ce qu’on attendrait s’il n’y avait aucun lien
Le V de Cramer varie entre :
À interpréter avec prudence
On a observé une relation significative entre age_cat et repas_genre.
Mais cette relation est-elle importante ?
Cramer's V (adj.) | 95% CI
--------------------------------
0.11 | [0.09, 1.00]
- One-sided CIs: upper bound fixed at [1.00].
V = 0,11 IC à 95 % ≈ [0,09 ; 1,00]
La valeur est proche de 0
→ l’association est faible
L’intervalle de confiance indique l’incertitude autour de cette estimation
→ ici, la borne supérieure est fixée à 1 (convention technique)
Il existe une association statistiquement significative entre l’âge et la répartition des repas.
Mais :
cette association est de faible intensité
On observe une association statistiquement significative entre le groupe d’âge et la répartition des repas (χ² significatif, p < 0,001). Les jeunes déclarent plus souvent une répartition partagée, tandis que les plus âgés déclarent plus souvent une répartition plutôt féminine. Toutefois, la taille d’effet (V de Cramer = 0,11) indique que cette association reste faible. {.blockquote}
On reprend l’exercice précédent :
La répartition du linge varie-t-elle selon le niveau de diplôme ?
Variables : diplome et linge_genre
Cramer's V (adj.) | 95% CI
--------------------------------
0.16 | [0.15, 1.00]
- One-sided CIs: upper bound fixed at [1.00].
Valeur plus élevée que pour age_cat et repas_genre (0,11) Mais elle reste relativement proche de 0
→ l’association est faible à modérée
Il existe une association statistiquement significative entre le niveau de diplôme et la répartition du linge.
Mais :
cette association reste modérée et pas très forte
Le V de Cramer mesure : > Force globale d’une association entre deux variables qualitatives.
Mais d’autres indicateurs existent :
Le choix de l’indicateur dépend toujours
du type de données et de la question de recherche.
Certaines variables = ordre entre les modalités (ex : diplôme, degré d’accord, etc.).
Méthodes tenant compte du sens et de la progression des modalités :
Ces méthodes cherchent à savoir : > lorsque l’une des variables augmente, > l’autre tend-elle aussi à augmenter (ou diminuer) ?
Dans la prochaine séance :
nous travaillerons sur des variables quantitatives.
Nous verrons notamment :
L’objectif restera le même :
comprendre et interpréter une relation entre variables.

Comment commenter ?
On peut écrire :