Le graphique à barres peut aussi être utilisé pour comparer des sous-groupes.
Pour une variable continue donnée, il illustre les proportions occupées par cette variable pour chacune des valeurs d’une variable catégorielle en fonction d’une autre variable catégorielle (ou plus…).
Le graphique à barres renvoie visuellement exactement la même information que celle qu’on obtiendrait avec la procédure Moyennes.
La hauteur d’une barre dans un tel graphique représente la moyenne obtenue par un sous-groupe. L’échelle verticale permet d’estimer la moyenne de chacun des sous-groupes formés par la combinaison des variables catégorielles.
Lorsque l’on compare les sous-groupes à partir d’une variable dichotomique (codée 0-1), les barres représentent la proportion de « 1 » dans la distribution.
Le graphique ci-dessous montre la proportion de personnes qui utilisent Internet pour autre chose que le courriel (USENET) en fonction de la catégorie d’âge (AGECAT) et du diplôme obtenu (NDEGREE).
La sortie de tels résultats est toujours déterminée par le nombre de catégories des variables de sous-groupes.
Si votre échantillon est petit et que votre variable de sous-groupe contient beaucoup de catégories, vous allez vous retrouver avec des sous-groupes comprenant un très petit nombre de sujets. Ceci n’est pas intéressant, car les moyennes calculées avec de petits nombres de répondants ne sont pas très valides dans la mesure où la moyenne pourrait être bien différente en sélectionnant un échantillon plus imposant de la population.