STATISTIQUES l. Un peu de vocabulaire Toute étude statistique s’appuie sur des données. Dans le cas où ces données sont numériques, on distingue les données discrètes (qui prennent un nombre fini de valeurs : par ex, le nombre d’enfants par famille en France) et des données continues (qui prennent des valeurs quelconques : par ex, la taille des hommes). • Dans le cas d’une série discrète, le nombre de fois ou l’on retrouve la même valeur s’appelle l’effectif de cette valeur.
Si cet effectif est exprimé en pourcentage, on parle alors de fréquence de cette valeur. • Dans le cas d’une s onnées par classes. Le but des statistiqu dispose. Pour cela, o • d’un graphique : No org Sni* to View souvent les ées dont on ette année les diagrammes circulaire, en b tons, en boites, et les histogrammes. • On peut aussi chercher à déterminer la moyenne ou la médiane de la série. De tels nombres permettent notamment de comparer plusieurs séries entre elles.
On les appelle indicateurs statistiques ou paramètres statistiques. On distingue les indicateurs de position (qui proposent une valeur « centrale » de la série) et les indicateurs de dispersion (qui indiquent si la to page érie est très regroupée autour de son « centre » ou non). Il. Representations graphiques 1. Diagramme circulaire pour construire un diagramme circulaire, il suffit de faire correspondre à chaque effectifs, pourcentage ou fréquence un angle de mesure proportionnelle.
Exemple : On s’intéresse à la deuxième langue vivante choisie par les 500 élèves d’un lycée : 150 élèves font de l’espagnol en première langue, 225 des élèves font de l’anglais, 75 de l’allemand , 25 de l’italien et enfin 25 aucune deuxième langue. On construit un tableau : Effectif 500 Angle 3600 150 1080 225 n obtient le diagramme circulaire suivant : 75 540 25 18b 180 sont donc « collés » les uns aux autres. L’histogramme est donc surtout utilisé pour représenter graphiquement des séries continues où les données ont été réparties en classes. On résume dans un tableau le poids des personnes d’une chorale . oids (Kg) [0 ; [50 ; [60 ; 701 [70 ; 90] nbre de personnes 2 4 pour construire cet histogramme, on réalise le tableau ci- dessous : classe effectif amplitude 50 10 IO 20 effectif/amplitude 0. 2 On obtient : 1 personne 12 13 Le mode est la valeur qui a le plus gros effectif, c’est à dire 10 3 5 donc l’étendue de cette série est 5 Exemple de données réparties par classes : 14 [15 ; 20] La classe modale est la classe qui a le plus gros effectif, c’est ? dire la classe 10 ; IS [ 20 – 5 = 15 donc l’étendue de cette série est inférieure ou égale ? 15 Remarque : exacte de la moyenne ou de l’écart type.
On peut toutefois en déterminer une bonne approximation en remplaçant chaque classe par son milieu dans les formules ci-dessus. Exemple avec un tableau des fréquences : valeurs fréquences 0,05 x — 14,13 et 0—092 0,17 0,43 0,30 16 Exemple avec un tableau des fréquences ffectifs 7 x — 9,07 et o —427 (10 ; [15 ; 20 (partagent la série en 10 : il y en a donc 9) Le 1 décile Dl est la plus petite valeur telle que des données lui soit inférieures ou égales.
Le 9ème décile 09 est la plus petite valeur telle que des Q3 est la valeur dont le rang est le premier entier supérieur ou égal à 3n Dl est la valeur dont le rang est le premier entier supérieur ou égal à n D9 est la valeur dont le rang est le premier entier supérieur ou égal à gn Remarques : • Les trois nombres QI, Q2 = méd, Q3 partagent la série en 4 arts égales (à une unité près) • Si les données ont été réparties en classes, on ne peut déterminer la médiane exacte.
En revanche, on appellera classe médiane, la classe qui la contient (et permet donc d’en donner un encadrement). • Cintervalle [QI ; Q3] s’appelle l’intervalle interquartile. • Le nombre Q3 – QI s’appelle l’écart interquartile. Exemples avec des données discrètes « en vrac » : 21 25, 28, 30, 27, 24, 31, 21, 28, 30, 25, 28, 26, 25 Ordonnons la série par ordre croissant : 21, 21, 24, 25, 25, 25, 26, 27, 28, 28, 28, 30, 30, 31 Ilya 14 termes 14+1 26+27 ème