On considère une série statistique à caractère quantitatif, dont les $p$ valeurs sont données par:
$x_1$, $x_2$,..., $x_p$ d'effectifs associés $n_1$, $n_2$,..., $n_p$ avec $n_1+n_2+...+n_p=N$.
Voici les notes obtenues à un contrôle dans une classe de $30$ élèves :
Série A: $2;3;3;4;5;6;6;7;7;7;8;8;8;8;8;9;9;9;
9;9;9;10;10;11;11;11;13;13;15;16$
On peut représenter cette série par un tableau d'effectifs, et le compléter par la distribution des fréquences
On peut vérifier que la somme des fréquences est égale à $1$ (ou à $100$ si on les expriment en pourcentages).
On peut aussi faire un regroupement par classe, ce qui rend l'étude moins précise, mais qui permet d'avoir une vision plus globale.
Toujours pour la série A, si on regroupe les données par classes d'amplitude $5$ points, on obtient:
Quand les valeurs d'un caractère quantitatif sont rangées dans l'ordre croissant,
Lorsque le caractère étudié est quantitatif et lorsque les modalités sont regroupées en classes, on peut représenter la série par un histogramme : l'aire de chaque rectangle est alors proportionnelle à l'effectif (ou à la fréquence) associée à chaque classe.
Lorsque les classes ont la même amplitude, c'est la hauteur qui est proportionnelle à l'effectif.
Lorsque le caractère étudié est quantitatif et discret, on peut représenter la série par un nuage de points: chaque couple de valeurs est représenté par un point dans un repère orthogonal.
Soit une série statistique à caractère quantitatif discret, dont les $p$ valeurs sont données par $x_1$, $x_2$,..., $x_p$ d'effectifs associés $n_1$, $n_2$,..., $n_p$ avec $n_1+n_2+...+n_p=N$.
Lorsque la série est regroupée en classes, on calcule la moyenne en prenant pour valeurs $x_i$ le centre de chaque classe; ce centre est obtenu en faisant la moyenne des deux extrémités de la classe.
Classes du caractère | $[a_0;a_1[$ | $[a_1;a_2[$ | $[a_2;a_3[$ | ... | $[a_{p-1};a_p]$ |
Effectifs | $n_1$ | $n_2$ | $n_3$ | ... | $n_p$ |
Centre des classes | $c_1$ | $c_2$ | $c_3$ | ... | $c_p$ |
La moyenne de cette série statistique est le nombre noté $\overline{x}$ défini par:
$\overline{x}=\dfrac{n_1c_1+n_2c_2+n_3c_3+...+n_pc_p}{n_1+n_2+n_3+...+n_p}$. Où chaque centre des classes $c_i$ est égal à $\dfrac{a_{i-1}+a_i}{2}$.Soit une série statistique ordonnée dont les $n$ valeurs sont $x_1\leqslant x_2 \leqslant x_3 \leqslant \dots \leqslant x_n$.
La médiane est un nombre $M$ qui permet de diviser cette série en deux sous-groupes de même effectif.
Le premier quartile et le troisiéme quartile de la série statistique $(x_1,x_2,x_3,...,x_n)$ sont les nombres que l'on note souvent $Q_1$ et $Q_3$ définis de la façon suivante:
Lorsque le caractère étudié est quantitatif et lorsque les modalités sont regroupées en classes.
On peut effectuer la courbe des fréquences cumulées (croissantes ou décroissantes) appelée aussi polygone des fréquences cumulées.
Soit la série statistique suivante:
Valeur du caractére | $x_1$ | $x_2$ | $x_3$ | ... | $x_p$ |
Effectifs | $n_1$ | $n_2$ | $n_3$ | ... | $n_p$ |
Fréquences | $f_1$ | $f_2$ | $f_3$ | ... | $f_p$ |
Afin de mesurer la dispersion d'une série statistique avec la même unité que les valeurs de la série, on définit l'écart type de la série par $\sigma=\sqrt{V}$.
Calculer sans le mode statistiques de la calculatrice, l'écart type des série statistiques suivantes.
$\bar{x}=\dfrac{-4+0+5+(-1)+7+2+(-2)+3+1+0+(-3)+4}{12}=1$.
$V(x)=\dfrac{(-4-1)^2+(0-1)^2+(5-1)^2+(7-1)^2+(2-1)^2+(-2-1)^2+(3-1)^2+(1-1)^2+(0-1)^2+(-3-1)^2+(4-1)^2}{12}$.
$\sigma_X=\sqrt{V(x)}\approx 3,2$.
Valeurs | 1 | 3 | 4 | 5 | 10 | 13 |
Effectifs | 2 | 3 | 1 | 4 | 5 | 5 |
$\bar{x}=\dfrac{2\times1+3\times 3+1\times 4+4\times 5+5\times 10+5\times 13}{2+3+1+4+5+5}=7,5$.
$V(X)=\sqrt{\dfrac{2\times (1-7.5)^2+3\times (3-7.5)^2+1\times (4-7.5)^2+4\times (5-7.5)^2+5\times(10-7.5)^2+5\times (13-7.5)^2}{2+3+1+4+5+5}}$.
$\sigma_X=\sqrt{V(X)}\approx 4,3$.
Sur le bord d'une route nationnale limitée à 110 km/h les forces de l'ordre ont mesuré les vitesses de voitures sur un point de contrôle suivantes.
Par lecture graphique on obtient $médiane=99.4$, $Q_1=93.4$ et $Q_3=108.1$.
Au cours d'une fabrication de fromages de chèvres, on a relevé les masses suivantes des fromages:
$Masse(g)$ | $[80;85[$ | $[85;90[$ | $[90;95[$ | $[95;100[$ | $[100;105[$ | $[105;110[$ | $[110;115[$ |
$effectifs$ | 25 | 23 | 42 | 29 | 8 | 5 | 2 |
$ECC$ | 25 | 48 | 90 | 119 | 127 | 132 | 134 |
Nous avons $134/2=67$; regardons l'antécédent par la courbe des ECC de $67$ et on trouve $92.5$.
Soit la série statistique suivante: 15; 65;9;5;6;8;36;5;2;68;6;6;6;9;9;8;5;47;4;7;25; 32;65;41;25;325;36;1;0;1;1;25;36;65;9;52;23;25;425; 21;35;21;5;7;88;8;8;8;9;6;3;52;12; 15;78;25.\newline A l'aide de la calculatrice donner les nombres suivant: