Annexe 12: Statistique

Moyennes et dispersion

Exemple : Caractéristiques surface et rendement de blé, saisis sur 8 exploitations (série statistique).

Exploitation
No.
Surface de blé
ha
Rendement de blé
dt/exploitation
1 1,0 50
2 1,2 60
3 3,0 132
4 2,0 96
5 1,0 66
6 0,7 35
7 1,2 54
8 1,0 52
Somme 11,1 545
\(xy^*\) 49,10
\(\bar{x}\) 1,39 68,13
\(v_x\) 0,57 973,27
\(s_x\) 0,75 31,20
\(vk_x\) 0,54 0,46
  • Moyenne arithmétique (moyenne) :
    Somme d’une série statistique divisée par le nombre de chiffres de la série.
    La forme mathématique est la suivante :

    \(\bar{X} = \frac{X_1 + X_2 + … + X_n}{n} = \sum\limits_{i=1}^n (X_i)/n\)

    Résultats de l’exemple :
    – Surfaces de blé : \(\bar{x}\) = 1,39 ha
    – Rendements de blé : \(\bar{x}\) = 68,13 dt/ha

  • Variance : moyenne des carrés des écarts de chacune des valeurs d’une série statistique des moyennes arithmétiques simples correspondantes.
    Résultats de l’exemple :
    – Surfaces de blé : vx = 0,57 ha
    – Rendements de blé : vx = 973 dt/ha

    \(v_x = \frac{1}{n – 1} \sum\limits_{i=1}^n (x_i  – \bar{x})^2\)

  • Ecart-type : Racine carrée de la variance.
    Soit \(x\) les valeurs d’une série statistique, l’écart-type se calcule selon la formule suivante :

    \(s_x = \sqrt{\frac{1}{n – 1} \sum\limits_{i=1}^n (x_i  – \bar{x})^2} \)

    Autre façon, plus simple de le calculer :

    \(s_x = \sqrt{\frac{1}{n – 1} \sum\limits_{i=1}^n (x_i ^2) – n_\bar{x}^2} \)

    Résultats de l’exemple :
    – Surfaces de blé : \(s_x\) = 0,75 ha;
    – Rendements de blé : \(s_x\) = 9,73 dt/ha.

  • Coefficient de variation : Relation de l’écart-type par rapport à la moyenne arithmétique.

    \(Vk_x = \frac{S_x}{\bar{X}}\)

    Résultats de l’exemple :
    – Surface de blé : \(vk_x\) = 0,54;
    – Rendement de blé : \(vk_x\) = 0,56.

  • Moyenne pondérée : Somme des valeurs d’observations ou de mesures d’une série statistique, lesquelles sont multipliées chacune par un coefficient (facteur de pondération),le tout divisé par la somme de tous les facteurs de pondération.

    Soit les valeurs observées ou mesurées xi (i de 1 à n) et les coefficients de pondération gi, on obtient la moyenne pondérée selon la formule suivante :

    \(\bar{x}^* = \frac{g_1x_1 + g_2x_2 + … + g_nx_n}{g_1 + g_2 + … + g_n} = \sum\limits_{i=1}^n g_ix_i / \sum\limits_{i=1}^n g_i\)

    Lors d’une pondération, on n’attribue pas la même importance à toutes les observations ou toutes les mesures.

    Par exemple, on veut prendre en compte le fait que certains rendements de blé par unité de surface (valeur y) ont été atteints sur des surfaces de différentes grandeurs (valeur x). On pondère alors la surface (gi = xi) et on obtient, selon la formule précédente l’expression suivante :

    \(\bar{y}/\bar{x}^* = \frac{x_1(y_1/x_1) + x_2(y_2/x_2) + … + x_n(y_n/x_n)}{x_1 + x_2 + … + x_n} \)

    Cette formule peut être simplifiée algébriquement. On obtient alors la moyenne pondérée selon la formule suivante :

    \(\bar{y}/\bar{x}^* = \frac{y_1 + y_2 + … + y_n}{x_1 + x_2 + … x_n} = \sum\limits_{i=1}^n y_i / \sum\limits_{i=1}^n x_i \)

    Résultat exemple :
    – Rendement de blé : \(xy^*\) = 49,1 dt/ha.

Médiane, Mode, Quartiles

  • Médiane : Valeur moyenne d’une série statistique ordonnée en ordre croissant ou décroissant.
  • Mode : Valeur apparaissant le plus fréquemment dans une série statistique.
  • Quartiles : Répartition des grandeurs d’une série statistique en quatre groupes.

Exemple surface de blé (ha) :

Quartile inférieur 50 % des valeurs moyennes Quartile supérieur
x6 x1 x5 x8 x2 x7 x4 x3
0,7 1,0 1,0 1,0 1,2 1,2 2,0 3,0
0,85 1,1 2,5
Moyenne Médiane Moyenne
1,0 1,6
Limite de quartile inférieur Limite de quartile supérieur