[Accueil du site. ] _ [Lycée] _ [GAFAM et comment y échapper.] _ [Sur Gnumeric]


Un problème avec Gnumeric

1°) Ce que l'on veut faire.

1°_a) Principe

Il s'agit de réaliser des calculs de statistiques de niveau terminale.
Gnumeric a été choisi à cause de sa réputation d'être particulièrement adapté à ce domaine.

Sur un tableau de n=38 valeurs, générées aléatoirement, on veut apprendre à calculer les grandeurs habituelles.

Ces calculs seront fait en utilisant les fonctions intégrées de Gnumeric, d'une part, et par un calcul détaillé utilisant les possibilités des tableurs et les formules de définition des grandeurs, d'autre part.

1°_b) Calcul de la moyenne

Ce calcul n'offre pas de difficulté.

On utilise d'une part la fonction :
=average(valeur1 : valeur38),
d'autre part avec la fonction
=sum(valeur1 : valeur38)
la formule bien connue : Moyenne = (somme des valeurs)/(n). avec ici n=38.

N.B.0 : le séparateur pour indiquer l'ensemble des valeurs de la première à la dernière est comme souvent, le double point :.

N.B.1 : j'ai essayé d'utiliser MathML, mais cela ne fonctionne pas dans les navigateurs Falkon et lynx.
Je craignait donc que cela soit moins accéssible pour les mal-voyants et les gnous furieux.

Essai avec MathML, qui ne fonctionne bien que dans Firefox :

Moyenne = valeurs (n)

À l'avenir je vais tenter d'utiliser la bibliothèque MinMathJS écrite par Eric Leydet:
http://progmath.free.fr/minmathjs/index.html
http://eleydet.free.fr/mmjs_formule.zip

1°_c) Calcul de la variance

Là aussi, 2 calculs,
d'une part la fonction intégrée :
=var(valeur1 : valeur38),
d'autre par l'application pas-à-pas de la définition, à savoir : la moyenne des carrés des écarts à la moyenne (wikipedia)
Pour cela un calcul pas à pas, par colonnes à été effectué.

formule mathématique de la variance

1°_d) Calcul de l'écart type

On utilisera d'une part la fonction :
=stdev(valeur1 : valeur38)
d'autre part simplement la racine carrée de la variance préalablement calculée.

formule mathématique de calcul de l'écart type

2°) Les tableaux de valeurs

2°_a) Les valeurs initiales

Tout d'abord, une première colonne avec la valeur de l'indice i est générée très basiquement par un copié collé verticale de la formule
[=i+1]
de haut en bas, la première case étant remplie par la valeur 1.
Cette première colonne ne sert pas vraiment dans les calculs.

La seconde colonne, avec les valeurs de xi est générée par la fonction de production de valeurs pseudo aléatoires rand() (sans argument) de gnumeric.
= rand()*2 + 1
On devine que la moyenne sera proche de 2.

2°_b) Les valeurs intermédiaires

Dans une colonne voisine on calcule l'écart à la moyenne pour chaque ligne, donc pour chaque valeur de xi
puis dans une quatrième colonne on calcule le carré de la valeur précédente avec la fonction :
= power(xi,2).

Oui. Nous avançons prudement, étape par étape.

Cela donne ce tableau.

ixi(Moyenne-xi)au carré
11,051341787182161,035850468856571,07298619383038
22,09439314499355-0,007200888954819635,18528017396433E-05
32,1777828947957-0,09059063875697020,00820666383039586
41,231292405698150,8558998503405840,732564553813035
52,070336666866740,0168555891719930,000284110886335009
62,25192367510261-0,1647314190638790,0271364404267993
72,876041701818-0,7888494457792640,622283448106251
82,79969549165133-0,7125032356125950,507660860758417
92,26307805248688-0,1758857964481480,0309358133921992
101,598153344176210,4890389118625210,239159057315678
112,5855763642713-0,4983841082325680,248386719338772
121,104585002531610,9826072535071240,965517014644813
132,4527635901429-0,3655713341041640,133642400318698
142,46583060909696-0,3786383530582270,143367002406647
152,64871715918448-0,561524903145740,315310216852833
162,52757553171466-0,4403832756759220,193937429495055
172,91011714464862-0,8229248886098830,677205372293589
181,870407323612120,2167849324266160,0469957069272124
191,012896465895691,074295790143051,15411144471908
202,72670000589001-0,6395077498512760,408970162119843
212,028828706106340,05836354993239420,00340630396071107
221,024923299541211,062268956497521,12841533593833
231,794042089757350,2931501662813820,0859370199908019
241,380137665584120,7070545904546130,499926193882941
252,59746576017292-0,5102735041341820,260379049021377
262,52920255914262-0,4420103031038880,195373108049991
272,053142901102020,03404935493671560,00115935857160644
282,79350973423918-0,7063174782004480,49888438001144
291,653795730304160,4333965257345790,187832548518804
302,21035884630705-0,1231665902683170,0151700089583234
311,717650911957120,3695413440816120,136560804985645
322,40368853960762-0,3164962835688810,100169897512914
331,229707308494550,8574849475441870,735280435264857
342,42928356053291-0,3420913044941780,117026460610528
352,1140907003127-0,02689844427396390,000723526304359543
362,86115160936014-0,7739593533214010,599013080593681
371,598803251266660,488389004772070,238523819982253
382,17431419392354-0,08712193788480470,00759023206080377

3°) Résultats des calculs

C'est là qu'apparait une bizarerie subtile.

3°_a) À la main à l'ancienne (comme la baguette de pain bio)

Le calcul à la main à partir des formules donne :

iMoyenne _ _ Variance
_somme des valeurs/38 _ _moyenne de la colonne des carrés
_2,0871922560387346 _ _ 0,3247390533815036

N.B.2 : On retrouve les mêmes valeurs en exploitant la fonction average (moyenne).

Puis pour obtenir l'écart type, il suffit de faire la racine carrée de la variance.
=sqrt(variance), ce qui donne σ= 0,5698588012670364.

3°_b) les résultats des fonctions intégrées

Mais l'utilisation des fonctions
=var(valeur1 : valeur38) (variance) et
=stdev(valeur1 : valeur38) (écart type), ne donne pas les mêmes résultats !

Par ces fonctions directes on a :

Variance Écart type
=var(valeur1 : valeur38)=stdev(valeur1 : valeur38)
0,33351578455397670,5775082549660885

Ce sont des valeurs légèrement supérieures, donc résultats d'une division par un dénominateur inférieur à 38.
Une vérification rapide permet de constater que pour les fonctions intégrées, le dénominateur utilisé est 37, soit n-1 dans les formules.

En passant par le menu [Statistiques]
puis [Statistiques descriptives],
et de nouveau [Statistiques descriptives],
on dévoile une fenètre qui déclenche le calcul de l'ensemble des grandeurs statistiques communément demandées.

menu de gnumeric

fenêtre des calculs statistiques communs

On retrouve les valeurs des fonctions var et stdev en 1/(n-1).

N.B.3 : Les fonction correspondantes de LibreOffice Calc var et ecartype donnent les mêmes résultats en 1/(n-1).

N.B.4 : Un peu de recherche dans certains livres de physique de préparation au bac donne effectivement des formules d'écart type sur (n-1) au lieu de n sans qu'aucune explication ne soit donnée.

3°_c) un bout d'explication

Après enquête, il s'avère que les formules de variance et écart type en 1/n correspondent à l'analyse d'un tableau d'une population complète de valeurs, ce qui est bien dans un exercice de mathématique de lycée,
tandis que les formules en 1/(n-1) correspondent à l'étude d'un échantillonage de valeurs prélevées sur une population, ou un phénomène, donc par nature un tableau incomplet.

Des mathématiciens plus compétents que l'auteur de cette page en on décidé ainsi. Ils devaient avoir de bonnes raisons pour cela, que nous ne contesterons pas.

L'un d'entre eux fait quelques remarques : ici

4°) Un bout de solution

Dans le tableur gnumeric, sur une population complète, il faut donc utiliser en lieu et place de var et stdev, les fonctions
varp et stdevp
dont le p final signifie bien qu'elles s'appliquent à des populations.


Liste des fonctions de gnumeric évoquées

Génération de nombres aléatoires

=rand()
sans argument.

Somme des valeurs d'un tableau

=sum(valeur1 : valeurn)

Moyenne des valeurs d'un tableau

=average(valeur1 : valeurn)

Mise à la puissance

=power(a,b).
Met a à la puissance b => ab.

Racine carrée

=sqrt(x). Donne x1/2

Variance d'une population

=varp(valeur1 : valeurn).
Formule en 1/n pour un tableau complet d'exercice de math.

Écart type d'une population

=stdevp(valeur1 : valeurn).
Formule en 1/n pour un tableau complet.

Et aussi

Factoriel de n (n!)

=fact(n).


[Accueil du site. ] _ [Lycée] _ [GAFAM et commen y échapper.]

Page validée W3C