Imagina que tens les dades d'un dia de tres formes distintes:
+ Un valor de temperatura cada 5 minuts: 12 per hora x 24 hores = 288 valors
+ Un valor de temperatura cada 15 minuts: 4 per hora x 24 hores = 96 valors
+ Dos valors per a tot el dia: la màxima i la mínima = 2 valors
Si agafem un dia qualsevol d'aquesta manera i calculem les mitjanes
+ Dels 288 valors, a l'exemple ens ix: 8,65º
+ Dels 96 valors: 8,78º
+ El promig de la màxima i la mínima (la mitjana convencional): 8,09º
A la gràfica es veu l'exemple millor
Quina és la mesura més precisa? naturalment cada 5' ens ofereix una dada més fiable perquè el mostreig de valors és molt més alt i per tant l'error es redueix sustancialment (sobretot en canvis bruscos als valors).
De totes formes, des del punt de vista de càlcul, la tercera opció simplifica enormement la faena i simplifica el procés.
La precisió de càlcul de mitjanes diàries amb 288 valors provoca que en un sèrie de 4 anys (p.e.) s'acumulen 420.768 registres i això per a una estació pot ser acceptable amb les màquines actuals. Però per a moltes estacions i amb sèries llargues és una quantitat de dades massa gran per un error mínim (poques vegades es treballa amb dades diàries i les mitjanes mensuals redueixen l'error fins valors despreciables). I en estadística és important tindre en compte que disposar de més dades no és el millor, s'han d'agafar la quantitat imprescindible de dades per a que els resultats siguen consistents... no en calen més.
I diria més, la mitjana no és la mesura més vàlida per a aquests tipus de dades. La mediana ofereix informació més fiable però com ho complica molt més, doncs no es gasta quasi.
No sé si els meteoròlegs opinaran igual, però aquesta és la visió d'un estadístic

[adjunt esborrat per l'administrador]