Volumen 12 N° 2
Año 2017


Rev. Obstet. Ginecol.- Hosp. Santiago Oriente Dr. Luis Tisné Brousse. 2015; 10(1): 17-21
Artículo de Revisión

Significado de la media y desviación estándar poblacional

Sócrates Aedo M.1, Gabriel Cavada Ch., Gabriel Aedo I3
1Departamento de Obstetricia y Ginecología Campus Oriente de Peñalolén, Facultad de Medicina, Universidad de Chile. , 3Alumno Medicina. Facultad de Medicina, Universidad de Chile..

Resumen

La media poblacional (μ) es un número creado, no necesariamente observado, que establece un valor al cual todos los valores de una variable cuantitativa se encuentran a una mínima distancia; siendo la desviación estándar poblacional (σ) el valor promedio de todas las observaciones a μ. Se realiza una demostración matemática a fin de obtener fórmulas para cálculo de μ y σ.

PALABRAS CLAVE: Media, desviación estándar poblacional.

Summary

The population mean (μ) is a created number, not necessarily observed, that provides a value to which all values of a quantitative variable are at a distance minimal; while population standard deviation (σ) is the average value of all observations to μ. It is performed mathematical demonstration for obtain fórmulas calculating for μ and σ.

KEY WORDS: Mean, standard deviation population.

Media y desviación estándar en variables numéricas

Desde muy pequeños nos enseñaron el teorema de Pitágoras, que establecía que para todo triángulo rectángulo la suma de sus catetos al cuadrado resultaba en la hipotenusa al cuadrado, lo que se observa en la Figura 11.

 

Supongamos, que tenemos 2 puntos en el espacio de 2 planos, digamos los puntos “1” y P, lo que podríamos graficar en Figura 2. Para obtener la distancia (d) del punto “1” (coordenadas X1 e Y1) al punto “P” (coordenadas XP e YP), podríamos ocupar el teorema de Pitágoras con lo cual dicha distancia cuadrática sería:

 

d2 = (Xp – X1)2 + (Yp – Y1)2

 

Si a esta distancia le sacamos la raíz cuadrada obtenemos, la distancia d que buscamos:

 

 

d = √(Xp – X1)2 + (Yp – Y1)2    

 

Supongamos ahora que el interés es sumar las distancias de los puntos “1” a “p” (d1) y “2” a “p” (d2), de acuerdo a Figura 3. Y utilizando nuevamente el teorema de Pitágoras obtenemos la distancia cuadrática d1 y d2:

 

d 2 = (X1 – Xp)2 + (Y1 – Yp)2

   1

 

d 2 = (X2 – Xp)2 + (Y2 – Yp)2

   2

 

Si sumamos ambas distancias cuadráticas (d1+d2) obtenemos:

 

 

d 2 = d 2 + d 2 = (X1 – Xp)2 + (Y1 – Yp)2 + (X2 – Xp)2 + (Y2 – Yp)2

           1         1

 

d 2 = d2 + d2 + ... + d 2 

          1      2                   n

 

= (X1 – Xp)2 + (Y1 – Yp)2 + (X2 – Yp)2 + (Y2 – Yp)2 + … + (Xn – Xp)2 + (Yn – Yp)2

 

Por tanto si deseamos conocer la suma de las distancias de todos los puntos a un punto “P” podemos resumirla como:

 

d = √d 2 + d 2 + … + d 2 

          1         2                   n

 

= √(X1–Xp)2 + (Y1–Yp)2 + (X2–Yp)2 + (Y2–Yp)2 + … + (Xn–Xp)2 + (Yn–Yp)2

 

Supongamos que solo estamos trabajando en un plano, lo que significa que todas las coordenadas “y” son iguales a cero, y por tanto la expresión anterior se reduce a:

 

d = √d 2 + d 2 + … + d

          1       2                    n

 

= (X1 – Xp)2 + (X2 – Xp)2 + … + (Xn – Xp)2

 

Lo que en forma cuadrática sería:

 

 

d = d2 + d2 + … + d 2 = (X1 – Xp)2 + (X2 – Xp)2 + … + (Xn – Xp)2

        1     2              n  

 

La expresión anterior corresponde a la suma de las distancias cuadráticas de diferentes puntos a un punto denominado “P”, y la idea sería encontrar qué valor tiene que poseer la coordenada “Xp” de este punto, de tal forma de minimizar la distancia de todos los demás puntos a este punto “P”.

 

Para poder calcularlo debemos derivar2 la expresión anterior e igualar a cero y luego despejar la respectiva incógnita “XP”.

 

Pero de donde viene esta idea, para ello observemos la función (Y) = X2, en la Figura 4; para esta función el mínimo valor de “y” ocurre, cuando “x” es igual a cero.

 

Para poder obtener el mínimo de la función ƒ (y) = Y = X2

además del método gráfico ya señalado; se puede realizar de forma analítica, lo que consistiría en derivar la función e igualarla a cero, lo que presento a continuación:

 

d ƒ (y) = d (X2)

_____      ______       =     2X

 dX           dX

 

 

Lo anterior es la derivada de la función, si la igualamos a cero obtenemos: 2X = 0 => X = 0

 

Como podemos observar tanto por método gráfico como analítico la función anterior tiene un mínimo y éste es igual a cero.

 

Volvamos ahora sobre nuestra función cuadrática, que en síntesis es igual aunque con más términos que la función X2:

 

d 2 = d 2 + d 2 + ... + d 2 = (X1 – XP)2 + (X2 – Xμ)2 + ... + (Xn – Xμ)2

           1       2              

 

La idea como dijimos anteriormente es determinar un punto XP en que todas las distancias de los diferentes puntos sean las menores posibles, a este punto XP. Para ello, a continuación, en forma analítica, derivamos e igualamos a cero la función señalada y luego despejamos XP.

 

Aquí está la derivada:      d(d2)       

                                      ____         = –2 (X1 – Xy) – 2(X2 – Xμ) – ... –2(Xn – XP) = 0

                                      dXP

 

Ahora igualamos a cero:    –2X1 + 2Xμ – 2X2 + 2XP – 2X3 + 2XP ... –2Xn + 2XP = 0

 

 

Despejamos Xp   2nXP = 2(X1 + X2 + X3 + ... + XP)                    X1 + X2 + X3 +... + Xμ   =   Σn       Xi

                                                                                                                                              i= 1   

                                                                                 Xp  =          __________________          _______

                                                                                                                 n                             n

 

Pero sorpresa ¿quién es Xp? es aquel punto de todos los puntos de una colección (no necesariamente observado), que ocupa el centro de masas de la colección de puntos; en que la distancia de todos los demás puntos a él es la mínima posible. Y si observamos con detención es el llamado “Promedio” o “Media” poblacional y que se representa por “μ”. La utilidad de este promedio como medida resumen de una variable determinada requiere que dicha variables sea de naturaleza cuantitativa, pues su construcción asume como hemos visto atributos numéricos3,4.

 

Ahora bien supongamos que obtenemos el promedio de la suma de las distancias cuadráticas, lo que sería

 

d2                 d2 + d2 +... + d2 = (X1 – XP)2 + (X2 – Xp)2 + ... + (Xn – XP)2

__  =          1     2        n

                  _________      ___________________________  

n                    n                                          n

 


La expresión anterior podemos también escribirla como:              Σn    (Xi – x)2

                                                                                                  i=1

                                                                                   σ2=      ____________

                                                                                                         n

 

Lo que en síntesis representa la varianza (σ2), en otras palabras la varianza es el promedio de las distancias cuadráticas a la media.

 

Si estimamos la raíz cuadrada de la varianza, dejamos de usar unidades cuadráticas y usamos la medida en que observamos la variable. Y así cuando calculamos la raíz cuadrada de la varianza estamos transformando este promedio de distancias cuadráticas a la media a unidades no cuadráticas, denominado a esto desviación estándar.

 

En suma la desviación estándar (σ) es la distancia promedio de una colección de puntos a un punto denominado media. Su representación matemática es:

 

σ = √  Σn    (Xi – x)2

            i=1

        ___________

                  n

 

Aplicación concepto media y desviación estándar a variable indicadora

En matemáticas, una función indicadora o función característica, es una regla que asigna a un elemento determinado el valor cero en caso de ausencia y uno si está presente para un conjunto determinado5. Formalmente esto se diría como: sea X un conjunto arbitrario pero fijo. Para cada A C X, la función característica de A es la función 

 

ΨA: X {0,1}  definida por Ψ(X) = {    1 si X ∈ A

                                                    0 si X ∉ A

 

Un ejemplo de función indicadora sería la presencia de metrorragia en mujeres posmenopáusicas, según esta regla, a cada mujer posmenopáusica, se asigna el valor 1 cuando está presente; y cero si está ausente.

 

¿Qué es una proporción sino la suma de ceros y unos dividido por el total de sujetos? Tomemos un ejemplo, tomamos una muestra de 10 mujeres posmenopáusicas y procedemos a determinar la presencia de metrorragia. Así tenemos la Tabla 1 que para el ejemplo anterior decimos que 2 de 10 mujeres presentan metrorragia o sea 0,2% o 20%. En suma lo que estamos estimando es un promedio.

 

Por tanto la proporción de éxitos (llamémosle éxito a la presencia de metrorragia), sería igual a p =  Σn     Xi

                                                                                                                                                    i=1

                                                                                                                                                 _______

                                                                                                                                                      n

 

Ahora reconsideremos la fórmula de la varianza:  σ2 = Σn      (Xi – x)2

    i= 1

       _____________

n

 

Si procedemos a hacer un arreglo algebraico tenemos que:  σ2 =  Σn      (Xi – x)2                     Σn         (X2 – 2Xi x + x2)

   i= 1                              i = 1        i

____________         =     _____________________

  n                                            n

 

 

 

σ2 = Σn      X2      __     Σn       (2Xi X)     +     Σn       x2

          i=1       i                   i= 1                            i= 1

 

       ________           __________       _________

             n                          n                     n

 

 

 

Ahora bien sin pensamos que lo si los Xi toman valor 0 ó 1 tenemos que los son 

Σn        X 2

    i=1         i

 

solos los 1 al cuadrado lo que es igual

 

Σ

 

 

 

(los ceros se eliminan), por tanto esta expresión es igual a y dado que , tenemos entonces que . Si sustituimos las expresiones anteriores tenemos que: La expresión q = 1 – p corresponde a los fracasos. Para el ejemplo, si p = 20% ó 0,2 eran las aquellas mujeres con metrorragia, en cambio los fracasos son aquellas sin metrorragia o sea q = 1 – p = 1 – 0,2 = 0,8. Si remplazamos q = 1 – p, en la expresión anterior obtenemos que: σ= p – p2 = p(1 – p) = pq En suma obtenemos que la varianza cuando se trata de una población constituida por valores cero y unos; su valor corresponde a la multiplicación entre la proporción de éxito y la proporción de fracasos. En suma tenemos entonces que si la varianza para una proporción corresponde a: σ= pq, es inmediato que la desviación estándar corresponde a σ = √pq.

 

En síntesis la desviación estándar para una proporción es lo mismo que la desviación estándar para un promedio, pues una proporción es en verdad un promedio de variables indicadoras. En resumen hemos establecido los valores de la media (μ), varianza (σ2) y desviación estándar (σ) poblacionales, o sea medidas que resumen los valores observados para una población.

Bibliografía

1. Barroso C, Gavilán J. Diversas perspectivas del Teorema de Pitágoras. Epsilon. 2001;50:251-283. Disponible en: http://personal. us.es/rbarroso (Consultado el 1 de octubre de 2014).

2. Lars on R, Hostetler R, Edwards B. En su: Cálculo I. Octava edición. México, Editorial McGraw-Hill/interamericana, 2006; pp. 95-162.

3. Aedo S. El uso y abuso de la media aritmética (parte 1). Rev Obstet Ginecol Hosp Santiago Oriente Dr. Luis Tisné Brousse 2007; 2(2): 181-2.

4. Aedo S. El uso y abuso de la media aritmética (parte 2). Rev Obstet Ginecol Hosp Santiago Oriente Dr. Luis Tisné Brousse 2007; 2(3): 269-70.

5. Espin osa R. Capitulo III Relaciones y funciones. En su: Matemáticas discretas. Primera edición. México, Editorial Alfaomega, 2010; pp. 98-146.

 

Lecturas 1590
Descargas 0

Imágenes

Figura 1. Teorema de Pitágoras, la suma de catetos (X e Y) alcuadrado da como resultado la hipoten.

Figura 2. Cálculo distancia entre 2 puntos del espacio en euclidiano en 2 dimensiones..

Figura 3. Cálculo suma de 2 distancias entre puntos 1 y 2 del espacio euclidiano..

Figura 4. Grafica función f(y) = Y = X2, valor mínimo en X=0..

Tabla 1. variable indicador, metrorragia en 10 mujeres.