Beruflich Dokumente
Kultur Dokumente
De Wikipedia, la enciclopedia libre Saltar a: navegacin, bsqueda Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).
Contenido
1 Rango estadstico o 1.1 Requisitos del rango 1.1.1 Ejemplo 2 Medio rango o 2.1 Ejemplo 3 Varianza o 3.1 Propiedades 4 Desviacin tpica o 4.1 Desviacin tpica muestral o 4.2 Desviacin tpica poblacional 4.2.1 Ejemplo 5 Covarianza 6 Coeficiente de Correlacin de Pearson o 6.1 Propiedades 6.1.1 Ejemplo 7 Vase tambin
Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo
[editar] Ejemplo
Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de: Rango = 5
[editar] Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviendolo mediante la correspondiente frmula sera:
[editar] Varianza
La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, la raz cuadrada de las desviaciones .:
[editar] Propiedades
La varianza es siempre positiva o 0: Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica.
Yi = Xi + k c
Si a los dato de la distribucin les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.
[editar] Ejemplo Con Scilab este clculo se hace de la siguiente manera: QUE
-->x= [17 14 2 5 8 7 6 8 5 4 3 15 9] x = 17. 15. 9. -->stdev(x) ans = 4.716311 --> 14. 2. 5. 8. 7. 6. 8. 5. 4. 3.
Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego con el comando stdev se hallar la desviacin tpica.
[editar] Covarianza
La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones estn relacionadas entre s. La formulacin clsica, se simboliza por la letra griega sigma () cuando ha sido calculada en la poblacin. Si se obtiene sobre una muestra, se designa por la letra "sxy". La formula suele aparecer expresada como:
Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razn (variables cuantitativas). La expresin se resuelve promediando el producto de las puntuaciones diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este estadstico, refleja la relacin lineal que existe entre dos variables. El resultado numrico fluctua entre los rangos de +infinito a -infinito. Al no tener unos lmites establecidos no puede determinarse el grado de relacin lineal que existe entre las dos variables, solo es posible ver la tendencia.
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:
[editar] Propiedades
El coeficiente de correlacin, r, presenta valores entre 1 y +1. Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est muy dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin. Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente positiva, ser creciente. Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente negativa: es decreciente.
[editar] Ejemplo Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre) -->x=[2.5 7.5 12.5 17.5] Vector de datos X
x = 2.5 7.5 12.5 17.5
-->fre=[.03 .12 .07;.02 .13 .11;.01 .13 .14;.01 .09 .14] Matriz de frecuencias
fre = 0.03 0.02 0.01 0.01 0.12 0.13 0.13 0.09 0.07 0.11 0.14 0.14
Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin.
R a n g o o r e c o rr i d o
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
Desviacin media
La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica.
Di = x - x
La
desviacin
media
es
la
media
aritmtica
de
los
valores
Ejemplo
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo
xi
fi
xi fi
|x - x|
|x - x| fi
[10, 15)
12.5
37.5
9.286
27.858
[15, 20)
17.5
87.5
4.286
21.43
[20, 25)
22.5
157.5
0.714
4.998
[25, 30)
27.5
110
5.714
22.856
[30, 35)
32.5
65
10.174
21.428
21
457.5
98.57
Varianza
La varianza es la media aritmtica del cuadrado de las
Para
simplificar
el
clculo
de
la
varianza
vamos
utilizar
las
Ejercicios de varianza
9, 3, 8, 8, 9, 8, 9, 18
xi
fi
xi fi
xi2 fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
Propiedades de la varianza
1 La varianza ser siempre un valor positivo o cero , en el caso de
que las puntuaciones sean iguales.
Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.
Es
decir,
la
raz
cuadrada
de
la
media
de
los
cuadrados
de
las
puntuaciones de desviacin.
Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
9, 3, 8, 8, 9, 8, 9, 18
xi
fi
xi fi
xi2 fi
[10, 20)
15
15
225
[20, 30)
25
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
405
18 225
[50, 60)
55
440
24 200
[60,70)
65
260
16 900
[70, 80)
75
150
11 250
42
1 820
88 050
MEDIDAS DE DISPERSIN:
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Breve Introduccin Rango Concepto de desviacin Desviacin Media Varianza Desviacin Tpica Cuasivarianza Cuasi Desviacin tpica Coeficiente de Variacin Ejemplo
Breve Introduccin Hasta el momento hemos estudiado los valores centrales de la distribucin, pero tambin es importante conocer si los valores en general estn cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersin. Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribucin,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayora de los casos, pero indudablemente es muy fcil de calcular. Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media. Desviacin: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di . No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos siempre va a ser 0.
Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas. Para resolver este problema, tenemos dos caminos: Tomar el valor absoluto de las desviaciones. Desviacin media Elevar al cuadrado las desviaciones. Varianza.
Desviacin media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por d m.
Varianza:
o tambin por
Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm 2.
Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente. Cuasivarianza: Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N-1, la representaremos por o y la calcularemos de la siguiente forma:
Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez modificados. Adems, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersin. Pues no es posible comparar unidades de distinto tipo. Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida. Coeficiente de Variacin: Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.
Ejemplo
Veamos por ltimo un ejemplo de cmo se calculan todas estas medidas.
45 55 65 75 85
55 65 75 85 95 N=
6 10 19 11 4 50
6 16 35 46 50
50 60 70 80 90
= Dm=
C.V.=
MEDIDAS DE DISPERSIN
Contenido:
Poblacin y muestra Amplitud o recorrido Desviacin media. desviacin estndard y varianza Coeficiente de variacin Clculo de la varianza en una tabla de frecuencias
POBLACIN Y MUESTRA
Si un conjunto de datos consta de todas las observaciones concebibles (o hipotticamente posibles) de cierto fenmeno, se denomina poblacin; si un conjunto de datos consta solamente de una parte de estas observaciones se conoce como muestra por lo que una muestra debe ser un subconjunto de la poblacin. Por ejemplo: Un peridico local imprime un artculo poltico para todos sus lectores. El peridico desea considerar las actitudes de 200 lectores hacia el artculo y conocer sus puntos de vista. De acuerdo a lo planteado en el ejemplo el total de los lectores representara la poblacin a la que le llega el artculo y los 200 lectores seleccionados representaran la muestra para conocer su punto de vista. Se utilizar la palabra "muestra" solo con relacin a datos que se puedan utilizar en forma razonable para hacer generalizaciones acerca de la poblacin de la cual provinieron. En este sentido ms tcnico, no son aceptables muchos conjuntos de datos que por lo comn se denominan muestras. Como el trmino estadstica(o) se introdujo con relacin a los datos de muestra, se agregar que tambin existe un nombre para las descripciones estadsticas de poblaciones llamadas parmetros. Como se observar, la distincin entre estadstica y parmetros servir para simplificar nuestro lenguaje. En realidad, hasta se usarn smbolos diferentes de medidas estadsticas, segn se utilicen para describir muestras o poblaciones. Para poblaciones se utilizarn letras griegas y para muestras, latinas.
Por ejemplo para representar la media o el promedio de una muestra se utiliz la frmula:
La media de una poblacin de N elementos se define en la misma forma. Es la suma de los N elementos, dividida entre el tamao de la poblacin N.
En las frmulas anteriores se representa a la media de la muestra por media de la poblacin por para identificarlas entre s.
y la
MEDIDAS DE DISPERSIN
En secciones anteriores se ha discutido sobre tres medidas descriptivas del centro. Sin embargo, estas medidas no son suficientes para caracterizar la distribucin, puesto que otro aspecto que debe se tomar en cuenta es la variabilidad de las observaciones. Con el propsito de medir la dispersin o variabilidad, se discutirn en este apartado las medidas de: Amplitud (llamada tambin rango o recorrido), Desviacin media, Varianza, Desviacin Estndar (tambin llamada desviacin tpica) y Coeficiente de Variacin.
Amplitud o recorrido
La medida de dispersin ms simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su nica ventaja es la sencillez con que se calcula. Es comn que se use tambin el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numrico en el mismo. Por ejemplo: Supngase que en un hospital el pulso de cada paciente se mide tres veces al da y que cierto da los registros de dos pacientes muestran: Paciente 1: 73 77 74 Paciente 2: 64 90 73 Cul es la Amplitud en pulsaciones para cada paciente? Para calcular la amplitud de los datos necesario identificar el valor ms grande y el valor ms pequeo del conjunto de datos de cada uno de los pacientes. Para el Paciente 1: A = 77 73 = 4
Para el Paciente 2: A = 90 64 = 26
La amplitud es una medida de dispersin cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:
En su clculo slo intervienen dos elementos del conjunto. Al aumentar el nmero de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamao del
conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que stos sean del mismo tamao.
se denominan las desviaciones de la media y esto sugiere que se podra usar el promedio de estas desviaciones como medida de dispersin en la poblacin. A menos que las X sean todas iguales, algunas de las desviaciones sern positivas y otras negativas, la suma de todas las desviaciones de la media
Como realmente se est interesado en la magnitud de las desviaciones, y no si son positivas o negativas, se pueden ignorar simplemente los signos y definir una medida de variacin en trminos de los valores absolutos de las desviaciones de la media. En realidad, si se suman las desviaciones de la media como si fueran todas positivas o cero y las dividiramos entre N, se obtendra la media estadstica que se denomina desviacin media y se representa por:
Esta medida tiene una apariencia intuitiva, pero debido al valor absoluto, lleva a encontrar dificultades tericas en problemas de inferencia y rara vez se usa. Un mtodo alternativo consiste en trabajar con los cuadrados de las desviaciones de la media, ya que tambin esto eliminar el efecto de los signos. Los cuadrados de nmeros reales no pueden ser negativos y pueden tomar el valor de cero. Por consiguiente, si se promedia las desviaciones cuadradas de la media y se toma la raz cuadrada del resultado (para compensar el hecho de que las desviaciones fuesen cuadradas), se obtiene la Desviacin estndar de la poblacin.
sta medida de variacin se representa por medio de sigma minscula ( ) y al expresar literalmente lo que se ha hecho aqu de manera matemtica, tambin se conoce como la raz de la desviacin cuadrada media. A su cuadrado de se le llama Varianza de la poblacin.
Quiz parezca lgico utilizar la misma frmula con n y sustituidas por N y , para la desviacin estndar de una muestra; pero, esto no es realmente lo que se hace. En lugar de dividir la suma de las desviaciones entre n, se divide entre (n-1) y se define como desviacin estndar de la muestra, que se denota con s como
Su cuadrado s2, se llama la Varianza de la muestra. Al dividir entre n-1 en vez de hacerlo entre n, tiene una buena razn. Si se dividiera entre n y se utilizara s2 como estimacin de es decir, se utilizara la varianza de una muestra para determinar la varianza de la poblacin de la cual provino, el resultado sera demasiado pequeo y esto se corrige al dividir entre n1 en lugar de hacerlo entre n. Si el valor de n es muy grande no importa hacerlo entre n-1 sino que es prctico para definir s como se hizo.
Coeficiente de variacin
Las medidas de dispersin anteriores son todas medidas de variacin absolutas. Una medida de dispersin relativa de los datos, que toma en cuenta su magnitud, est dada por el coeficiente de variacin. El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se obtiene dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa como para la poblacin. Los coeficientes de variacin tienen las siguientes caractersticas: para una muestra y
Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es una medida independiente de las unidades de medicin. Debido a la propiedad anterior el CV es la cantidad ms adecuada para comparar la variabilidad de dos conjuntos de datos. En reas de investigacin donde se tienen datos de experimentos previos, el CV es muy usado para evaluar la precisin de un experimento, comparando en CV del experimento en cuestin con los valores del mismo en experiencias anteriores.
Ejemplo: En seis sbados consecutivos un operador de taxis recibi 9, 7, 11, 10, 13 y 7 llamadas a su sitio para su servicio. Calcule:
a. b. c. d. e. f.
9 7 11 10 13 7
Donde: k es el nmero de intervalos de clase Xi es el valor medio de cada clase fi es el valor de la frecuencia absoluta
Al retomar el ejemplo de la tabla de distribucin de frecuencias de Precipitacin pluvial promedio anual en Baja California 1905 a 1994 en pulgadas.
intervalos (07.7 , 11.7] (11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]
Punto medio de clase (mi) 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL |||| |
Conteo ||||| ||||| ||||| ||| ||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| |||
fi 18 13 24 17 13 0 4 1 90
fAi 18 31 55 72 85 85 89 90 90
FRi
FRAi
18/90 18/90 13/90 31/90 24/90 55/90 17/90 72/90 13/90 85/90 0/90 4/90 1/90 85/90 89/90 90/90
90/90 90/90
Calcular s2 y s.
mi 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL 94.09 187.69 313.29 470.89 660.49 882.09 1135.69 1421.29 #####
fi 18 13 24 17 13 0 4 1 90
fimi 174.6 178.1 424.8 368.9 334.1 0 134.8 37.7 1653.0 1693.62 2439.97 7518.96 8005.13 8586.37 0 4542.76 1421.29 34208.10
MEDIDAS DE DISPERSION Son medidas que representan el grado en el que los valores numricos tienden a extenderse alrededor de un valor medio. Recorrido Es la diferencia entre el mayor y menor valor de una variable estadstica.
Varianza. Una forma natural de medir la dispersin en torno a la media es calcular la media de las diferencias:
pero como habr valores por encima y por debajo de la media que se compensarn, calcularemos mejor el cuadrado de las diferencias. Se define as varianza de una variable estadstica, como la media de los cuadrados de las desviaciones de sus valores respecto a su media. Se representa por s2:
Se distingue aqu entre los casos de variable estadstica y variable aleatoria. En el primer caso, tendremos una serie de valores concretos, de los que vamos a calcular su varianza, la varianza muestral. La frmula es la que se acaba de expresar. En el caso de variable aleatoria, estaremos calculando una varianza estimada, ya que no estamos tomando muestras de un conjunto de datos inmenso y por lo tanto la media y varianza son estimadas, no conocidas. La expresin que la define cambia en un pequeo detalle: en vez de dividir el resultado de la suma entre (n-1), se divide entre (n), as:
Al igual que con la varianza, se distinguen los casos de variables aleatorias y estadsticas. En esta frmula se expresa tambin la desviacin tpica muestral, que es la que usaremos. Coeficiente de variacin. Es el cociente entre la desviacin tpica y la media. Eliminamos con esta medida la influencia de la escala escogida en las mediciones efectuadas.
Fuente: EFE El Gobierno ecuatoriano prepara un reglamento para proteger y aprovechar su rica biodiversidad, dijo este sbado el presidente de la Repblica, Rafael Correa, quien asegur que en esta tarea podra estar "el futuro del pas". Adems, indic que ese reglamento impedir la "piratera" o robo de informacin gentica de recursos naturales y de los conocimientos ancestrales que disponen los pueblos indgenas ecuatorianos. "Cunta piratera se ha hecho con las plantas de nuestra Amazona, con los saberes ancestrales de nuestros pueblos!", se lament Correa y dijo que el reglamento sobre biodiversidad es "un paso importante" en la proteccin de este tipo de recursos. Adems, seal que la normativa que se prepara se ampara en una legislacin aprobada por la Comunidad Andina (CAN), de la cual forma parte su pas junto a Bolivia, Colombia y Per. Explic que los estudios preliminares dan cuenta de que, "con slo el 0,17% de la superficie terrestre, Ecuador tiene el 10% de la biodiversidad mundial" y que su pas ocupa el sexto lugar en el mundo en biodiversidad terrestre. Si a ello se suma la biodiversidad marina, muy poco investigada en Ecuador, el pas se convertira en el "ms biodiverso del mundo", afirm el mandatario. "Aqu est el futuro del pas", que tiene unas diez zonas con extraordinaria riqueza gentica y de reserva de biosfera, aadi el mandatario en su habitual programa sabatino. Adems, seal que slo se conoce el 3% de la biodiversidad que posee Ecuador y record que ms del 50% de las medicinas recetadas en Estados Unidos se originan directa o indirectamente en fuentes naturales. "Con nuestra cantidad de plantas podramos ser un importante" abastecedor de medicinas, aadi Correa y dijo que segn los estudios "actualmente se conocen 1,8 millones de especies en el mundo" y que "se calcula que podra haber hasta 10 millones de especies por descubrir". "Se imaginan todo el conocimiento que est ah?" y cuyo descubrimiento podra dar respuestas a los problemas de la salud, de la alimentacin actuales, agreg el gobernante. Por ello, pidi a las carteras del Gobierno encargadas de este captulo que refuercen los estudios y profundicen la educacin y capacitacin en el tema para tratar de "aprovechar al mximo nuestra biodiversidad".
Balanza comercial del Ecuador registra supervit de USD 6.5 millones en lo que va del 2011
Domingo 11 de Septiembre de 2011 10:55
A-A+
Segn estadsticas del Banco Central del Ecuador (BCE) la balanza comercial cerr con un ligero supervit de USD 6.5 millones en los primeros 7 meses del 2011. Esto se debe al aumento de las exportaciones petroleras segn el BCE.
Pese a las restricciones y salvaguardas impuestas por el gobierno desde el ao 2009, el saldo de las exportaciones netas en varias pocas registr valores negativos, pese a los esfuerzos de las autoridades para contrarrestar esa tendencia. Las exportaciones entre los meses de enero y julio sumaron unos USD 12.676 millones, mientras que las importaciones ascendieron a los USD 12.669 millones, segn el BCE. El gobierno anunci la obligacin de solicitar licencias a ciertos productos como vehculos, partes para ensamblaje de autos, refrigeradores, neumticos y celulares, en un nuevo intento de reducir las importaciones que afectan la balanza comercial ecuatoriana.