Sie sind auf Seite 1von 18

Operador Sumatoria

La sumatoria o sumatorio se emplea para representar la suma de


muchos o infinitos sumandos.

La expresin se lee: "sumatoria de xi, donde i toma los valores de 1 a


n".

La operacin sumatoria se expresa con la letra griega sigma


mayscula .

i es el valor inicial llamado lmite inferior

n es el valor final llamado lmite superior.

Si la sumatoria abarca la totalidad de los valores, su expresin se


puede simplificar:

Es frecuente el uso del operador sumatoria en estadstica.

La suma de las frecuencias absolutas se puede expresar como:

1.

2.

Y la media como:
1.

2.

Ejemplo

En un test realizado a un grupo de 42 personas se han obtenido las


puntuaciones que muestra la tabla. Calcula la media.

Li- Ls xi fi Xi . fi
[10 - 20) 15 1 15
[20 - 30) 25 8 200
[30 - 40) 35 10 350
[40 - 50) 45 9 405
[50 - 60) 55 8 440
[60 - 70) 65 4 260
[70 - 80) 75 2 150

Totales xi= 42 xi.fi = 1 820

Caractersticas Del Valor Central

Las caractersticas del valor central son las siguientes:

Caractersticas de la Media Aritmtica

1.- Es una medida totalmente numrica o sea slo puede calcularse en datos
de caractersticas cuantitativas.

2.- En su clculo se toman en cuenta todos los valores de la variable.

3.- Es lgica desde el punto de vista algebraico.


4.- La media aritmtica es altamente afectada por valores extremos.

5.- No puede ser calculada en distribuciones de frecuencia que tengan clases


abiertas.

6.- La media aritmtica es nica, o sea, un conjunto de datos numricos tiene


una y solo una media aritmtica.

Caractersticas de la Mediana

1.- En su clculo no se incluyen todos los valores de la variable.

2.- La Mediana no es afectada por valores extremos.

3.- Puede ser calculada en distribuciones de frecuencia con clases abiertas.

4.- No es lgica desde el punto de vista algebraico.

Caractersticas de la Moda

1.- En su clculo no se incluyen todos los valores de la variable.

2.- El valor de la moda puede ser afectado grandemente por el mtodo de


designacin de los intervalos de clases.

3.- No est definida algebraicamente.

4.- Puede ser calculada en distribuciones de frecuencia que tengan clases


abiertas.

5.- No es afectada por valores extremos.

Caractersticas de la Media Geomtrica

1.- Se toman en cuenta todos los valores de la variable


2.- Es afectada por valores extremos aunque en menor medida que la media
aritmtica.

3.- La media geomtrica de un nmero y su recproco ser siempre igual a


uno.

4.- No puede ser calculada en distribuciones con clase abiertas.

5.- Es mayormente usada para promediar tazas de cambio, razones y


valores que muestren una progresin geomtrica.

Medidas de Tendencia Central

Media Aritmtica

Media aritmtica o promedio: Es aquella medida que se obtiene


al dividir la suma de todos los valores de una variable por la frecuencia total.
En palabras ms simples, corresponde a la suma de un conjunto de datos
dividida por el nmero total de dichos datos.

Ejemplo 1:

En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3

n = 6 (nmero total de datos)

La media aritmtica de las notas de esa asignatura es 4,8. Este


nmero representa el promedio.
Mediana

Es el valor que ocupa el lugar central de todos los datos cuando stos
estn ordenados de menor a mayor. Es decir divide a la serie en dos partes
iguales en la que el 50% de los datos estn por debajo de la Md y el otro
50% est por encima de ella.

La mediana se representa por Md.

La mediana se puede hallar slo para variables cuantitativas.

Es el valor que ocupa el lugar central de todos los datos cuando stos
estn ordenados de menor a mayor.

Clculo de la mediana

1: Ordenamos los datos de menor a mayor.

2: Si la serie tiene un nmero impar de medidas la mediana es la puntuacin


central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6 Md = 5 ya que es el valor central.

3: Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las


dos puntuaciones centrales.

7, 8, 9, 10, 11, 12 Md = 9.5, ya que es el resultado de la suma de los dos valores


centrales divididos entre dos, es decir:

Md: 9 + 10 = 19 = 9.5

2 2

Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2

Al ordenarlos en forma creciente, es decir de menor a mayor, se


tiene: 1, 2, 4, 5, 8, 9, 10

El 5 corresponde a la Md, porque es el valor central en este conjunto


de datos impares.

Ejemplo 2:

El siguiente conjunto de datos est ordenado en forma decreciente, de


mayor a menor, y corresponde a un conjunto de valores pares, por lo tanto, la
Md ser el promedio de los valores centrales.

21, 19, 18, 15, 13, 11, 10, 9, 5, 3

Md: 13 + 11 = 24 = 12

2 2

Moda

Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un


conjunto de datos; o sea, cual se repite ms.

La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Hallar la moda de la serie de datos:


Xi: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Ejemplo 1:

Determinar la moda en el siguiente conjunto de datos que


corresponden a las edades de nias de un Jardn Infantil.

5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3

La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

Ejemplo 2:

20, 12, 14, 23, 78, 56, 96

En este conjunto de datos no existe ningn valor que se repita, por lo


tanto, este conjunto de valores no tiene moda.

Si en un grupo hay dos o varias puntuaciones con la misma


frecuencia y esa frecuencia es la mxima, la distribucin es bimodal, si son
tres las que ms se repiten ser trimodal y cuando se mayo a cuatro el
nmero de Mo, generalizaremos diciendo que es multimodal o polimodal, es
decir, que tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 (trimodal)

Cuando todas las puntuaciones de un grupo tienen la misma


frecuencia, no hay moda.

2, 2, 3, 3, 6, 6, 9, 9, no hay moda.

Clculo de la moda para datos agrupados


Debemos considerar que todos los intervalos tienen la misma
amplitud. Por tal motivo y para efectos de nuestro curso, consideraremos que
la Mo es el punto medio (xi) del intervalo que presente la mayor frecuencia.
Considerando tambin el caso en que la mayor frecuencia puede
presentarse en ms de un intervalo (como ocurra para los datos no
agrupados) en cuyo caso una distribucin pudiera presentar ms de una
moda.
Ejemplo:
Clases fi
60 - 62 5
63 - 65 18
66 - 68 42
69 - 71 27
72 - 73 8
Totales 100
:

El intervalo en el que se encuentra la mayor frecuencia es en 66 - 68,


donde fi es 42, para determinar la moda de esta distribucin ser necesario
calcular el punto medio de ese intervalo:
Xi = (66 + 68) / 2
Xi= 134 / 2
Xi = 67
Por lo tanto, la moda de esta distribucin es Mo = 67

Medidas de Posicin
Cuartiles
Los cuartiles son medidas estadsticas de posicin que tienen la
propiedad de dividir la serie estadstica en cuatro grupos de nmeros iguales
de trminos.
Los cuartiles son los tres valores de la variable que dividen a
un conjunto de datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50%


y al 75% de los datos.

- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta


parte de los datos.

- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor


que la mitad de los datos.

- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas


partes de los datos.

Q2 coincide con la mediana.

Deciles

Los deciles son los nueve valores que dividen la serie de datos en diez
partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al


90% de los datos.

D5 coincide con la mediana.

Percentiles

Los percentiles son los 99 valores que dividen la serie de datos en 100
partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al


99% de los datos.

P50 coincide con la mediana.


Son 99 valores que dividen en cien partes iguales el conjunto de datos
ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%

Rango Percentil

Medida De Dispersin Y Asimetra

Las medidas de dispersin nos resumen la informacin de la muestra


o serie de datos, dndonos as informacin acerca de la magnitud del
alejamiento de la distribucin de datos en relacin a un valor central o de
concentracin de los datos.

Estas medidas describen la manera como los datos tienden a reunirse


de acuerdo con la frecuencia con que se hallen dentro de la informacin. Su
utilidad radica en la posibilidad de identificar las caractersticas de la
distribucin sin necesidad de generar el grfico.
Sus principales medidas son la Asimetra y la Curtosis.
1. ASIMETRA

Esta medida nos permite identificar si los datos se distribuyen de


forma uniforme alrededor del punto central (Media aritmtica). La asimetra
presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de
forma concisa como estn distribuidos los datos respecto al eje de asimetra.

Se dice que la asimetra es positiva cuando la mayora de los datos se


encuentran por encima del valor de la media aritmtica, la curva es
simtrica cuando se distribuyen aproximadamente la misma cantidad de
valores en ambos lados de la media y se conoce como asimetra
negativa cuando la mayor cantidad de datos se aglomeran en los valores
menores que la media.

Figura
5-1

El Coeficiente de asimetra, se representa mediante la ecuacin


matemtica,

Ecuacin 5-9

Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada


uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada
valor. Los resultados de esta ecuacin se interpretan:

(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe


aproximadamente la misma cantidad de valores a los dos lados de la media.
Este valor es difcil de conseguir por lo que se tiende a tomar los valores que
son cercanos ya sean positivos o negativos ( 0.5).

(g1 > 0): La curva es asimtricamente positiva por lo que los valores
se tienden a reunir ms en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimtricamente negativa por lo que los valores
se tienden a reunir ms en la parte derecha de la media.

Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor


ser la distancia que separa la aglomeracin de los valores con respecto a la
media.

2. CURTOSIS

Esta medida determina el grado de concentracin que presentan los


valores en la regin central de la distribucin. Por medio del Coeficiente de
Curtosis, podemos identificar si existe una gran concentracin de valores
(Leptocrtica), una concentracin normal (Mesocrtica) una baja
concentracin (Platicrtica).

Para calcular el coeficiente de Curtosis se utiliza la ecuacin:

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los


valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los
resultados de esta frmula se interpretan:
(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es
bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se
suelen aceptar los valores cercanos ( 0.5 aprox.).

(g2 > 0) la distribucin es Leptocrtica

(g2 < 0) la distribucin es Platicrtica

Cuando la distribucin de los datos cuenta con un coeficiente de


asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le
denomina Curva Normal. Este criterio es de suma importancia ya que para la
mayora de los procedimientos de la estadstica de inferencia se requiere que
los datos se distribuyan normalmente.

La principal ventaja de la distribucin normal radica en el supuesto que


el 95% de los valores se encuentra dentro de una distancia de dos
desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si tomamos
la media y le sumamos dos veces la desviacin y despus le restamos a la
media dos desviaciones, el 95% de los casos se encontrara dentro del rango
que compongan estos valores.

Figura 5-3

Desde luego, los conceptos vistos hasta aqu, son slo una pequea
introduccin a las principales medidas de Estadstica Descriptiva; es de gran
importancia que los lectores profundicen en estos temas ya que la principal
dificultad del paquete SPSS radica en el desconocimiento de los conceptos
estadsticos.

Dispersin Por Rango O Recorrido

Rango
El rango es la diferencia entre el mayor y el menor de los datos de una
distribucin estadstica.
Frmula de Rango:
Dato ms alto - Dato ms pequeo.
( X2 - X1 )
Interpretacin de Rango:
El Rango lo podremos interpretar como la amplitud existente entre una
serie de datos, es decir, mide cun lejos est el valor ms pequeo y el valor
ms grande de la muestra o poblacin.
Ejemplo de Rango:
Si tenemos una produccin de franelas y sabemos que diariamente se
producen un promedio de 500 franelas, y si un da se produce un mnimo de
415 franelas y otro da se produce un mximo de 573 franelas entonces si
vemos el RANGO de produccin estar entre 158 franelas, es decir,
podemos tener una produccin de 158 franelas a partir del valor mnimo.
Varianza
La varianza es la media aritmtica del cuadrado de las desviaciones
respecto a la media de una distribucin estadstica.

La varianza se representa por .


Dispersin Por Serie

Desviacin Media Y Estndar O Tpica

Desviacin Media

Definicin: Se llama desviacin media a la media aritmtica de los


valores absolutos de las desviaciones respecto a la media.

Clculo de la desviacin media: Sea X una v.e. que toma los


valores con frecuencias absolutas
respectivamente. La desviacin media viene dada por la expresin:

O bien:

Cuanto mayor es la desviacin media ms dispersos o menos concentrados


estn los datos.

Desviacin Estndar O Tpica

La desviacin estndar o desviacin tpica es la raz cuadrada de la varianza.

Es decir, la raz cuadrada de la media de los cuadrados de las


puntuaciones de desviacin.

La desviacin estndar se representa por .


Es la medida de dispersin ms importante y de mayor utilidad
prctica, se representa normalmente por el smbolo (sigma) y es la que
mejor nos da una idea de la variacin de los datos respecto a algunas de las
medidas de tendencia central o posicin. En otras palabras, es el nmero
que nos dice cun alejado estn los datos del valor de centraje o posicin
previamente obtenido.

Frmula de Desviacin Tpica:

Interpretacin de la Desviacin Tpica:

Es una medida de distancia promedio de los valores observados a su


media. La distancia de cada valor a la media se mide tomando el valor
absoluto de la diferencia entre ese valor y la media, es decir, es la distancia
de cada dato respecto a su promedio.

Ejemplo de la Desviacin Tpica:

Por ejemplo, si tenemos una produccin de franelas y sabemos que


diariamente se producen un promedio de 500 franelas, adicionalmente
tenemos tambin que la desviacin es de 25 franelas, tendremos entonces
una mejor comprensin del proceso pues este ltimo nmero nos indica que
diariamente se producen entre 475 y 525 franelas.

Varianza

Es la medida de dispersin de los valores alrededor de la Media.


Caracterstica de una muestra o poblacin que cuantifica su dispersin o
variabilidad. La Varianza tiene unidades al cuadrado de la variable. Su raz
cuadrada positiva es la Desviacin Tpica. Equivale a la dispersin respecto
de la Media en una serie de datos continuos.

Interpretacin de la Varianza:

Esta medida carece de interpretacin.

Ejemplo de la Varianza:

No tiene ejemplos didcticos, la Varianza es ms para fines tericos


que prcticos.

Variacin Relativa Y Coeficiente De Variacin

Coeficiente De Variacin

Es en realidad una medida de dispersin relativa, pero de gran


importancia, y de gran versatilidad, ya que su interpretacin est basada en
porcentajes, y nos da la relacin existente entre la medida de posicin o
centraje y su precisin. Se suele expresar en "tanto" por ciento.

Frmula del Coeficiente de Variacin:

Interpretacin del Coeficiente de Variacin:

El Coeficiente de Variacin, mide la variabilidad relativa a la Media.


Expresa la proporcin de variabilidad de una caracterstica por cada unidad
de la Media.
Ejemplo del Coeficiente de Variacin:
Sabemos que la fbrica de textiles produce 500 franelas diarias con
una desviacin tpica de ms o menos () 25 franelas, entonces, el
Coeficiente de Variacin ser 500/25 = 0,05, es decir, tenemos una variacin
de 5% en la produccin diaria de franelas.

Das könnte Ihnen auch gefallen