Sie sind auf Seite 1von 9

Apunte de Matematica Cuarto Anno

1. Estadstica Descriptiva. Comprende una descripcin, esto es, resumir en forma adecuada un gran conjunto de datos, as tenemos entonces que esta parte corresponde a la organizacin, recopilacin, tabulacin, representacin de los datos de inters, ya sea mediante grficos o tablas, adems involucra la obtencin de la informacin deseada, a estas medidas que resumen al gran conjunto de datos, recibe el nombre de Estadsticas o Estadgrafos. 2. Poblacin y Muestra. Poblacin Estadstica es el conjunto completo de posibles mediciones o registros de algn rasgo cualitativo correspondiente a la coleccin completa de unidades para las que se harn inferencias. La poblacin representa el objetivo de una investigacin y por ende el objetivo de recolectar datos para obtener o extraer conclusiones referentes a ella. La muestra de una poblacin es el conjunto de mediciones que realmente se obtienen en el curso de la recoleccin, por lo tanto corresponde a un subconjunto de la poblacin. 3. Clasificacin de Variable: Es cualquier caracterstica que difiere de un miembro a otro dentro de una poblacin estadstica. Puede tomar un valor cualquiera obtenido de un conjunto que constituye el dominio de la variable. Se representa por x,y,etc. Existen mltiples formas de clasificar variables, para nuestro estudio las categoras de Variables Continua y Variable Discreta son adecuadas al tipo de informacin numrica que se dispone: Variable Continua; aquella que puede tomar cualquier valor comprendido en los Nmeros Reales. Estatura de una persona en metros, Valor de la UF, Valor del dlar. - Variable Discreta; aquella que puede tomar slo valores en el conjunto de los Nmeros Enteros. Nmero de alumnos de un curso. Poblacin humana

5.- Datos, Observaciones, Tamao de la muestra Es el conjunto de valores asociados o asignados a una variable. DISTRIBUCIONES DE FRECUENCIAS En la ordenacin de datos muy numerosos, es usual presentarlos agrupados y ordenados en clases o categoras y determinar el nmero de individuos que pertenece a cada clase, llamado frecuencia de clase. Una disposicin tabular o tabla de datos junto con las correspondientes frecuencias de clase, se llama distribucin de frecuencias (o tabla de frecuencias). Para confeccionar estas tablas de frecuencias, debemos considerar los siguientes casos: Caso 1: Si la variable que estamos midiendo es un tipo discreto (asumen valores de un conjunto finito), entonces podemos realizar la distribucin en dos columnas, en la primera se anotan los valores de la variable y en la segunda el nmero de veces que se repite cada una.

Caso 2: Si la variable que estamos midiendo es de tipo continuo (pueden tomar cualquier intervalo determinado por los nmeros reales), no tiene sentido l tabularla para cada una de las observaciones dado que es muy improbable que la variable bajo estudio tome el mismo valor durante el experimento. Dicho de otro modo cuando en una distribucin de frecuencias haya muchos valores distintos de la variable conviene agruparlos en intervalos o clases.

Para hacer la agrupacin se debe considerar: a. Recorrido o campo de variacin de la variable: es la diferencia entre el mayor y el menor valor que ella toma. Se designa por R. b. Tamao de los intervalos: decidir el nmero y tamao de los intervalos. Dependen de la cantidad de datos de la muestra y de su recorrido. El nmero de intervalos debe cumplir con dos condiciones: resumir la informacin y conservar el detalle de la muestra. Ejemplo: CASO 1 Los siguientes datos corresponden a los pesos de un grupo de 33 personas: 45 36 72 54 45 72 48 62 38 43 48 64 43 36 54 72 64 60 70 38 64 60 70 48 72 62 72 48 54 64 70 43 60 Tabla de frecuencias: Peso 36 38 43 45 48 54 60 62 64 70 72 N de personas 2 2 3 2 4 3 3 2 4 3 5

Ejemplo: Caso 2. Se tiene la informacin de los ingresos, mensuales, en miles de pesos, de un grupo de 30 empleados. Obtenidos en una encuesta realizada en la va publica. 154 152 163 158 178 155 155 163 150 161 157 166 166 165 161 167 182 160 162 156 175 159 155 164 163 160 167 170 175 168 164 176 150 162 165 172 162 162 158 160

Podemos ordenar la informacin con relacin a mltiples criterios de inters; i.podemos estar interesados en lograr 5 intervalos de agrupacin. Ii nos puede interesar que la diferencia entre el ingreso mayor y menor de cada intervalo sea 4.000 pesos. Cualquiera sea la ordenacin debemos considerar el Rango como valor necesario para tener la distancia entre el valor mximo y el valor mnimo del recorrido de la variable. Rango = 182-150= 32 es decir Rango o Recorrido = Xmaximo- Xminimo Si elige construir 5 intervalos se tiene 32 : 5 = 6,4 es decir la amplitud es de 6.400 pesos Si el criterio hubiese sido dejar una amplitud de 4.000 se tiene 32.000 : 4.000 = 8 intervalos Tabla de frecuencias: Intervalo N de personas 150-154 3 154-158 6 158-162 8 162-166 11 166-170 5 170-174 2 174-178 3 178-182 2

Un criterio ms universal para determinar l numero optimo de intervalos esta dado por la expresin Numero optimo de intervalos = 1 + 3,3 log n tal que n es l numero de observaciones o tamao de la muestra y el doble parntesis es considerar la parte entera del numero obtenido. En nuestro caso Numero optimo de intervalos = 1 + 3,3 log 30 = 5,87 = 5

[[

]]

[[

]] [[

]]

TABLAS DE FRECUENCIAS. Para facilitar el resumen de la informacin contenidas en las tablas de frecuencias, es necesario definir algunos conceptos: 1.INTERVALOS DE CLASES El smbolo que representa una clase, como el 150-154, en nuestro ejemplo, se llama intervalo de clase . Los nmeros extremos 150 y 154 se llaman limite inferior de clase (150) y lmite superior de clase (154). 2. MARCA DE CLASE: Es el punto medio del intervalo de clase y se obtiene promediando los lmites inferior y superior de clase. 3. FRECUENCIA O FRECUENCIA ABSOLUTA: fi , ni Corresponde al nmero de veces que se repite un valor o una caracterstica determinada, en algunos casos correspondern al nmero de valores comprendidos en un determinado intervalo. Propiedad 1.

n
i =1

i =n

=n

4. FRECUENCIA RELATIVA: Si se denota por xi a la variable bajo estudio y ni al nmero de veces que se repite dicha variable, la frecuencia relativa corresponder a la expresin:

f i = hi =

ni n

Propiedad 2. .

h
i =1

i =n

=1

5. FRECUENCIA RELATIVA PORCENTUAL: Corresponde a la frecuencia relativa multiplicada por 100. Propiedad 3

100h = 100%
i =1

i =n

6. FRECUENCIA ABSOLUTA ACUMULADA: Ni Es la suma acumulativa termino a termino de las frecuencias absolutas. Propiedad 4. l ultimo termino de las frecuencias relativas acumuladas es n. 7. FRECUENCIA RELATIVA ACUMULADA: Hi Corresponde a la frecuencia absoluta acumulada partido por el total de observaciones. Propiedad 5. El ultimo termino de las frecuencias relativas acumuladas es 1 Ejemplo: La tabla de los ingresos, si quisiramos ordenar en una agrupacin de 8 intervalos, luego de todas estas definiciones queda determinada por:

Intervalo de clase 150-154 154-158 158-162 162-166 166-170 170-174 174-178 178-182

Marca de clase

ni
152 156 160 164 168 172 176 180 3 6 8 11 5 2 3 2

N1
3 9 17 28 33 35 38 40

f i 100
7,5% 15 % 20 % 27,5% 12,5% 5% 7,5% 5%

REPRESENTACIONES GRAFICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS.

1. HISTOGRAMAS: consiste en un conjunto de rectngulos con: a. bases en el eje X horizontal, centros en las marcas de clases y longitudes iguales a los tamaos de los intervalos de clases. b. reas proporcionales a las frecuencias de clases. Si los intervalos de clases tiene todos la misma amplitud las alturas de los rectngulos son proporcionales a las frecuencias de clase, y entonces es costumbre tomar las alturas iguales a las frecuencias de clase. 2. POLIGONO DE FRECUENCIA: es un grfico de trozos de la frecuencia de clase con relacin a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectngulos del histograma. Ejemplo: Polgono e Histograma de la tabla de frecuencias de la altura.

12 10 8 6 4 2 0 148 152 156 160 164 168 172 176 180 184
Otra representacin grfica de las tablas de frecuencias es la OJIVA, la diferencia entre sta y el Histograma o polgono de frecuencias es que la ojiva representa la distribucin de frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superiores respecto de dicha frontera.

40 36 32 28 24 20 16 12 8 4 0 148 152 156 160 164 168 172 176 180

MEDIDAS DE TENDENCIA CENTRAL 1. PROMEDIO: es un valor tpico o representativo de un conjunto de datos. Como tales valores suelen situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios se conocen como medidas de tendencia central. Se definen varios tipos, siendo los ms comunes, la media aritmtica, la mediana, la moda, la media geomtrica y la media armnica. Cada una tiene ventajas y desventajas, segn los datos y el objetivo perseguido. 2. MEDIA ARITMETICA O PROMEDIO: la media aritmtica de un conjunto de n nmeros x1 , x 2 , x3 ,...x n se denota por x y se define por: Si los datos provienen de una tabla de frecuencia, la media se calcula de la siguiente forma. Sean x1 , x 2 ,... x k las marcas de clase de cada uno de los k intervalos, cada uno con una frecuencia absoluta de, luego x es:

x=
i =1

ni x i n
8, 3, 5, 12 y 10 es:

Ejemplos: 1. La media aritmtica de los nmeros

x=

8 + 3 + 5 + 12 + 10 38 = = 7,6 5 5

Una desventaja de la media, es que es altamente influenciable por valores extremos, por lo que la media es recomendable cuando la variable tiene una distribucin simtrica.

3. MEDIA ARITMETICA PONDERADA: A veces asociamos con los nmeros x1 , x 2 ,... x k ciertos factores de peso (0 pesos) w1 , w 2 ,...w k , dependientes de la relevancia asignada a cada nmero. En tal caso

w x + w2 x 2 + ... + wk x k = xp = 1 1 w1 + w2 + ... + wk

w x
i =1 k i

w
i =1

se llama media aritmtica ponderada. Ejemplo: Si el examen final de un curso cuenta 3 veces ms que una evaluacin parcial, y un estudiante tiene calificaciones de 85 en el examen y parciales de 70 y 90, su calificacin media es:

xp =

1 70 + 1 90 + 3 85 415 = = 83 1+1+ 3 5

4. MEDIANA: Mediana de un conjunto de nmeros ordenados en magnitud es o el valor central o la media de los dos valores centrales. Ejemplo: a. El conjunto de nmeros 3,4,4,5,6,8,8,8, y 10 tiene mediana 6, n = 9, numero impar de datos, la mediana es el valor central de la serie a. El conjunto de nmeros 5,5,7,9,11,12,15 y 18 tiene mediana

1 (9 + 11) = 10 , n = 8, numero 2

par de datos, la mediana es la media entre los valores centrales. c. Para datos agrupados, la mediana obtenida por interpolacin viene dada por

Me = L1 + (

n N i 1 2 ni

) C

donde

L1 = Limite inferior de la clase mediana.


Ni-1 = frecuencia acumulada anterior a la del intervalo mediano ni = frecuencia de la clase de la mediana C = amplitud de los intervalos del intervalo mediano. En este caso para aplicar la formula indicada ser necesario, determinar el intervalo mediano previamente. O sea 5. MODA: La moda de un conjunto de observaciones es el valor numrico que ocurre con mayor frecuencia, es decir, el valor ms frecuente. La moda puede no existir, incluso no ser nica en caso de existir. Puede haber una distribucin unimodal, bimodal o no existir Moda. En el caso de datos agrupados donde se haya construido una curva de frecuencias para ajustar los datos, la moda ser el valor (o valores) de X correspondiente al mximo (o mximos) de la curva. La moda puede deducirse de una distribucin de frecuencias o de un histograma a partir de la frmula

1 Mo = Li + C + donde 2 1 Li = Limite inferior de la clase modal 1 = frecuencia anterior a la del intervalo modal 2 = frecuencia siguiente a la del intervalo modal
C = amplitud de los intervalos o del intervalo modal En este caso ser necesario determinar previamente el intervalo modal, que corresponde al intervalo que presenta la mayor frecuencia.

6. MEDIA GEOMETRICA: La media geomtrica de un grupo de n observaciones x1,x2,x3.xn se define como la raz ensima del producto de las observaciones:

G = n x1 x 2 ... x n
En el caso de tablas de frecuencias la media geomtrica va a ser:

G = n x1 1 x 2
n

n2

.... x k

nk

en donde

x i ; i = 1, k son las marcas de clases de los k intervalos, y los

n i , i=1,k, las

frecuencias absolutas de cada una de ellas.

7. MEDIA ARMONICA (H): La media armnica de un conjunto de nmeros media aritmtica de los recprocos de esos nmeros.

x1 , x 2 ,...., x n , es el recproco de la

H=

1 1 1 x n i =1 i
N

Ejemplo: La media armnica de los nmeros 2, 4 y 8 es

H=

3 3 = = 3,43 1 1 1 7 + + 2 4 8 8

Puntos de divisin del recorrido de la variable Existen mltiples puntos en el recorrido de la variable que dividen la muestra en puntos de caractersticas semejantes; cuartos, quintos, dcimas partes y 100 partes los que respectivamente llamamos cuartiles, quintiles, deciles y percentiles, todos ellos corresponden a la idea general de los fractiles. Es posible determinar formulas particulares para cada uno de ellos, aunque todas se pueden reducir a la formula del percentil al establecer las equivalencias en el siguiente modo. CUARTILES: Corresponden a medidas que dividen a la muestra ordenada en 4 grupos de igual tamao. Denotemos por Q i el cuartil i-simo con i=1,2,3. Es decir 4 partes del total con tres puntos de divisin del total del recorrido. DECILES: Son aquellas medidas que dividen a la muestra ordenada en 10 partes de igual tamao. Denotadas por la letra Di , i = 1,2,3,4......9,10 .Es decir 10 partes del total con 9 puntos de division del total del recorrido. PERCENTILES: Son aquellas medidas que dividen a la muestra ordenada en 100 partes iguales dejando en cada una de ellas igual nmero de elementos. Denotada por Pi , i = 1,2,3,4,5...........,99 .

pn N ( i 1) 100 Su frmula para datos tabulados es: Pp = Li + C ni


Pp es el rango del percentil Li es l limite inferior del intervalo percentilico C es la amplitud de los intervalos

tal que

pn es la expresin porcentual del percentil Ni 1 frecuencia acumulada anterior al intervalo percentilico As: Q1 = P25, Q2 = P50 = Me = D5 etc. En sntesis podemos usar para toda necesidad de puntos de divisin la formula de los percentiles.

MEDIDAS DE DISPERSION La dispersin se relaciona con la mayor o menor concentracin de datos en torno a un valor central generalmente el promedio o media. Existen varias medidas de dispersin. RANGO: El rango de un conjunto de nmeros es la diferencia entre el mayor y el menor de ellos. DESVIACIN MEDIA: La desviacin media de un conjunto de N nmeros x1 , x 2 ,..., x n es denotada por MD y se define como:

MD =

x
i =1

donde: x = es la media aritmtica de los nmeros

x i x = es el valor absoluto de la desviacin de x i respecto de x


DESVIACION ESTANDAR: La desviacin estndar de un conjunto de n nmeros x i , x 2 ,..., x n se denota por S , otras expresiones, se define:

S=

(x
i =1

x) 2

n
k

si los datos provienen de tablas de frecuencias entonces

S=

n (x
i =1 i

x) 2

donde: x i = marca de clase de cada intervalo

n i = frecuencia absoluta de cada intervalo


n = nmero total de observaciones VARIANZA: La varianza de un conjunto de datos se define como el cuadrado de la desviacin estndar.

Var ( x) = S 2 = 2
COEFICIENTE DE VARIACION: Sirve para comparar, en terminos relativos, la dispersin de los datos respecto al promedio entre grupos de distintas medidas, es adimensional y se define como:

C.V . =

S .100 x

Das könnte Ihnen auch gefallen