Sie sind auf Seite 1von 14

Resumen Estadstica 1er Parcial

L a Es t ad s t ica trata del re cue n to, orde naci n y cl asi fi caci n de l os d atos o bte ni dos
por l as obse rvaci o ne s, p ara po de r hace r compa raci one s y sacar concl usi one s.
Un es t ud io e s t ad s t ico cons ta de l as si gui e nte s fase s:
Re co gi da de d atos.
O rg ani zaci n y re p re se ntaci n de d atos.
A nl i si s de d atos.
O bte nci n de concl usi one s
Co nce p t os d e Es t ad s t ica
Po b lac i n
Un a p ob la ci n e s el conj un to de todos l os e le me ntos a l os q ue se some te a un
est udi o e stad sti co.
Ind ivid uo
Un ind ivid uo o unid ad es t ad s t ica es cad a uno de l os e le me ntos q ue compo ne n l a
pobl aci n.
M ues t ra
Un a mue s t ra es un conj un to re p re se ntati v o de l a po bl aci n de re fe re nci a, el nme ro
de i ndi vi duo s de una m ue stra e s me no r que el de l a p obl aci n.
M ues t re o
El mue s t re o es l a re u ni n de dat os que se de se a e studi ar, ob te ni dos de un a
propo rci n re d uci da y re pre se nta ti va de l a pobl aci n.
Valo r
Un valo r es cad a uno de l os di sti n tos re sul t ados que se p ue de n obte ne r e n un
est udi o e stad sti co. Si l an za mos un a mone d a al ai re 5 ve ce s obte ne mo s dos val o re s:
cara y cru z.
Dat o
Un d ato e s cada u no de l os val ore s q ue se ha obte ni do al re al i zar u n e studi o
esta d sti co. Si l anz amos una m one da al ai re 5 ve ce s obte ne mos 5 datos: cara, car a,
cruz, cara, cru z.
Di stri b uci n de fre cue nci as
L a d ist r ib uci n de f re cue nci as o t ab la d e fre cue nc ias e s una o rd e na ci n e n
form a de t ab la de l os d at os e st ad s t ico s , asi g nan do a ca da d at o su f re cue nci a
co rre sp o nd ie nt e .
Ti pos de f re cue nci as
Fre cue nci a absol uta
L a f re cue nci a ab so lut a e s el nme ro de ve ce s que apa re ce un
de te rmi na do va lo r e n un estu di o e stad sti co.
Se re p re se nta p or f i .
L a s uma d e las f re cue n cias ab so lut as es i gu al al n me ro total de dat os, que se
re p re se nta por N.

Para i n di car re su mi da me nte estas su mas se uti l i za l a le tra grie g a (si gma
may scul a) q ue se le e su ma o su matori a.

Fre cue nci a re l ati va


L a f re cue nci a re l at iva es e l co cie nt e e nt re l a f re cue n cia abs o lut a de un
de te rmi na do val or y e l nme ro t o t al d e d ato s .
Se pue de exp re sar e n tant os por ci e nto y se re pre se nt a por n i .

L a sum a de l as fre cue nci as re l ati va s es i gu al a 1.


Fre cue nci a acum ul ad a
L a f re cue nci a ac umul ad a e s l a sum a de las f re cue nci as abs o lut as de tod os
l os valo re s inf e rio re s o ig uale s al valo r consi de ra do.
Se re p re se nta p or F i .
Fre cue nci a re l ati va ac umul a da
L a f re cue nci a re l at iva acumu lad a es e l co cie nt e e nt re l a f re cue n cia
acum ulad a de un de te rmi na do valo r y el nme ro to t a l de d at os . Se pue de expre sar
e n ta ntos por cie n to.
Di stri b uci n de fre cue nci as agru pa das
L a d ist r ib uci n de f re cue nci as ag rup ad as o t ab la co n d at os ag rup ad o s se
e mple a si l as va ri ab les to man un nme ro g ra nde d e valo re s o l a var iab le e s
co nt inua .
Se ag rup a n l os va lo re s e n int e rva los q ue te n gan l a mis ma
amp lit ud de no mi na dos cl as es . A cada clas e se le asi gna su f re cue nci a
co rre sp o nd ie nt e .
L mi te s de l a cl ase
C ad a cl as e est de lim it ad a por e l lmit e inf e rio r d e la cl as e y el lmit e s up e rio r
de la clas e .
A mpl i tu d de l a cl ase
L a amp l it ud d e la cl as e es l a d ife re n cia e ntre e l lm it e sup e rio r e inf e rio r de
l a clas e .

Ma rca de cl ase
L a ma rc a de cl ase e s el p unto me d io de cada int e rva lo y es e l va lo r q ue
re p re se nta a to do e l int e rv alo p ara e lc lculo de al gun os p ar me t ro s .
Di agr ama de b arras

Un d iag ram a d e b ar ras se uti l i za par a de pre se nta r d at os cu alit at ivos o d at os


cuant it at ivo s de t ip o d is cre t o .
Se re p re se nta n sob re unos ej es de coorde n adas, e n e l e je d e ab s cis as se col ocan
l os valo re s de la vari ab le , y sobre el e je de o rd e nad as l as f re cue nci as abs o lut as
o re l at ivas o acum ulad as .
Los d at os se re pre se n tan me di a nte b ar ras de un a a lt ura p ro p o rcio nal a
l a f re cue n cia .
Pol gono s de fre cue nci a
Un po lg o no d e f re cue n cias se forma uni e ndo los ex t re mos de
l as b arr as me di ante s eg me nt os .
Tambi n se pue de re al i zar traza ndo l os p unto s que re p re se nta n l as f re cue n cias y
uni ndol os me di ante s eg me nt os .
Un d iag ram a d e s e cto re s se pue de uti l i zar p ara to do ti po de vari a bl e s , pe ro se us a
fre cue nte me nte pa ra l as va ri ab les cua lit at i vas .
Los d at os se re pre se n tan e n un crc ulo , de mo do que e l ng ulo de
cada se ct o r e s p ro p o rcio na l a l a f re cue nci a ab so lut a corre spo ndi e nte .

El di ag rama ci rcul ar se constr uye con l a ayu da de un tr ans porta dor de n gul os.
Histograma
Un histograma es una representacin grfica de una variable en forma de barras.
Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y
que se han agrupado en clases.
En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del
intervalo, y por altura, lafrecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de los valores representados.
Polgono de frecuencia
Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto
medio de cadarectngulo.
Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin
estadstica.
Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una
grfica.
Tipos de parmetros estadsticos
Hay tres tipos parmetros estadsticos:
De centralizacin.

De posicin
De dispersin.
Medidas de centralizacin
Nos indican en torno a qu valor (centro) se distribuyen los datos.
La medidas de centralizacin son:
Media aritmtica
La media es el valor promedio de la distribucin.
Mediana
La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la
inferior, es decir divide la serie de datos en dos partes iguales.
Moda
La moda es el valor que ms se repite en una distribucin.
Medidas de posicin
Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de
individuos.
Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a
mayor.
La medidas de posicin son:
Cuartiles
Los cuartiles dividen la serie de datos en cuatro partes iguales.
Deciles
Los deciles dividen la serie de datos en diez partes iguales.
Percentiles
Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersin
Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la
distribucin.

Las medidas de dispersin son:


Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de
las desviaciones respecto a la media.
Varianza
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media.
Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
mxima, ladistribucin es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las
dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Clculo de la moda para datos agrupados
1 Todos los intervalos tienen la misma amplitud.

Li es el lmite inferior de la clase modal.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de
menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar slo para variables cuantitativas.
Clculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la
misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5
3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me = 9.5
Clculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de
la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

Li es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.


Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de
menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar slo para variables cuantitativas.

Clculo de la mediana

1. Ordenamos los datos de menor a mayor.


2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la
misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me = 5
3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12Me = 9.5
Clculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de
la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre

Li es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.


Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Propiedades de la media aritmtica
1. La suma de las desviaciones de todas las puntuaciones de una distribucin respecto a
la media de la misma igual a cero.

La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:
8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 =
= 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0
2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a
un nmerocualquiera se hace mnima cuando dicho nmero coincide con la media aritmtica.

3. Si a todos los valores de la variable se les suma un mismo nmero, la media


aritmtica queda aumentada en dicho nmero.

4. Si todos los valores de la variable se multiplican por un mismo nmero la media


aritmtica quedamultiplicada por dicho nmero.
Observaciones sobre la media aritmtica
1. La media se puede hallar slo para variables cuantitativas.
2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas. Si tenemos una distribucin con los
siguientes pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralizacin poco representativa de la
distribucin.
4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
Q2 coincide con la mediana.
Clculo de los cuartiles
1. Ordenamos los datos de menor a mayor.

2. Buscamos el lugar que ocupa cada cuartil mediante la expresin

Nmero impar de datos


2, 5, 3, 6, 7, 4, 9

Nmero par de datos


2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra


frecuencias acumuladas.

, en la tabla de las

Li es el lmite inferior de la clase donde se encuentra el cuartil.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.
ai es la amplitud de la clase.
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra


frecuencias acumuladas.

, en la tabla de las

Li es el lmite inferior de la clase donde se encuentra el decil.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase el decil..
ai es la amplitud de la clase.
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
P50 coincide con D5.
Clculo de los percentiles

En primer lugar buscamos la clase donde se encuentra


frecuencias acumuladas.

, en la tabla de las

Li es el lmite inferior de la clase donde se encuentra el percentil.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del percentil.
ai es la amplitud de la clase.
De svi aci n re s pe cto a l a me di a
L a d es vi aci n re s pe ct o a l a med i a e s l a d if e re nci a e n val or abs ol uto e nt re
cada valo r de l a vari a bl e e stad sti ca y l a med i a ar it m t ica .
D i = |x - x |
De svi aci n me di a
L a d es vi aci n me d ia es l a me d ia a rit m t ic a de l os va lo re s ab s o lut os de las
de s viac io nes re sp e ct o a la med i a .
L a d es vi aci n me d ia se re p re se nta por

De svi aci n me di a p ara da tos agr up ados


Si l os da tos vie ne n agru pa dos e n una t ab la d e fre cue nc ias , l a exp re si n de
l a de s viac i n med i a e s:

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de


una distribucin estadstica.
La varianza se representa por

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.

Pro pi e dade s de l a vari an za


1 L a var ianz a se r sie m pre u n va lo r p os it ivo o ce ro , e n e l caso de q ue l as
pu ntu aci one s se an i gual e s.
2 Si a todos l os valo re s de l a vari abl e se l es s uma un nme ro l a va ri anza no
var a .
3 Si todos l os valo re s de l a vari abl e se mult ip l ican por
un nme ro l a va ri anza que da mult ip lic ad a po r el cu ad rad o de di cho nme ro .
4 Si te ne m os vari as di stri buci one s con l a mi sm a me d ia y conoce mos sus
re spe cti vas var ianz as se p ue de cal cul ar l a var ianz a t o t al .
O bse rvaci one s so bre l a vari an za
1 L a var ianz a , al i gual que l a me di a, es un ndi ce m uy se nsi bl e a l as p unt uaci one s
extre mas.
2 En l os casos q ue no s e pue d a ha lla r la med ia tam poco se r posi bl e hal l ar
l a var ianz a .
3 L a var ianz a no vie ne expre sa da e n l as mi smas u ni da de s que l os datos, ya q ue l as
de svi aci one s est n el e vadas al cu adra do.
La desviacin tpica es la raz cuadrada de la varianza.
Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin.
La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las
anteriores.

Propiedades de la desviacin tpica


1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones
sean iguales.
2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara.
3 Si todos los valores de la variable se multiplican por un nmero la desviacin
tpica queda multiplicada por dicho nmero.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones
tpicas se puede calcular la desviacin tpica total.
Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica


1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las
puntuaciones extremas.
2 En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica.
3 Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor
de la media.
C oe fi cie nte de vari aci n
El co e fi cie nt e d e v ari aci n e s l a re l aci n e ntre l a d es vi aci n t p ica de una
mue stra y su med i a .

El co e fi cie nt e d e v ari aci n se suel e exp re sar e n p o rce nt aje s :

El co e fi cie nt e d e v ari aci n pe rmi te com parar l as d is p e rs io ne s de dos


di stri b uci one s di sti nt as, si e mp re que sus med i as se a n p os it iv as .
Se cal cul a pa ra cad a una de l as di stri buci one s y l os val ore s q ue se obti e ne n se
comp aran e ntre s.
L a m ayo r d is p e rs i n corre s pon de r al val or del co e fi cie nt e d e v ari aci n m ayo r .

Poblacin
Finita: la poblacin consistente en todos los automviles producidos por una fbrica en el lapso de un
ao.
Infinita: la poblacin formada por todos los sucesos posibles (1; 2; 3; 4; 5; 6) en tiradas sucesivas de un
dado
En una investigacin agrcola, el registro de produccin de trigo es una descripcin. La interpretacin de
estos resultados por provincia, utilizando un grfico adecuado, es una exploracin. En cambio tratar de
explicar las diferencias en la produccin de trigo entre regiones, por efecto de la incidencia de variables
climatolgicas, econmicas, polticas, etc, implica un anlisis confirmatorio de datos
Variable cualitativa nominal
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal o variable cuasi cuantitativa
la calificacin en un examen: suspenso, aprobado, notable, sobresaliente
puesto conseguido en una prueba deportiva: 1, 2, 3, ...
Variables cuantitativas continuas
los pesos o las alturas de los estudiantes de una universidad
Variables cuantitativas discretas
el nmero de hijos de una familia (0; 1; 2; 3;...)
el nmero de libros publicados por una editorial por mes
Escalas de Medicin
Escala nominal:

Utiliza los nmeros para identificar que un dato pertenece a un grupo o a una categora. Es aquella
escala que no presenta un orden o dimensin particular, son observaciones que pueden clasificarse o
contarse.
En el anlisis de datos resulta ms sencillo asignar a ciertos atributos etiquetas numricas en lugar de
utilizar datos complejos. Por ello podemos utilizar un 1 para designar a las mujeres y un 2 para
designar a los hombres, sin que ninguno de los nmeros represente ms o menos, solamente con el
objetivo de distinguir y organizar datos.
En esta escala cada persona u objeto debe pertenecer a una y solamente una de las categoras que
tienen y el conjunto de estas categoras debe ser exhaustivo; es decir, tiene que contener a todos los
casos posibles.
Escala ordinal:
En esta escala los nmeros representan una clasificacin (mayor que o menor que), sin que represente
una unidad de medida, quedando implcito que un nmero de mayor cantidad tiene ms alto grado de
atributo medido en comparacin de un nmero menor. Se establece una gradacin u orden natural para
las categoras, cada uno de los datos puede localizarse dentro de alguna de las categoras disponibles.
Escala de intervalo:
En esta escala adems del mayor que y el menor que tambin se establece una unidad de medida
que nos permite precisar cuanto se es mayor o menor. La unidad de medicin es arbitraria, el cero es
convencional y pueden existir cantidades negativas; la medicin de la temperatura y del coeficiente
intelectual son ejemplos de este tipo de escala.
En esta escala se pueden hacer comparaciones por medio de diferencias o de sumas, sin embargo no se
admiten comparaciones por medio de multiplicaciones, divisiones o porcentajes pues carecen de
sentido.
Escala de razn:
Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los mltiplos de los valores de la
escala sern significativos; el nivel de votos en una eleccin sera un buen ejemplo de una escala de
medicin de razn.
Escalas de medicin
Nominal : no hay un orden natural (sexo, tipo de religin)
Ordinal : hay un orden (nivel socioeconmico, nivel de instruccin)
Numrica o de razn (hay un cero absoluto, conteo de votos, hijos de una familia)
De intervalo (hay un cero arbitrario, medicin de temperaturas o coeficiente de inteligencia)

Das könnte Ihnen auch gefallen