Beruflich Dokumente
Kultur Dokumente
En estadstica,
un histograma es
una
representacin grfica de
Elaboracin de un histograma:
Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato
menor.
Paso 2
Obtener todos los nmeros de clases, existen 2 criterios para determinar el
nmero de clases (o barras) por ejemplo, la regla de Sturges. Sin embargo
ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince
clases, dependiendo de cmo estn los datos y cuntos sean. Un criterio usado
frecuentemente es que el nmero de clases debe ser aproximadamente a la
raz cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30
(nmero de artculos) es mayor que cinco, por lo que se seleccionan seis
clases.
Paso 3
Establecer la longitud de clase: es igual al rango dividido por el nmero de
clases.
Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de
los datos en relacin al resultado del PASO 2 en intervalos diferentes
Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma
amplitud, se hace una grfica de pastel, las bases de las barras son los
intervalos de clases y la altura es la frecuencia de las clases. Si se unen los
ESTADISTICA UNIVARIADA
Se llama univariada cuando de cada elemento en estudio se toma una solo
variable. Por ejemplo se estudian personas y se toma solo su edad. La
Estadstica que se aplicar ser la univariada en contraposicin a la
multivariada que aparece cuando se toma ms de una variable por elemento
del universo.
PARAMETROA ESTADISTICOS
Hay tres tipos parmetros estadsticos :
De centralizacin.
De posicin.
De dispersin.
- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte
de
los
datos
- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que
la
mitad
de
los
datos
- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas
DECILES: son los nueve valores que dividen al conjunto de datos ordenados
en diez partes iguales, son tambin un caso particular de los percentiles.
Ejemplo:
Dada la siguiente distribucin en el nmero de hijos (Xi) de cien familias,
calcular sus cuartiles.
xi
ni
Ni
14
14
10
24
15
39
26
65
20
85
15
100
n=100
Solucin:
1.
Primer cuartil:
2.
Segundo cuartil:
3.
Tercer cuartil:
Medidas de Centralizacin
Nos dan un centro de la distribucin de frecuencias, es un valor que se puede
tomar como representativo de todos los datos. Hay diferentes modos para
Si los datos estn agrupados utilizamos las marcas de clase, es decir c i en vez
de xi.
Medidas de Dispersin
Las medidas de tendencia central tienen como objetivo el sintetizar los datos
en un valor representativo, las medidas de dispersin nos dicen hasta que
punto estas medidas de tendencia central son representativas como sntesis de
la informacin. Las medidas de dispersin cuantifican la separacin, la
dispersin, la variabilidad de los valores de la distribucin respecto al valor
central.Distinguimos entre medidas de dispersin absolutas, que no son
comparables entre diferentes muestras y las relativas que nos permitirn
comparar varias muestras.
Para estimar la desviacin tpica de una poblacin a partir de los datos de una
muestra se utiliza la frmula (cuasi desviacin tpica):
Medidas de Forma
Comparan la forma que tiene la representacin grfica, bien sea el histograma
o el diagrama de barras de la distribucin, con la distribucin normal.
MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su
media aritmtica coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias
(absolutas o relativas) descienden ms lentamente por la derecha que por la
izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la
derecha diremos que la distribucin es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Una
de ellas es el Coeficiente de Asimetra de Pearson:
EJEMPLO 1
La media: suma de todos los valores de una variable dividida entre el nmero total de datos
se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otr
debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos
se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valor
a su vez 60, que es el valor de la mediana.
La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable
aritmtica de la distribucin.
S x2
=
S = 427,61 = 20.67
El rango: diferencia entre el valor de las observaciones mayor y el menor
80 - 15 = 65 das
llama distribucin
normal, distribucin
de
etc.
la
distribucin
normal
maximiza
la entropa entre
todas
las
la distribucin
log-normal es
una distribucin
de
probabilidad de una variable aleatoria cuyo logaritmo est normalmente distribuido. Es decir,
si X es una variable aleatoria con una distribucin normal, entonces exp(X) tiene una
distribucin log-normal.
La base de una funcin logartmica no es importante, ya que log a X est distribuida
normalmente si y slo si log b X est distribuida normalmente, slo se diferencian en un factor
constante.
Log-normal tambin se escribe log normal o lognormal.
Una variable puede ser modelada como log-normal si puede ser considerada como
un producto multiplicativo de muchos pequeos factores independientes. Un ejemplo tpico es
un retorno a largo plazo de una inversin: puede considerarse como un producto de muchos
retornos diarios.
siendo
la funcin de distribucin acumulativa de la normal reducida.
Por lo tanto un modo grfico de verificar esta distribucin es comparar la
funcin de supervivencia dibujada en papel lognormal con una recta.
La funcin estn caracterizadas por los dos parmetros y ,
que no son su media y desviacin tpica. La estimacin de estos
parmetros slo es sencilla en el caso de que no haya prdidas y sta es
la que implementa el PRESTA.
Se ha usado esta funcin para estudiar tanto la supervivencia en SIDA
(1), como el tiempo hasta la seroconversin de HIV+ (2).
Ejemplo
Estmese las funcin de supervivencia, asumiendo el modelo lognormal y
realcese la prueba de la bondad de ajuste, para los datos de la tabla.
La salida del PRESTA
A a m y parmetro B a s2
es
(ntese
que
se
denomina parmetro
NUMERO
DE
CASOS:
CASOS QUITADOS POR CONTENER ALGUN VALOR NO ESPECIFICADO: 0
121
PARAMETRO
ERROR STANDARD
2.32263
.04138
.20719
.02664
MATRIZ
DE
.00171
.00000
.00000
.00071
TABLA
(SOLO
DE
VALORES
CUENTAN
COVARIANZAS
OBSERVADOS
LOS
INTERVALO
< 5.69
10.00
12.10
.3645
5.69 - 6.96
9.00
12.10
.7942
6.96 - 8.04
18.00
12.10
2.8769
8.04 - 9.09
12.00
12.10
.0008
9.09 - 10.20
17.00
12.10
1.9843
10.20 - 11.45
12.00
12.10
.0008
11.45 - 12.95
8.00
12.10
1.3893
12.95 - 14.96
9.00
12.10
.7942
14.96 - 18.28
16.00
12.10
1.2570
> 18.28
10.00
12.10
.3645
PRUEBA
DE
BONDAD
JI-CUADRADO: 9.82645 G.L.: 7 p= .197686
DE
ESPERADOS
EVENTOS)
AJUSTE