Sie sind auf Seite 1von 5

Desviación estandar(sigma) - mide la distancia de los datos al promedio.

valores extremos estan luego de 3 desviaciones

Trabajando con archivo gss.sav

la distribucion de años de estudio(educ) es simetrica ya que los valores

de media mediana y moda estan sercanos entre ellos

skewness

-0.195 +0.195

_______(________0_________)__________

3 sigma

3(0.065) -0.126 (skewness

0.195

//En el 0 es simetrica, a la derecha es asimetrica positiva

y a la izquierda es asimetrica negativa

-0.390 0.390

_________(________0______)____________kurtosis

3 sigma

3(0.130) //0.130=error of kurtosis


0.390

Interpretación de kurtosis

La distribucion de años de estudio es leptocúrtica

Para la Kurtosis:

En el 0 es Mesocurtica, a la derecha es leptocúrtica

y a la izquierda Platicúrtica

Se buscó los datos de emailhr

media= 4.3895

med=2

moda=1

desv. std. = 7.5

sigma = 7.49272

0 30 60

|_____________________|______________________|

La distribucion de horas internet es asimetrica positiva

-0.288 +0.288 +3.574

____________(________0_________)____________X__ skewness
= 3 sigma

= 3(0.96)

= 0.288

-0.573 +0.575 15.434

____________(________0_________)__________X__ kurtosis

= 3 sigma

= 3(0.191)

= 0.573

La distrubucion de horas de internet es Leptocúrtica

//Una distribución normal tiene que ser simetrica y mesocurtica.

_____________________________________________________________________________________
______

4/10/2018

Las Z miden la desviacion estandar con respecto al promedio

35 40 45 50

______________.______|__ ___._____ _._______ variable

0 1 2

______________x______x_____x_______x________ Z (x = desviaciones)
z = (valor - promedio) / desv. est.

Grafica a utilizar: histograma con la curva normal

rango = valor maximo menos valor minimo

17 87

Ej. |________________________| rango = 87-17=70

si esta lejos o serca lo determina la desviacion estandar,

cuando pasa de 3 desviaciones se considera lejos

Analiza ---> Descriptive statistics ---> explore

En dependent van variables scale

Factor van ordinales o nominales

outliers- los valores que da spss puede que no sean valores extremos,

da los 5 valores mas altos y los 5 mas bajos

Trimmed Mean = promedio quitando el 5% de los valores mas lejanos(quita los outliers)

Si mean(promedio) esta lejos del trimmed mean significa que esta luego de 3 desviaciones(z).

ejemplo con age y sex


interpreta la mediana: el 50 porciento de los hombres(o la mitad) tiene 42 años o menos.

si el valor max y el min estan a 6 sigmas o menos entonces no hay outliers

de esta manera se utiliza el rango para determinar si hay outliers

Rango intercuartilico

25% Q1 25% Q2 25% Q3 25%

.________|_________|________|_________.

si hay mil valores cada cuartil tien 250 valores'

RI = Q3 - Q1

a cuantos sigma esta?

Rango Intercuartilico / Desviacion estandar =

Boxplot

Das könnte Ihnen auch gefallen