Sie sind auf Seite 1von 16

Departamento de Economa Aplicada (Estadstica y Econometra).

Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 1



Statgraphics Centurin


I.- Nociones bsicas

El paquete Statgraphics Centurin es un programa para el anlisis estadstico que trabaja
bajo Windows, presentando una estructura comn a la de todos los programas que trabajan
en dicho entorno.
Una vez que se ha accedido al programa, presionando sobre su icono en el
Escritorio o por el Men de Inicio, y tras los ttulos, aparece la pantalla principal, Ventana
de Aplicaciones, con los siguientes elementos:


1. En la parte superior se muestra la barra de men con 14 encabezamientos (14 grupos
de procedimientos) y a continuacin aparece la Barra de Herramientas (iconos que
permiten realizar con rapidez algunas de las operaciones ms usuales). Mediante el
ratn se activa cada uno de ellos, desplegndose una ventana con una serie de
procedimientos; los sealados con el smbolo,, incluyen una segunda ventana
desplegable. Los 14 encabezamientos son:






Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 2

ARCHIVO

Abrir, cerrar y
salvar
ficheros de
datos,
StatFolios,
StatGallerys
y
StatReports,
imprimir y
salir del
programa,
entre otras
operaciones.



EDITAR


Copiar,
cortar, pegar
y borrar
textos y
grficos,
cambiar el
formato y
modificar las
columnas de
la hoja de
clculo.
GRAFICAR:



Proporciona
distintas
representaciones
grficas de los
datos y de las
distribuciones
tericas

Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 3


DESCRIBIR

Mtodos de
anlisis sobre
una o ms
variables,
cuantitativas
o cualitativas:
medidas
descriptivas,
intervalos y
contrastes,
correlacin,
tablas de
contingencia,
etc.

COMPARAR



Permite
comparar dos o
ms muestras.



RELACIONAR


Procedimientos
de anlisis de
regresin, con
uno o ms
factores.
Anlisis
discriminante,
etc.

Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 4

PRONSTICOS



Permite hacer
predicciones de
series de tiempo.




CEP



Diversos
procedimientos
de control de
calidad.

DDE


Procedimientos
relacionados con
el diseo de
experimentos.


Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 5



SNAP STATS



Permite el
anlisis de una
o ms
muestras.
Ajuste y
prediccin.

Herramientas


Tamaos
muestrales;
Distribuciones en
el muestreo;
Simulacin de
Monte Carlo



VER

Activa o
desactiva la
visualizacin
de distintos
elementos de
la pantalla,
como la barra
de
herramientas y
la barra de
estado.
Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 6


VENTANA



Permite
seleccionar
ventanas y
visualizarlas de
diferentes
formas.




AYUDA



Permite
acceder a la
ayuda del
programa.




2. En la parte central de la pantalla aparece la Ventana de Datos que es una hoja de
clculo sobre la que se dispondrn los datos, en filas los individuos o casos y en
columnas las caractersticas o variables. Seleccionando una columna y con el botn
derecho del ratn se puede modificar la variable elegida, generar nuevos datos a
partir de ella, o recodificarla.







Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 7
3. En la parte izquierda y en la inferior aparecen sin desplegar distintas ventanas
denominadas:




Commentarios del Statfolio, ventana en la que se podrn introducir los comentarios
acerca del anlisis.
StatAdvisor, ayudante estadstico que proporciona una interpretacin estadstica de
los resultados obtenidos en los anlisis.
StatGallery, ventana organizada en cuadrcula en la que se pueden incorporar
resultados de texto y grficos.
StatReporter, procesador de textos en el que se podr realizar un informe final,
pudiendo incorporar comentarios, resultados y grficos.


Adems, tras un primer anlisis de la variable o variables objeto de estudio, se abrir un
cuadro de dilogo denominado Tablas y Grficos que muestra los procedimientos que se
pueden realizar.





Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 8

Una vez elegidos se abrir una nueva ventana, Ventana de Anlisis, con los resultados
del mismo y que incorpora una barra de herramientas con distintos iconos. En principio esta
nueva ventana aparecer dividida en dos paneles. El de la izquierda contendr resultados en
texto, mientras que el de la derecha mostrar grficos de apoyo para la interpretacin de
dichos resultados. A cada uno de los paneles se acceder haciendo un doble click en el
botn izquierdo del ratn. Ms adelante se describe el funcionamiento de la Ventana de
Datos para procedimientos concretos.



El primero de los iconos de esta ventana, el ms a la izquierda, permite seleccionar otras
variables o distribuciones para repetir el anlisis. El segundo, Opciones de Anlisis,
proporciona diferentes opciones del anlisis a realizar. En el tercero, Tablas y Grficos, se
pueden elegir distintos tipos de procedimientos, como ya hemos comentado anteriormente.
En el cuarto, Opciones de Ventana, aparecen diferentes opciones para el procedimiento
concreto que hayamos elegido y, por ltimo, se pueden almacenar ciertos resultados en la
ventana de datos en Guardar Resultados.


Las distintas ventanas se pueden guardar para ser recuperadas posteriormente. La
Ventana de Datos se almacena como un fichero con extensin .SGD, la StatGallery con
extensin .SGG y la StatReport con extensin .RTF. Tambin se puede guardar todo un
entorno de trabajo, datos, anlisis y comentarios, lo que constituye un StatFolio; en este
caso, el fichero ha de tener una extensin .SGP.



Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 9
II. Distribuciones de Probabilidad

Para analizar las distintas distribuciones tipo, ver grficamente sus funciones de
distribucin y de probabilidad o densidad, visualizar algunas de sus propiedades, calcular
probabilidades y valores, y obtener una muestra de valores (nmeros aleatorios),
utilizaremos el procedimiento Distribuciones de Probabilidad. Para acceder al mismo se
pueden seguir dos rutas: Describir Ajuste de Distribuciones Distribuciones de
Probabilidad, o tambin desde Graficar Distribuciones de Probabilidad.



Una vez se accede a este procedimiento, bien por Descripcin o bien por Grficar, un
cuadro de dilogo permite seleccionar una de entre las 46 distribuciones tipo.



Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 10
Realizada la seleccin, se abre otra ventana para fijar los parmetros asociados a la
distribucin escogida. Statgraphics permite estudiar dicha distribucin con cinco
combinaciones de parmetros distintas.



A continuacin se eligen en el panel de Tablas y Grficos los procedimientos de inters



La opcin Resumen del Anlisis, muestra los parmetros de la distribucin y la
explicacin que proporciona el StatAdvisor de este procedimiento.

La opcin Distribuciones Acumuladas, proporciona: la probabilidad que la distribucin
deja a la izquierda y a la derecha de un determinado valor y la probabilidad o densidad en
dicho valor. Presionando el botn derecho del ratn se abre un cuadro de dilogo que
contiene, entre otras, las Opciones de Anlisis, que nos permite cambiar los parmetros de
la distribucin, como hemos visto. Asimismo aparecen las Opciones de Ventana que
permiten dar distintos valores segn sea el procedimiento elegido.



Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 11
Elegida la opcin Distribuciones Acumuladas Inversas, en el panel de la izquierda
aparecen los resultados del procedimiento inverso; esto es, dado un valor de probabilidad p,
el procedimiento devuelve el valor x tal que p[X x]=p. Igual que en el procedimiento
anterior, las Opciones de Ventana y las Opciones de Anlisis permiten introducir distintos
valores de probabilidad y distintos parmetros, respectivamente.

El ltimo procedimiento, Nmeros Aleatorios genera una muestra de nmeros aleatorios
de la distribucin para unos parmetros determinados. En Opciones de Ventana se indica
el tamao de la muestra y en Opciones de Anlisis, podremos cambiar los valores de los
parmetros. Creada la muestra, se puede guardar presionando Guardar los Resultados; la
muestra pasa a ser una variable, denominada por defecto RAND1, en la Ventana de Datos.


De la misma forma se puede elegir entre diferentes opciones grficas como la funcin de
densidad o de distribucin entre otras. En estas grficas se pueden superponer hasta cinco
funciones del mismo tipo.

Las grficas creadas se pueden copiar en StatGallery (o en StatReport) presionando el
botn derecho del ratn sobre la grfica y se selecciona Copiar Ventana a StatGallery; una
vez en StatGallery, se presiona de nuevo sobre una de sus cuadrculas y se selecciona
Pegar o Pegar Vinculo. Este procedimiento puede ser utilizado para superponer grficas
correspondientes a distintos tipos de funcin o a distintos tipos de distribucin.

Elegidos los procedimientos y grficos, el programa crea una Ventana de Anlisis,
dividida, de entrada, en tantos paneles como procedimientos se hayan elegido. Si nos
quedamos con las opciones marcadas por defecto, en el de la izquierda, aparecer el
resumen del anlisis, as como la distribucin acumulada y en el de la derecha, la funcin de
probabilidad o de densidad y la de distribucin para los parmetros elegidos.




Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 12

Los procedimientos englobados en Distribuciones de Probabilidad no requieren una
base de datos previa.

Ejercicios:

a) Obtener las grficas de la funcin de probabilidad y de distribucin de una variable discreta, por ejemplo
Binomial; comprobar sus propiedades y la relacin entre ambas funciones. Hacer lo mismo con una
variable continua, por ejemplo, Gamma.
b) Obtener las grficas de la funcin de probabilidad o de densidad y de distribucin de algunas de las
distribuciones tipo, utilizando distintos valores de los parmetros para ver cmo influyen en su forma y en
sus principales resmenes (media, moda, mediana, varianza,).
c) Comprobar con alguna distribucin tipo (Binomial, Poisson, Chi-cuadrado, etc.) cmo el aumento en alguno
de sus parmetros conduce a distribuciones muy prximas a la normal.
d) Calcular probabilidades y valores crticos de algunas de las distribuciones tipo con la ayuda del programa y
comparar los resultados obtenidos en las tablas estadsticas.



III. Intervalos de Confianza y Contrastes de Hiptesis Paramtricas

Los estudiaremos trabajando con un ejemplo.

1.- Seleccionar el fichero de trabajo: la secuencia Archi voAbri rAbrir Datos abre un
cuadro de dialogo en el que hay que elegir el tipo de fichero que se quiere abrir



Una vez seleccionado elegimos el fichero 93cars.sgd y vemos el contenido del fichero en la
ventana de datos, es decir, en la hoja de clculo del programa.

Los intervalos de confianza y los contrastes de hiptesis sobre los parmetros (media y
desviacin) de una poblacin normal (o de una variable con un nmero suficiente de datos
para poder aplicar los procedimientos por aproximacin, en base al teorema del lmite
central) se obtienen siguiendo la secuencia DescribirDatos NumricosAnlisis de una
Variable, para introducir (con ) a continuacin la variable a analizar en Datos.

En la opcin de Tablas y Grficos se eligen los procedimientos de Intervalos de Confianza
y Prueba de Hiptesis.

Dentro de cada ventana accionando el botn derecho del ratn en Opciones de Ventana,
se puede elegir el nivel de confianza, en un caso, y el nivel de significacin, el valor del
parmetro en la hiptesis nula, el tipo de contraste y el sentido (bilateral o unilateral) de las
hiptesis, en el otro.

Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 13
2. En concreto, obtener una estimacin puntual y por intervalo, al 95%, para el consumo
medio de los automviles en ciudad (MPG City), suponiendo que dicha variable sigue
una distribucin normal. Se puede afirmar, a nivel 0.05, que dicho consumo es de 23
millas por galn? En caso de rechazar dicha hiptesis, que podemos afirmar sobre
dicho consumo medio?

Analizar, por un lado, el efecto que tiene sobre el intervalo una disminucin en el nivel de
confianza (90%) y, por otro, el efecto que tiene sobre el contraste de hiptesis exigir un
nivel de significacin menor (0.01). Analizar los cambios en el p-valor para las distintas
determinaciones de la hiptesis alternativa (Diferente de, Menor que, o Mayor que).


Los intervalos de confianza y los contrastes de hiptesis para la diferencia de medias y el
cociente de varianzas en poblaciones normales independientes estn disponibles
siguiendo la secuencia CompararDos MuestrasMuestras Independientes.

Los datos se pueden introducir de dos formas, segn cmo estn disponibles en el fichero:
cada muestra en una columna o una columna con la variable cuantitativa y otra columna con
la variable categrica que determina las dos muestras.

Ejecutado el procedimiento, se selecciona Comparacin de Medias y Comparacin de
Desviaciones Estndar en Tablas y Grficos. Como siempre las Opciones de Ventana
nos permiten elegir, en cada caso, el nivel de significacin y las hiptesis a contrastar. Como
opciones grficas podemos visualizar los histogramas enfrentados y el diagrama de caja
mltiple de los datos.


3. Podemos afirmar, para =0.1, que los automviles americanos tienen, por trmino
medio, un consumo igual al del resto de los automviles? Utilizar para ello un intervalo
de confianza y un contraste suponiendo que la variable, en las dos situaciones, sigue
una distribucin normal.

Siguiendo la secuencia CompararDos MuestrasMuestras Independientes y
elegida la opcin Columna de Cdigos y Datos, se seleccionar la variable MPG City,
en Datos, y la variable Domestic, en Cdigo de Muestra.


Los intervalos de confianza y los contrastes de hiptesis para la diferencia de medias en
poblaciones normales pareadas estn disponibles siguiendo la secuencia CompararDos
MuestrasMuestras Pareadas.

En datos se introducen las dos muestras y en Tablas y Grficos se eligen los
procedimientos Intervalos de Confianza y Prueba de Hiptesis.

En Opciones de Ventana podemos elegir, en cada caso, el nivel de confianza, de
significacin y las hiptesis a contrastar.



Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 14
El anlisis de correlacin est disponible siguiendo la secuencia DescribirDatos
NumricosAnalisis Multi variado y, eligiendo Correlaciones en Tablas y Grficos.

El anlisis nos proporciona el coeficiente de correlacin muestral y el p-valor del contraste
bilateral de incorrelacin.

4. Se puede afirmar, a un nivel de 0.05, que no existe correlacin entre el consumo (MPG
City) y el peso (Weight) de los automviles. Si rechazamos esta hiptesis, cul es el
sentido de dicha correlacin?


En Statgraphics Centurin se pueden obtener intervalos de confianza y contrastes de
hiptesis adems de para poblaciones normales (medias y desviaciones), para proporciones
y para la media de una variable de Poisson (tasa), con una y dos muestras, utilizando como
datos de entrada los resmenes estadsticos de las muestras.

As, la secuencia DescribirDatos NumricosPruebas de Hiptesis permite obtener
contrastes de hiptesis sobre la media y la varianza de una poblacin normal, sobre una
proporcin y sobre la media de una variable de Poisson.

En estos casos se introducen como datos los resmenes correspondientes (media y
desviacin muestral, proporcin muestral o media muestral, segn el caso) y el tamao de la
muestra. El procedimiento permite elegir el nivel de significacin y las hiptesis.

Con la secuencia HerramientasDeterminacin del Tamao de la MuestraUna
Muestra se obtiene el tamao muestral necesario para conseguir una precisin y una
fiabilidad determinadas del intervalo de confianza o para conseguir un cierto valor de la
potencia del contraste de hiptesis.

De la misma forma, en CompararDos MuestrasPruebas de Hiptesis se obtienen los
contrastes de diferencia de medias y de razn de varianzas, para poblaciones normales, as
como de diferencia de proporciones y diferencia de tasas de Poisson.

La secuencia HerramientasDeterminacin del Tamao de la MuestraDos Muestras
permite obtener el tamao muestral necesario para conseguir una precisin y una fiabilidad
determinadas o para conseguir una cierta potencia en la comparacin de poblaciones.

Tanto para una muestra como para dos muestras los procedimientos permiten visualizar la
funcin de potencia de los contrastes.




Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 15
IV. Contrastes de Hiptesis No Paramtricas

Estudiaremos ahora los contrastes no paramtricos trabajando con el mismo fichero.

Agrupar la variable MPG City en cuatro niveles, consumo alto, MPG 20, consumo medio-
alto, 20<MPG 25, consumo medio-bajo, 25<MPG35, y consumo bajo, MPG>35. Para
ello, copiar la variable MPG con el nombre NIVMPG, seleccionarla, abrir una ventana con el
botn derecho del ratn y elegir Recodificar Datos. Recodificar la variable NIVMPG
especificando los lmites de los intervalos: 0-20, nuevo valor 1, 20-25, nuevo valor 2, etc.

1. Podemos afirmar, para =0.01, que los cuatro niveles de consumo son igualmente
probables?

Para realizar el test de bondad de ajuste de la
2
de Pearson se sigue la secuencia
DescribirAjuste de DistribucionesAjuste de Datos no Censurados y despus de
introducir la variable NIVMPG y la distribucin que queremos ajustar (en este caso una
Uniforme Discreta) en Tablas y Grfico se elige Pruebas de Bondad de Ajuste. A
continuacin en Opciones de Ventana se elige la prueba Chi-cuadrado (
2
). El
procedimiento proporciona el valor muestral del estadstico, los grados de libertad y el p-
valor.

2. Podemos aceptar, a un nivel de 0.05, que las variables MPG City y WEIGHT siguen una
distribucin Normal?

Se trata de un contraste de bondad de ajuste que se puede realizar mediante el test de
bondad de ajuste de la
2
(utilizando los datos agrupados, con la consiguiente prdida de
informacin) o mediante el test de bondad de ajuste de Kolmogorov-Smirnov, ms adecuado
en este caso.

Para ello, se sigue la secuencia DescribirAjuste de DistribucionesAjuste de Datos
no Censurados y despus de introducir la variable a analizar y la distribucin que queremos
ajustar (la Normal), en Tablas y Grficos se selecciona Pruebas de Bondad de Ajuste. El
programa proporciona el test de Kolmogorov-Smirnov, calculando el valor muestral del
estadstico D
n
, es decir, la mayor diferencia absoluta entre la funcin de distribucin
emprica y la funcin de distribucin terica, y el p-valor.

Si se desea realizar el contraste mediante el test de bondad de ajuste de la
2
se debe
escoger ste en Opciones de Ventana, eligiendo, si se quiere, las clases equiprobables o
no. Tras agrupar la variable en un nmero de intervalos, la salida muestra la tabla con las
frecuencias observadas y esperadas, el valor muestral del estadstico y el p-valor

3. Si la suposicin de normalidad sobre el consumo de los coches americanos y sobre el
consumo del resto de los automviles no se puede aceptar, contrastar mediante una
prueba no paramtrica si existen diferencias en el consumo segn el origen del
automvil.

Una posible forma de resolver este contraste de igualdad de distribuciones es mediante el
test de Kolmogorov-Smirnov para dos muestras, que se obtiene siguiendo la secuencia
CompararDos Muestras/ Muestras Independientes.
Departamento de Economa Aplicada (Estadstica y Econometra).
Facultad de Ciencias Econmicas y Empresariales. Universidad de Valladolid 16
A continuacin, se introduce la variable MPG City y en cdigo de Muestra la variable
Domestic y en Tablas y Grficos se selecciona Prueba de Kolmogorov-Smirnov Test.

El procedimiento proporciona la salida con los valores muestrales de los estadsticos
2 1
,n n
D y
2 1
,
2 1
2 1
n n
D
n n
n n
+
y el p-valor resultante. Como opcin grfica se pueden mostrar los cuantiles
para las dos muestras.


4. Podemos afirmar, a un nivel de 0.01, que el nivel de consumo y el origen del automvil
son independientes?

Para realizar el test de independencia de la
2
de Pearson se sigue la secuencia
DescribirDatos CategricosTabulacin Cruzada, introduciendo la variable NIVMPG y
la variable Domestic.

En Tablas y Grficos se selecciona Tabla de Frecuencias y Prueba de Independencia.

En las ventanas de texto aparecen la tabla cruzada de las dos caractersticas (Opciones de
Ventana permite incluir en la tabla los porcentajes por filas, por columnas, totales, valores
esperados, etc.), el valor muestral del estadstico
2
y el p-valor correspondiente.



Nota: Estadsticos en muestreo de poblaciones normales:

Sea ( , ) X N y una m.a.s. de tamao n de ella:
1 n
c
X
t
S n



2
2
S
n


1
2


Sean
1 1 1
( , ) X N y
2 2 2
( , ) X N independientes y dos m.a.s. de ellas de tamao
1
n y
2
n , respectivamente, entonces:
o cuando
1 2
= ,
1 2
1 2
1 2
1 2
2
2 2
1 2
1 2 1 2
( ) ( )
1 1
2
n n
X X
X X
t
n S n S
n n n n

+


+
+
+

o cuando
1

2
,


t
n
S
n
S
X X

+

2 1
2 1
2 1
2
2
c
2
1
c
) ( ) (
, donde =
1
) (
1
) (
2 1
2
/
c
2
/
c
2
c c
2
2
2
1
2
1
2
2
2
1
2
1

+
n
n S
n
n S
n
S
n
S

o
1
1 2
2
2
2
1
1, 1
2
2
2
c
n n
c
S
F
S