Sie sind auf Seite 1von 11

INSTITUTO POLITCNICO NACIONAL

ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

Practica 1

Estadsticas descriptica en PAST 3.10 a


1 ASPECTOS GENERALES DE PAST
El programa fue diseado originalmente como PALSTAT, un software para el anlisis de los datos
paleontolgicos escrito por P.D. Ryan, D.A.T. Harper y J.S. Whalley (Ryan et al., 1995).
El desarrollo continuo durante ms de diez aos ha pemitido que PAST se haya convertido en un paquete
estadstico muy completo, utilizado tanto por paleontlogos, as como por muchos otros campos de las
ciencias biolgicas, ciencas de la tierra, ingeniera y economa.
La ltima versin del pasado, junto con la documentacin se encuentran disponibles en
http://folk.uio.no/ohammer/past.

1.1 LA HOJA DE CLCULO Y EL MEN EDITAR


PAST tiene una interfaz de usuario de hoja de clculo. Los datos se introducen como una matriz de celdas,
organizado en filas (horizontalmente) y columnas (verticalmente).

1.2 INTRODUCCIN DE DATOS


Para introducir datos en una celda, haga clic en la celda con el ratn. Las celdas tambin se pueden navegar
con las teclas de flecha arriba-abajo-izquierda-derecha. Cualquier texto puede introducirse en las celdas,
pero la mayora de las funciones se esperan nmeros. Tanto coma (,) y el punto decimal (.) Se aceptan
como separadores decimales.
Datos de Ausencia / presencia se codifican como 0 - 1, respectivamente. Cualquier otro nmero positivo se
interpreta como presencia. Matrices de Ausencia / presencia se pueden mostrar con los cuadrados negros
para presencias marcando la casilla modo Square.
Datos de secuencias genticas se codifican utilizando C, A, G, T y U (tambin se aceptan minsculas).
Los datos faltantes se codifican con signos de interrogacin ("?").
La convencin en PAST es que los elementos ocupan las filas y las variables las columnas. Por lo tanto, tres
individuos de braquipodos pueden ocupar las filas 1, 2 y 3, con sus longitudes de anchuras y largo en las
columnas A y B.
El anlisis de agrupamiento (cluster) ser siempre para las filas. Para el anlisis en modo Q de asociaciones,
las muestras (sitios), se deben introducir en filas, mientras que los taxones (especies) en las columnas. Para
el cambio entre el modo-Q y el modo-R modo, las filas y columnas se pueden alternar mediante la
operacin de transposicin (Edit/Rearrange/Transpose).

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

1.3 COLORES Y SMBOLOS DE LAS FILAS


A cada fila se le puede dar un color y un smbolo (punto, cruz, cuadrado, etc) y que son utilizados en los
diagramas de dispersin y otras grficas. Seleccione la opcin Row atributes ' para editar las filas y los
colores de forma individual, o utilizar la funcin Row colors / simbols" para ajustar todas las filas
seleccionadas al mismo tiempo.

1.4 EL MEN TEXTUAL DE PAST


El men textual cuenta con 8 mens textuales de entradas:

En esta prctica solo se revisar File, Edit, Plot y Univariate.

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

Men File

Men Edit

Men Plot

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

2 IMPORTAR DATOS A PAST DESDE UN ARCHIVO DE EXCEL *.XLS


Seleccione File/Open e indique la ruta donde se encuentre el archivo PST-2007.xls En la ventana indique
el tipo de archivo y seleccione Excel files (*.xls):

A continuacin aparecer la siguiente ventana:

Seleccionar Rows contain / Only data cells y en Columns contain / Name, data

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

3 MEN PLOT
Las grficas que incluye PAST en su men Plot son: Graph, XY Graph, XY graph with error bars, Histogram,
Bar chart/box plot, Percentiles, Normal probability plot, Ternary, Bubble plot, Matrix y Surface. A
continuacin se describen solo alguno de estos tipos de grficas:
Graph. Seleccione todos sus datos con Edit/Select All o bien con Ctrl + A; luego desde Plot/Graph obtenga
la grfica de tendencia anaual.
La grfica obtenida con Graph, representa una o ms columnas por separado. Las coordenadas x se
ajustan automticamente a 1,2,3, ...n
Hay cuatro estilos de trazado disponibles: Line, Points, Line + points y Barchart.
La opcin "Log Y" transforma los valores en logaritmo base 10. Para valores <= 0, el se establece en 0.
La secuencia se puede alisar con una media mvil de 3 datos.
Los valores ausentes se descartan.

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

4 EL MEN STATISTICS
Esta funcin calcula una serie de estadsticas descriptivas bsicas para una o ms muestras (columnas) de
datos univariados. Cada muestra debe tener al menos 3 valores. Las columnas pueden tener diferentes
nmeros de valores. Para obtener la estadstica descriptiva de cada estacin seleccione desde el men
Univariate/Summary Statistics y le aparecer una ventana con el resumen de los estadsticos descriptivos
de cada estacin de monitoreo atmosfrico.

Para cada muestra se calcula:


N: El nmero de datos n en la muestra
Min: El valor mnimo
Max: El valor mximo
Mean: La media y que se calcula con la siguiente expresin:

Std. error: El error estndar de la estimacin de la media, calculada como:

Donde s es la estimacin de la desviacin estndar (vase ms adelante)


8

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

Variance: La varianza de la muestra calculada como:

Stand. dev.: La desviacin estndar de la muestra calculada como:

Mediana: La mediana de la muestra. Para n impar, el valor central divide en partes iguales, por encima y
por debajo, al conjunto de datos. Para n par, se calcula como la media de los dos valores centrales.
25 prcntil: El percentil 25, es decir, el valor que separa el 25% de la muestra inferior del 75% superior. Para
su clculo se utiliza el mtodo de "interpolacin" (ver grfica de Percentil).
75 prcntil: El percentil 75, es decir, el que separa el 75% de la muestra inferior del 25% superior. Se utiliza
el mtodo de "interpolacin" (ver grfica de Percentil).
Skewness (Asimetra): La asimetra de la muestra, con un valor de cero para una distribucin normal,
positivo para una cola a la derecha. Calculado como:

Tenga en cuenta que hay varias versiones de esta frmula. PAST utiliza la misma ecuacin que SPSS y Excel.
Resultados ligeramente diferentes pueden producirse usando otros programas, especialmente para
muestras pequeas.
Kurtosis (Apuntamiento): La curtosis de la muestra; cero para una distribucin normal. Calculado como

Geom. mean: La media geomtrica. Calculada como: (X1X2X3) 1/n


Coeff.var.: Coeficiente de variacin, relacin de la desviacin estndar de la media:

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

5 NORMALIDAD DE LOS DATOS


Un caso especfico de ajuste a una distribucin terica de probabilidad es la correspondiente a la
distribucin normal. Este contraste se realiza para comprobar la normalidad de los datos, necesaria para
que el resultado de algunos anlisis sea fiable, como por ejemplo para el Anlisis de Varianza (ANOVA).
Para conocer si los datos se ajustan a la distribuacin normal en Past se pueden realizar una serie de
pruebas entre las que se encuentra el estadstivo de Shapiro Wilk (W) o grficas de normalidad (Q-Q Plot).
En el primer caso seleccion el men Univariate/Normality tests:

Para las tres pruebas, la hiptesis nula es:


H0: La muestra fue tomada de una poblacin con la distribucin normal.
Si el valor de p(normal) es menor de 0.05, la distribucin normal se rechaza (marcado en color rosa). Las
pruebas de Shapiro-Wilk y Anderson-Darling se consideran la ms exactas en comparacin con la de JarqueBera.

10

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA
Evaluar mediante inspeccin visual la normalidad de las puntuaciones. Los grficos ayudan al investigador a
juzgar si sus datos proceden de una distribucin normal. Por ejemplo, si los datos proceden de una
distribucin norma cabe esperar que la distribucin no tendr una fuerte asimetra.
Sin embargo, con pocos datos no es fcil obtener conclusiones consistentes y de ah que se hayan ideado
grficos concretos para observar la normalidad de las puntuaciones de una variable.
El anlisis grfico de la normalidad se puede definir cuando la distribucin observada en las puntuaciones
de una grfica de normalidad (men Plot/Normal probability plot) se ajusta a la terica entonces los puntos
se representan en lnea recta en la diagonal. Si el ajuste no es bueno entonces la distribucin de las
puntuaciones adopta otras formas:

Grfica de normalidad:

Grficos para observar la normalidad de las puntuaciones de una variable:


-Histrograma (men plot/Histrogram).
-Grficas de cajas y bigotes (men plot/Barchart Boxplot).
-Grficas de normalidad (men Plot/Normal probability plot).
-Grficas de percentiles (men plot/Percentiles).

11

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

Las grficas ayudan a evaluar mediante inspeccin visual la normalidad de las puntuaciones.

Las principales ventajas de las grficas de distribucin son la sencillez de interpretacin, la extensin a
cualquier tipo de distribucin y, en el caso de la distribucin normal, la facilidad de obtener el diagrama
ya que est implementado en muchos paquetes estadsticos. Adems, no requieren muestras tan
numerosas como algunos tests de normalidad.
El principal inconveniente es la subjetividad de la interpretacin visual, ya que al contrario de los tests de
normalidad numricos no se concluye con una p de probabilidad objetiva.

12

INSTITUTO POLITCNICO NACIONAL


ESCUELA NACIONAL DE CIENCIAS BIOLGICAS

ESTADSTICA APLICADA

6 ANLISIS DE LAS ESTACIONES DE MONITOREO ATMOSFRICO


1. Obtenga las grficas (men / Plot):
Graph, con tres puntos promedio y las 6 estaciones en la misma grfica.
Histogram, por separado cada una de las seis estaciones, utilice el mismo nmero de clases en
cada caso
Box plot, en las que se muestren las seis estaciones en la misma grfica.
Percentiles, en las que se muestren las seis estaciones en la misma grfica.
2. Describa el comportamiento general de cada una de las grficas obtenidas.
3. Obtenga el resumen de estadsticos (Univariate / Summary statistics) de cada estacin.
5. Describa el comportamiento de las partculas suspendidas totales del ao 2007 con base en sus
grficas y estadsticos descriptivos de cada una de las estaciones proporcionadas.
6. Responda las siguientes preguntas:
I.
II.
III.
IV.
V.
VI.
VII.
VIII.
IX.
X.
XI.

Cul fue la estacin con la concentracin de PST anual ms alta?


Cul estacin registr la mayor variacin en sus datos?
Qu estacin registr el valor de PST ms alto?
Qu estacin registr el valor de PST ms bajo?
Qu estacin present una media poco representativa? Diga porqu llego a esa
conclusin.
Qu estaciones tiene una mayor asimetra y cules estn sesgadas? (apyese a la grfica
de percentiles e histograma).
Qu estaciones de acuerdo con la norma rebasan en algn mes los lmites permisibles de
PST en el 2007?
Por encima de que valores est el 75% de las observaciones de las estacione?
Explique las medidas de tendencia central de cada estacin (media, mediana y moda).
Explique las medidas de dispersin de cada estacin (CV, desviacin estndar, varianza).
Evaluar mediante inspeccin visual la normalidad de las puntuaciones de PST para las
estaciones de Cerro de la Estrella, Xalostoc y El Pedregal.

13

Das könnte Ihnen auch gefallen