Sie sind auf Seite 1von 7

MATEMTICA Y ESTADSTICA

Trabajo Prctico No. 2: Estadstica descriptiva I: Grficos y tablas


Contenido: Sntesis e interpretacin de informacin. Construccin e interpretacin de grficos.
Tablas de datos. Distribucin de frecuencias.
Lecturas recomendadas: Spiegel, 1991. Cap. 1: 1-36; Cap. 2: 37-59; Sokal & Rohlf, 1979. Biometra.
Cap. 2: 19-44. Merodio, 1986. Cap.1: 5-9. Mendenhall W., Wackerly D. D. Scheaffer R. L. 1990 Cap 1
Zar, H.J. 2009 Cap 1

Idea principal
El objetivo de la estadstica descriptiva es resumir la informacin contenida en un conjunto de datos de la
manera ms concisa y completa posible. Esto puede hacerse mediante la construccin de tablas y
grficos y la determinacin de ciertos nmeros llamados estadsticos.
Cuando el nmero de observaciones es grande, en general mayor que 30, los datos se resumen en una
distribucin de frecuencias. La distribucin de frecuencia se logra agrupando los datos en clases o
categoras en las que se renen subconjunto de datos y registrando la frecuencia absoluta, el nmero
de datos que se encuentran en cada clase. Cuando la frecuencia se expresa como el cociente entre la
frecuencia absoluta de una clase y el nmero total de datos se denomina frecuencia relativa.

2.1) Un profesional de las Ciencias Naturales desea mostrar grficamente en un congreso los
resultados que apoyan la hiptesis que una industria de pinturas est contaminando el agua de
un arroyo al cual evacua sus efluentes con plomo. Para ello extrae 60 muestras de agua, 30
tomadas aguas arriba del establecimiento y las otras 30 aguas abajo. Los datos consisten en
valores de concentracin Pb (mgr/l) encontrado en el agua y se presentan a continuacin.
Aguas arriba del establecimiento:
8 10 6 9 4 7 5 12 8 7
8 7 12 5 6 9 7 10 6 8
6 4 5 9 8 11 8 6 12 9

Aguas abajo del establecimiento:


9 12 8 15 12 10 7 12 10 14
12 13 10 12 9 12 7 13 15 10
9 14 10 10 13 12 12 15 11 9

Represente los datos de manera que se visualice claramente lo que el profesional desea poner de
manifiesto Le parece que los datos respaldan la hiptesis del profesional?
2.2) Los datos siguientes corresponden a la humedad relativa ambiente (%) de los das de enero
de 2010 de la ciudad de La plata:
55, 51, 60, 56, 64, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62,
59, 64, 57, 63, 52.
a) Construya una tabla de frecuencias, un histograma y una ojiva con los datos agrupados en
5 categoras de igual tamao.
Amplitud del intervalo: A = (valor ms alto valor ms bajo) / nmero de intervalos

b) Comparar el histograma obtenido con los histogramas resultantes de agrupar los datos en 3
y 10 intervalos de clase que se muestran a continuacin. Indicar en cul arreglo en
intervalos se originan grficos que representen mejor los datos. Justifique.
7

18

14

Nmero de observaciones

Nmero de observaciones

16

12
10
8
6
4

5
4
3
2
1

2
0

0
45,0000

54,6667

64,3333

74,0000

45,0

Humedad relativa

47,9

50,8

53,7

56,6

59,5

62,4

65,3

68,2

71,1

74,0

Humedad relativa

c) Entre que valores de humedad se encuentra el 50% central de los das del mes?
d) A partir de que valor se encuentra el 10% de los das ms hmedos?
e) Si descontamos el 15 % de los das menos hmedos y el 15% de los ms hmedos En
qu intervalo de valores se encuentran los das restantes?

19

MATEMTICA Y ESTADSTICA

2.3) Construya el grfico bivariado de dispersin con los datos de Gamma Ray y Porosidad total
obtenidos de un pozo de petrleo Existe alguna relacin entre las variables? Descrbala.
Gamma ray
96,22
94,32
94,79
94,84
94,11
95,42
96,71
98,16
103,40
105,89

Porosidad total
0,04
0,03
0,03
0,04
0,04
0,05
0,06
0,08
0,09
0,10

2.4) Los siguientes datos modales1 corresponden a componentes de arenas de 3 muestras de una
seccin subvertical del Patagoniano.
a) Identificar el/los tipos de variable.
b) Elaborar grficos que permitan comparar la composicin total de cada muestra.
c) Recalcular los valores de Qm, F y Lt, para graficar los datos en el diagrama triangular adjunto
(A = Qm, B = F, C = Lt). Clasificar las muestras utilizando el diagrama triangular de Folk et al.
(1970).
Techo
52
87
9
96
63
307

Qm
F
Qp
Lt
Matriz
Total de granos contados

Media
148
128
56
154
137
623

Base
99
153
40
204
157
653

Qm: cuarzo monocristalino, F: feldespato, Qp: cuarzo policristalino, Lt: lticos

En petrografa se llama Datos modales a los datos que se obtienen a partir de determinar cuantitativamente la composicin de los granos y el
recuento de estos en el microscopio. Se utiliza una la platina graduada que permite el movimiento de un corte delgado a un cierto intervalo de
distancia, formando una red de puntos en un sistema de coordenadas (x-y). En esta tcnica se registra por cada punto la composicin del grano
localizado en el centro de la retcula. Dependiendo de los objetivos del conteo de partculas es la metodologa empleada y su s restricciones, por
ejemplo se puede considerar solo un tamao de grano, solo contar las partculas o tambin la matriz y cementante, o bien granos de una sola
composicin.

20

MATEMTICA Y ESTADSTICA

Ejercicios complementarios
2.5) Se obtuvieron muestras de sedimentos de un ambiente actual donde los procesos de
transporte y depositacin dominante es el transporte por el agua (ambiente fluvial). Se desea
caracterizar el sedimento por medio del anlisis textural. Para ello se procesan los datos obtenidos
a partir del tamizado2.
a) Construya un histograma y un grfico de frecuencias acumuladas con los datos de un
anlisis granulomtrico que se presenta a continuacin.
b) Calcule el tamao granulomtrico en escala phi (-log2 dimetro del clasto en mm)
correspondiente a 5%,16%, 25%, 50%, 75%, 84% y 95%.
phi
-2,00
-1,75
-1,50
-1,25
-1,00
-0,75
-0,50
-0,25
0,00
0,25
0,50
0,75
1,00
1,25
1,50
1,75
2,00
2,25
2,50
2,75
3,00
3,25
3,50
3,75
4,00
4,25

2.6)

Peso neto
1,73
6,34
0,40
3,04
9,42
5,21
3,54
3,90
4,26
5,90
2,71
7,91
4,34
3,88
7,71
6,02
9,06
6,10
4,66
4,07
3,90
2,48
1,92
1,21
1,02
0,53

Peso acumulado

Peso acumulado %

Interpretacin de grficos. En todos los casos identificar el o los materiales muestreados y el


tipo de variable. Interpretar los grficos.
El volcn Copahue, es un estratovolcn activo de 2297 metros de altura,
localizado en la parte oriental de la zona volcnica de Los Andes, al Sur-Oeste
de la Repblica Argentina, cerca del lmite con Chile. La presencia de un lago
cido en el crter, fuentes termales cidas de elevada temperatura que
emergen del flanco E del volcn, y un campo geotermal, son las expresiones
superficiales de un sistema hidrotermal volcano-magmtico. Los datos
presentan resultados parciales de un mo nitoreo de las aguas ubicadas en el
crter, la vertiente norte y el Ro Agrio.

Para realizar los anlisis granulomtricos de sedimentos actuales se elimina la materia orgnica, los carbonatos, el ox ido de hierro y las
sales solubles. Luego se arma una pila de tamices cuyas aberturas responden a la escala granulomtrica adoptada para el anli sis, en la
base se coloca un fondo y hacia arriba se colocan las mallas en orden creciente de abertura. Se vier te el sedimento seco en el tamiz
superior, se tapa y la pila de tamices se introduce en una maquina agitadora por 15 minutos. Finalizado el tamizado se vaca el contenido
de cada tamiz y el retenido en el fondo sobre un papel y se pesa al miligramo.
Folk y Ward (1957), propusieron utilizar los grficos de frecuencia acumulada que surgen de los anlisis granulomtricos de sedime ntos se
pueden usar para caracterizar los sedimentos de distintos ambientes actuales. Los grficos se realizan poniendo en el eje horizontal el
tamao de grano en escala phi (-log2 dimetro mm) y en el eje vertical peso acumulado %.

21

MATEMTICA Y ESTADSTICA

El Complejo Volcnico Planchn- Peteroa se ubica en la Cordillera de Los Andes a los


35 15 L.S. y 70 35 L.O. incluye dos cumbres principales: al norte, el volcn Planchn
(3920 m s.n.m.) y 5 km al sur el volcn Peteroa (4107 m s.n.m.). Entre los crteres
actualmente hay manifestaciones fumarlicas resultados de emisiones difusas de
dixido de carbono (flujo de CO2) asociadas a la actividad geotermal. Se realiz un
muestreo de las emisiones de CO2 en el valle del arroyo Los Baos del Volcn PeteroaAzufre en donde se encuentran construidas piletas individuales de agua termal de uso
pblico.

El volcn Hudson, localizado al sur de Chile, entr en erupcin


intempestivamente entre el 12 y el 15 de agosto de 1991. Las
cenizas se esparcieron alcanzando la Patagonia Argentina y
produjeron un gran impacto sobre la agricultura. La figura muestra
algunos indicadores de la fertilidad del suelo. CEC: Capacidad de
intercambio Catinico (me/100 g), Olsen P: Fosforo extrable por el
mtodo de Olsen (gP/g), Mg (e/100g), Ashfall thickness (mm).

Caracterizacin de los sedimentos aflorantes en la ladera norte del valle del ro


Jarilla, el principal afluente al ro Desaguadero proveniente desde el este, en
proximidades de la ruta Nacional N 7, provincia de San Luis . El grfico de
conductividad elctrica versus profundidad permite inferir, en forma relativa, el total
de sales solubles que poseen los sedimentos.

22

MATEMTICA Y ESTADSTICA

Trabajo Prctico No. 3: Estadstica descriptiva II:


Contenido: Medidas de tendencia central y de dispersin. Tratamiento de Valores 0 y de Valores extremos
(outliers). Uso de calculadora.

Lecturas recomendadas: Spiegel, 1991. Cap. 3: 60-90; Cap. 3: 91-115. Sokal & Rohlf, 1979. Biometra.
Cap. 4: 51-76. Merodio, 1986. Cap.1: 9-18. Chou, Cap. 3 : 43-68. Mendenhall, 1990. Cap.3: 29-63. Zar, H.J.
2009 Cap. 3 y 4.

Idea principal
La descripcin de los datos se completa calculando valores que caracterizan numricamente al conjunto
llamadas estadsticos. Existen medidas que describen la posicin de los valores centrales y de valores
especiales, de la dispersin de los datos y la forma de la distribucin. Las principales medidas de posicin que
dan una idea del centro de los datos son la media aritmtica, la mediana y moda. Las medidas que dan cuenta
de la posicin de valores especiales se llaman cuantiles. Las medidas de dispersin describen la
variabilidad de los datos respecto de alguna medida de posicin, en general alrededor de la media, las
principales son el rango, la varianza y la desviacin estndar y el coeficiente de variacin.
Existen otras medidas que describen la forma de la distribucin: la asimetra y la curtosis.

PARA EL DESARROLLO DEL TRABAJO PRACTICO ES NECESARIO UNA CALCULADORA


CIENTIFICA (CON EL MANUAL)
3.1) Con los datos de concentracin de un metal pesado obtenidos aguas arriba y aguas debajo
del arroyo al cual la industria del problema 2.1 evacua sus efluentes: calcule la media, la
desviacin tpica y el coeficiente de variacin de los datos de cada sitio sin agrupar y agrupados
en clases. Realice un grafico de caja y bigote (box-plot) con los estadsticos calculados con los
datos sin agrupar.
- Qu estadstico utilizara para apoyar la hiptesis que la industria est contaminando el agua de
un arroyo al cual evacua sus efluentes? Por qu?
- Qu estadstico permite analizar la variabilidad de los datos? Dnde es mayor la variacin de
la concentracin del metal? A qu puede deberse?
3.2) Con los datos del ejercicio 2.2 del porcentaje de humedad relativa ambiente de los das de
enero en La Plata calcule:
a) La media, mediana, moda, el primer y el tercer cuartil y el desvi estndar de los datos sin
agrupar.
b) La media, mediana, moda el primer y el tercer cuartil y el desvi estndar de los datos
agrupados en 5 intervalos.
c) Compare los resultados obtenidos en a y b Qu efecto tiene el agrupamiento en los
resultados? Qu sucede con la exactitud?
3.3) El coeficiente de variacin es un indicador de la heterogeneidad del yacimiento que se utiliza
para planificar la distancia ptima y volumen de roca en las etapas de muestreo preliminares que
se realizan para estimar la ley. En las primeras etapas de exploracin de yacimientos vetiformes
de oro en la provincia de Santa Cruz, se realiz un muestreo preliminar de la veta Carla
aproximadamente cada 30 metros con los siguientes resultados (Au gr/t):
0.7

2.3

2.7

2.5

3.1

3.5

4.6

2.5

12.6

10.4

5.3

2.7

3.9

Calcule el coeficiente de variacin de los datos. Utilice la informacin de la tabla adjunta para
definir la distancia entre caneletas en un muestro de detalle.

23

MATEMTICA Y ESTADSTICA

Coef.Variabilidad
/Clasificacin
<20 %
Muy regulares
20-40 %.
Regulares
40-100 %
Irregulares
100-150 %
Muy Irregulares
>150 %
Extremadamente
Irregulares

Distancia
Canaletas
(m)

Seccionado
Testigo
(m)

Red de
sondeos
(m)

Valor K

Tipo de
yacimientos

15 - 50

5 - 15

200 x 200

0,05-0,1

Sedimentarios

4 - 15

2-5

100 x 100

0,1-0,2

Sed.+complejos

2,5 - 4

1-2

50 x 50

0,3-0,5

Polimetlicos Cobre ect.

1,5 2,5

0,5 -2

25 x 25

0,6 0,8

Estao - oro ect.

1 1,5

1 0,5

No
determinado

0,8-1

Oro Platino

3.4)
El tratamiento de los datos cero (0): Existen 3 tipos de datos cero:
a) Los valores de la variable que corresponden al valor 0. Para los clculos de los estadsticos se incluyen
con la jerarqua de cualquier otro valor.
b) Valores 0 que indican dato ausente ya sea que no se ha medido esa variable en el espcimen o se ha
perdido la informacin. Para los clculos de los estadsticos en esas variables se realizan con los valores
disponibles, es decir se disminuye el tamao de la muestra
c) Los 0 por redondeo. Este tipo es muy comn en geologa y suelen estar relacionados con el lmite de
deteccin del aparato o metodologa utilizada para cuantificar los valores de la variable. Su aparicin es
frecuente en datos de geoqumica de roca, tanto de elementos mayoritario como traza. En las tablas de
datos son indicados de la forma <valor o -valor. Una estrategia habitual para el clculo de los
estadsticos, es reemplazar estos valores por la mitad del valor del lmite de deteccin, por ejemplo si el
lmite de deteccin es 0,01, se reemplazan por 0,005.

a) Se ha realizado un estudio geoqumico de un muestreo de corriente por contenido en Oro. El


mtodo de anlisis utilizado no detecta contenidos menores a 0,01 ppb. Los resultados obtenidos son
los siguientes:
0,5 - <0,01 - 0,51 - <0,01 - 0,04 - 0,03 - <0, 01 - 0,07 - 0,12 - 0,55 - <0, 01 - 0,15 - 0,04 - 0,12 - 0,07 - <0,01

Marque con una cruz la respuesta correcta,


i) Media = 0,138
ii) Media = 0,139

iii) Media = 0,20

b) Los siguientes datos de saturacin de agua corresponden a una seccin de un pozo de petrleo, la
herramienta registra los datos ausentes con 9999.
0,26

0,36

0,47

9999

9999

0,59

0,57

0,56

Marque con una cruz la respuesta correcta,


i) Media = 0,51
ii) Media = 2143,04

0,54

9999

0,55

0,58

0,57

0,53

iii) Media = 0,40

3.5)
El trabajar con datos producto de algn proceso de medicin o recuento y de la captura de los mismos se
pueden observar datos extraos. Se trata de valores que se sospecha que no pertenecen al conjunto de
datos y que se han registrado por un error de medicin, un error de transcripcin al momento de registrarse
los datos, o bien se producen por algn suceso sumamente extrao. En estadstica a estos valores se les
llama outliers. Existen diversos criterios para detectar outliers en un conjunto de datos. Uno de los
mtodos ms comunes es el que utiliza el concepto de cuartil (Q).
Para detectar valores outliers moderados, se calcula:
LmInf = Q1- 1,5(Q3-Q1)
LmSup = Q3 + 1,5(Q3-1)

Los valores que sean menores que LmInf o mayores que


LmSup se consideran valores outliers

24

MATEMTICA Y ESTADSTICA

Para detectar valores outliers extremos, se calcula:


LmInf = Q1- 3 (Q3-Q1)
LmSup = Q3 + 3 (Q3-Q1)

Los valores que sean menores que LmInf o mayores que


LmSup se consideran valores outliers

Para Q1 primer cuartil, Q3 tercer cuartil y (Q3-Q1) rango intercuartil.


Para la identificacin de outliers tambin es posible utilizar los grficos box-plot, QQ plots e histogramas.

Los datos que se presentan a continuacin corresponden valores del caudal medio mensual (m3/s)
del mes de diciembre del ro Neuqun, en la estacin Paso de los Indios (383154S, 692451O)
para el periodo 1903 2002. Los datos estn ordenados de menor a mayor. Calcular: la mediana, los
cuartiles 1 y 3, el rango intercuartilico (Q3-Q1) y los lmites superiores e inferiores para calcular
outliers moderados y extremos. Realice un grafico box-plot con los estadsticos calculados.
Identifique y clasifique los valores outlier de esta muestra, a qu supone usted se puede atribuir la
aparicin de estos valores?
55,25
209
296
391,8
503,4
634
772

78,68
210
311
408,5
503,6
635
786

87
224
315
413
506
637
831

90
233
316
414
526
647
841

95
236
339
422
535
648
922

99
237,5
341,8
431,9
535
654
947

108,1
244
344
433
551,1
658
1001

109
245
346
433
563
676,8
1009

114
250
347,7
433
563
707
1167

142
272
357
438
565
717
1183

166
272
358
458
567
718

168
281
365
461
599
744

179
282
370
462
603
760

182
286
373
480
610
765

196
291
380
499
627
768

Ejercicios suplementarios
3.6) Caracterice el sedimento fluvial del ejercicio 2.5 calculando:
a) La media, desvo estndar, asimetra y curtosis usando el mtodo analtico.
b) La media, desvo estndar, asimetra y curtosis usando el mtodo Folk y Ward (1957), a
partir de los datos que surgen del grafico de frecuencia acumulada con las siguientes
formulas obtenidos en el ejercicio 2.5:



X 50
X 16 84 50 ,
S 84 16 95 5
3

CS

16 84 250 (5 95 250 )

284 16
295 5

6,6

95 5
2,4475 25

c) Describir el sedimento utilizando la nomenclatura de McManus (1988) para los valores de


seleccin, asimetra y agudeza.
d) Describir el ambiente de depositacin del sedimento.

3.7) Los siguientes histogramas corresponden a datos de ley de Cu de un depsito diseminado de 4


sectores de un open pit (Ley: concentracin de metal en una mena; Mena: mineral del que se extrae
un metal; Open pit: cantera a cielo abierto). La flecha roja indica la ley media del yacimiento.
a) Describa los histogramas e indique cual sector es el que representa mejor la ley media del
yacimiento en trminos de precisin y exactitud.
b) Analice la relacin entre los conceptos precisin, exactitud, media y desvo estndar.

25

Das könnte Ihnen auch gefallen