Sie sind auf Seite 1von 52

ANLISIS DE DATOS EN ECOLOGA

(Anlisis multivariados)
Pepe ESPINOZA
Clase 3.
Muestra, muestreo, tipos, caractersticas, tamao de
muestra.
Hiptesis, planteamiento, comprobacin. Conceptos
asociados.

Muestra nociones bsicas


Poblacion: es un conjunto de entidades de inters (e.g.
peces, cefalpodos, crustceos, ......)
Muestras: es un subconjunto de entidades azarosamente
obtenidas de la poblacin.

Unidad de anlis
ExtensinMuestras
espacial

Poblacin

La Estadstica responde preguntas


de INVESTIGACIN utilizando
muestras
Unidad de anlisis: es un individuo de la entidad de
inters (e.g. pez, cefalpodo, crustceo, ......).

Muestra nociones bsicas


Ejemplo: Poblacin de peces
Pregunta: hay mas hembras que machos?

ExtensinComo representar
espacial? las muestras?
Poblacin

La Estadstica responde preguntas de


INVESTIGACIN utilizando muestras

Muestra nociones bsicas


Unidad de anlisis
Es la unidad bsica en la que se genera la informacin
primaria que es objeto del estudio (p.ej: un pez, un
alga, un calamar).

Muestra nociones bsicas


Unidad de muestreo
Colecciones o agrupaciones de unidades de anlisis
claramente delimitadas e identificables no solapadas
o disjuntas que cubren completamente a la poblacin
marco de muestreo (p.ej. Un cardumen de peces).

Muestra nociones bsicas


Marco de muestreo
Conjunto conformado por el listado de unidades de
muestreo (p.ej. El conjunto de estaciones de muestreo
en una baha)

Muestra principios fundamentales


1. SIMPLICIDAD. Significa que los elementos que participan en la investigacin y
que pertenecen a la poblacin, deben estar definidos en forma clara, simple y
precisa.
2. REPRESENTATIVIDAD. Las caractersticas relevantes de la poblacin deben
encontrarse en la muestra, slo deben diferir en el nmero de elementos.
3. COMPARABILIDAD. Cuando en un estudio es necesario contar con dos
muestras, entre las cuales se desea establecer alguna diferencia especfica, es
necesario que ambas muestras sean similares en todas las caractersticas, a
excepcin de aquella caracterstica que es motivo de la investigacin.

Muestra estapas de la investigacin


Resumido en 5 pasos:
1. Construir una hiptesis nula (H0) (Pregunta de investigacin)
E.g. pregunta: hay mas hembras que machos?

2. Elegir un anlisis estadstico


E.g. la prueba t para detectar diferencias entre hembras y machos

3. Colectar los datos (muestreo)


E.g. Muestrear hembras y machos

4. Calcular p-valores y la prueba estadstica


Error Comn
Correr prueba t.
Antes del muestreo: (1)
construir la hiptesis y
5. Rechazar/aceptar (H0) si p es pequeo/grande
(2) elegir los anlisis
(RESPONDER LA PREGUNTA)
estadsticos

Muestra nociones bsicas


TENER PRESENTE!

Lo mas claro es la pregunta, mas fcil es el muestreo,


mas simple es el estadstico a ser aplicado.

Preguntas sin sentido y nada claras, y un mal diseo,


van a realizar anlisis mas complejos

Donde ubicarse?

Sin estadstica no se pueden escribir artculos cientficos


Casi)

Muestreo: concepto
MUESTREO
Es un procedimiento por el
cual se estudia una parte
de la poblacin llamada
muestra, con el objetivo de
inferir con respecto a toda
la poblacin.

INFERENCIA
La
inferencia
estadstica
es
la
estimacin
puntual
de un parmetro (por
ejemplo la media
poblacional) a partir
de la informacin
que proporciona una
muestra.

Muestreo: terminologa
1. Poblacin.Es

todo conjunto de objetos, situaciones o sujetos con un rasgo comn.


Es un conjunto de casos que satisface una serie predeterminada de criterios.
2. Muestra. Es un subconjunto de individuos extrados de una poblacin.
3. Unidad de anlisis. Es un sujeto u objeto el cual es motivo de investigacin, al
cual se toma mediciones.
4. Unidad de muestreo. Es un elemento que permite llegar y seleccionar a la unidad
de anlisis. En algunos estudios puede coincidir con la unidad de anlisis.
5. Unidad reportante. Es el sujeto que brinda informacin sobre la unidad de anlisis
(p.e. madres de pacientes peditricos).
6. Marco muestral. Es una lista completa y detallada de las unidades de muestreo.

Muestreo: Consideraciones
TCNICAS
DE
MUESTREO

Cuando elegimos individuo de una


poblacin de estudio para formar
muestras podemos encontrarnos
en las siguientes situaciones:

Conocemos la probabilidad de que un


individuo sea elegido para la muestra.
. Interesantes para usar estadstica
matemtica con ellos.
No se conoce la probabilidad.
Son muestreos que seguramente esconden
sesgos.
En principio no se pueden extrapolar los
resultados a la poblacin.
A pesar de ello una buena parte de los estudios que se
publican usan esta tcnica.

Muestreos
probabilistas

Muestreos no
probabilistas

Muestreo: Consideracin (1)-tipo de


muestreo
TIPOS DE MUESTREO
PROBABILISTICO
Seleccin aleatoria

NO
PROBABILISTICO
Criterio del
investigador

ALEATORIO
SIMPLE
Seleccin de elementos sobre bases
aleatorias partiendo de una estructura
muestral que enumera todos los elementos

SISTEMATICO
Seleccin de una unidad por cada cierto
nmero de casos de alguna lista o grupo

ESTRATIFICADO
Divide la poblacin en subgrupos
homogneos de los cuales se escogen
los elementos en forma aleatoria

CONGLOMERADO
Seleccin sucesiva de muestras
aleatorias de unidades mayores o
menores por mtodos aleatorios
simples o estratificados

POR CONVENIENCIA
Intencional
Sujetos con que puede contarse
ms fcilmente, considerando
unidades supuestamente
tpicas

POR CUOTAS
Accidental
Divide poblacin por subgrupos
segn variables de inters y escoge
sujetos de cada estrato por
extraccin accidental

Muestreo: Consideracin (1)-tipo de


muestreo
Muestreo Aleatorio Simple.
Es el mtodo de muestreo que
asegura que cada una de las
unidades de anlisis (individuo)
tiene igual probabilidad de ser
incluida
en
la
muestra,
igualmente, cada una de las
muestras posibles tendr la
misma probabilidad de ser
elegida;
esta
caracterstica
asegura la representatividad e
imparcialidad de la muestra.

Muestreo: Consideracin (1)-tipo de


muestreo
Muestreo
Estratificado.

Con el fin de asegurar una


mayor representatividad de la
muestra a elegir de la
poblacin
completa,
se
clasifica a la poblacin en n"
estratos independientes; por
tanto, cada estrato constituye
una sub-poblacin con todas
las
caractersticas
y
parmetros de un universo
independiente.
Para
estimar los parmetros de esta poblacin estratificada se
extrae una muestra simple aleatoria en forma independiente de
cada estrato construido tratando a cada estrato como un
universo separado; esta forma de muestrear permitir asegurar
que la muestra total elegida contenga la informacin de todas

Muestreo: Consideracin (1)-tipo de


ISLA SAN
muestreo
LORENZO
DETERMINACN
DE LA
ESTRATIFICACION
DE LOS RECURSOS

Pa lom i n o T 2

Heliaster h elianthus
A c rosada
Phimactis clematis
Rincoc inetes sp
C gibbossus
F brigessi
Pagurido
Phimanth ea pluvia
Tetrapigus niger

A c marron
Megabalanus sp
Thais c hocolata

-5
Profundidad m

Tegula luctuosa
A esp atuligera
Crucibulum sp

-10

Discinisca lamellosa
0

10

11

12

13

14

-15
Profundidad m

-20

-25
0

10 12 14 16 18 20 22 24
26 28 30 32 34 36
Distancia m

15

16

17

18

19

20

21

22

23

24

Muestreo: Consideracin (1)-tipo de


muestreo
0

ISLA SAN
LORENZO

Profundidad m

-5

DETERMINACN
DE LA
ESTRATIFICACION
DE LOS RECURSOS

-10
-15
-20
-25
0

8 10 12 14 16 18 20 22 24 26
28 30 32 34 36

Muestreo: Consideracin (1)-tipo de


muestreo
BAHA INDEPENDENCIA: MUESTREO DE CONCHA DE ABANICO
(Argopecten purpuratus)

Muestreo: Consideracin (1)-tipo de


muestreo

Muestreo Sistemtico
En estos muestreos las muestras se ordenan de
acuerdo a algn criterio, tanto en orden espacial
como en temporal. Comprende la seleccin aleatoria
de una unidad de muestreo inicial, a partir de la cual
las restantes unidades quedan sistemticamente
seleccionadas de acuerdo al lugar que ocupan en la
poblacin.
Muestreo
sistemtico
temporal
Anomala de
temperatura
(C)

Muestreo: Consideracin (1)-tipo de


muestreo
Muestreo sistemtico espacial

ANCHOVETA PERUANA (Engraulis ringens)

Muestreo: Consideracin (1)-tipo de


muestreo

Muestreo de Conglomerados (Racimos).


La unidad muestral es un grupo de elementos de la
poblacin que forman una unidad, a la que llamamos
conglomerado. A diferencia de un estrato, un
conglomerado es una unidad de elementos que
contienen representantes de toda la poblacin
(segn la caracterstica
de la misma que se mida
Colonias de bacterias
durante el experimento)

Muestreo: Consideracin (2)-tamao de


muestra

Por qu calcular el tamao de la muestra?


- Las muestras se pueden estudiar mas
fcilmente que una poblacin.
- Es menos costosa.
- Toma menos tiempo.
- Con frecuencia son mas precisos que los
basados en la poblacin.
Tipos de muestreo:
- Probabilstico: aleatorio simple, sistemtico,
estratificado, por conglomerados.
- No
probabilstico:
accidental,
por
conveniencia, por cuotas, por bola de nieve.

Muestreo: Consideracin (2)-tamao de


muestra

Para determinar el tamao de la muestra, se


debe considerar diferentes situaciones:
- Para determinar parmetros (proporciones,
medias).
- Para contraste de hiptesis, es decir,
pretende comparar si las proporciones o
medias de las muestras son diferentes.
Entonces si queremos determinar hacer
inferencias
de
valores
poblacionales
(proporciones o medias), debemos conocer:
- El nivel de confianza o seguridad (1-). Para
un nivel de seguridad del 95%: =1.96; para
un 99% de seguridad: =2.58.
- Que da lugar a un coeficiente (z).
- La proporcion esperada (p).

Muestreo: Consideracin (2)-tamao de


muestra
Tamao de Mnimo de Muestra para Estudios de
Comunidades

CURVA ESPECIE-MUESTRA
n = Nivel de confianza x Varianza
Error (Precisin)
n: tamao de la poblacin

Muestreo: Consideracin (2)-tamao de


muestra

Tamao de Muestra para el Muestreo Simple


Aleatorio.
a) Para estimar promedios

ts
n0
d

n0
n
n0
1
N

Donde:

= Valor de Student con (n-1) grados de libertad y probabilidad


(1-). Puede ser aproximado a 2.

d = Margen de error permisible para el estimador del promedio


s = Desviacin estndar de los datos observados en la muestra

Muestreo: factores que afectan

FACTORES QUE AFECTAN AL MUESTREO


Efecto de la disposicin
temporal de una poblacin

espacial

y/o

1. Al azar
2. Uniforme
3. Por contagio o agregacin
Efectos metodolgicos,
personales.

instrumentales

1. Efecto de la variabilidad del observador


2. Efecto de la tcnica de captura
3. Efecto de la variabilidad de respuesta de
los animales.

Muestreo: factores que afectan


DISTRIBUCIN DE LAS POBLACIONES

AL AZAR

UNIFORME

POR CONTAGIO
O AGREGADO

Muestreo poblacional e Incertidumbre


Poblacin
Normalmente estimamos medias
usando muestras. Esto no es
posible de medir para todos los
individuos en una poblacin.
Distribution of single cow milk production)
WHOLE POPULATION

Media=40

15000

Media=42

5000

Como podemos reducer este


grado de incertidumbre?

Frequency

Media=39.5

Como
trabajamos
con
muestras, siempre hay un
grado de INCERTIDUMBRE en
la estimacin.

20

30

40

50

Milk production

60

Muestreo poblacional e Incertidumbre


Standard error (SE)

SD
SE
n

SE es simplemente la SD de la
probabilidad de distribucin de un
estadstico especfico.

E.g. SE de la media

Confidence intervals (CI)

CI es un intervalo estimado de un
parmetro poblacional. Como
probablemente el intervalo contiene el
parmetro, es determinado por el
intervalo de confianza(95%)

t distribution (n<30)
CI 0.975 mean t0.975,df SE

CI 0.025 mean t0.025,df SE

Normal distribution (n>30)


CI 0.975 mean z0.975 SE

CI 0.025 mean z0.025 SE

Muestreo poblacional Ley de los grandes


nmeros

Conforme se incrementa el tamao de muestras


(n), la media de la muestra refleja la media
poblacional

Cuando es una muestra lo suficientemente


grande?

-2

-1

Poblacin con media =


0
SD = 1

20

40

60

n = 100

80

100

Espacio muestral
Es
un
conjunto
cuyos
elementos
representan
los
resultados posibles
de un experimento.
Es
el
conjunto
universal
y
se
representa por E.
Encierra todos los
casos posibles.

Por ejemplo; el espacio muestral de


lanzar un dado, hay seis
posibilidades: E={1,2,3,4,5 o 6}
Sucesos: A={3,2} y B={2,5}

Espacio muestral

Espacio muestral distribucin estadstica


PRINCIPALES DISTRIBUCIONES
Distribucin = Comportamiento de los datos
(observaciones) de una variable en estudio
Variable
aleatoria
discreta: Funcin de
probabilidad.
E.g.
Bernoulli,
binomial,
Poisson.
Variable
aleatoria
contnua: Funcin de
densidad.
E.g.
distribucin normal, t, F,

Muestreo e inferencia estadstica


La inferencia estadstica es la estimacin de un
parmetro (por ejemplo la media poblacional, varianza
poblacional) a partir de la informacin que proporciona
una muestra.

Inferencia estadstica y planteamiento de


hiptesis

Clasificacin de hiptesis:

*De

investigacin
(generales
o
especficas), las cuales pueden responder
en forma amplia a las interrogantes
planteadas en el Marco Terico respecto al
problema en estudio.

*Estadsticas, las que expresan la relacin


en trminos matemticos.

Hiptesis estadstica - Pruebas

Partes de una prueba de hiptesis:


FORMULACIN DE
HIPTESIS

CLCULO DE LA
PRUEBA
ESTADSTICA

DECISIN
ESTADSTICA. SE
ACEPTA O
RECHAZA Ho

H 0 : = 20
H a : < 20

Zc

x 0
X

N (0,1); donde X

Si Zc pertenece a la regin de
aceptacin, se Acepta H0
Si Zc pertenece a la regin de
rechazo, se Rechaza H0

Hiptesis estadstica - Planteamiento


Como plantear correctamente una hiptesis?
En realidad, por lo general, no sabemos como
plantear una hiptesis de forma correcta.
Una hiptesis se relaciona con un problema.
No la podremos generar si no tenemos claro
lo que buscamos.
Por lo tanto, esta surge de los problemas y los
objetivos de la investigacin.
Una hiptesis nos indica una bsqueda o intento de
probar algo, por lo tanto no necesariamente tiene
que ser verdadera; la idea es que a partir de ella
probemos algo.
Aunque se piense lo contrario, el error mas grande es

Hiptesis estadstica - Planteamiento


Cual es el problema de una investigacin?
Como resolverlo?

Hiptesis estadstica - Planteamiento


Una hiptesis es una proposicin tentativa sujeta a
comprobacin emprica durante una investigacin.
Se puede tener una, dos o varias y a veces ninguna
hiptesis.
Pueden ser:
- Mas o menos generales o precisas
- Involucrar dos o mas variables.
Surgen de los anlisis tericos, de generalizaciones
empricas
o
de
estudios
(antecedentes)
cuidadosamente revisados.
La falta de rigurosidad y cuidado antes de
formularlas nos lleva a cometer errores como
hipotetizar algo que ya ha sido comprobado o

Hiptesis estadstica - Planteamiento


En trminos de la estadstica, las hiptesis de
investigacin son simbolizadas.
Se parte de una hiptesis nula (H0): proposiciones
que se plantean para refutar o negar lo que afirma la
hiptesis de investigacin. Generalmente se plantea
para ser rechazada, aunque resulta que a veces es
verdadera y es aceptada.
y una
Hiptesis alternativa (Ha): se formula cuando hay
otras posibilidades adems de la H0.
Es una
posibilidad ante la hiptesis de investigacin y la
nula.

Hiptesis estadstica - Contraste

Procedimiento de una prueba de


Plantear las hiptesis H y H :
hiptesis:
0

H0 : = 0
Ha : < 0

H0 : = 0
Ha : > 0

H0 : = 0
Ha : 0

Elegir el nivel de significacin

Hallar la estadstica de prueba y establecer las regiones de aceptacin y rechazo con


el punto crtico (Valor de tablas)

x 0
Zc
X

N (0,1); donde X

Hallar el valor calculado de la estadstica de prueba con


los datos de la muestra.
Regla de decisin:
1. Si Zc pertenece a la regin de aceptacin, se
Acepta H0
2. Si Zc pertenece a la regin de rechazo, se Rechaza
H0

Hiptesis estadstica region de rechazo

Regin crtica y nivel de


significacin

Regin crtica
Nivel de significacin:
* Valores improbables si...
* Nmero pequeo: 1% , 5%
* Es conocida antes de realizar el (0.01, 0.05)
experimento: resultados
* Fijado de antemano por el
experimentales que refutaran H0 investigador
* Es la probabilidad de rechazar
H0 cuando es cierta
=0.05

Reg. Crit.

Reg. Crit.

/2

/2
Acepto Ho

Rechazo
Ho

H0:

=70

Rechazo
Ho

Hiptesis estadstica - Constraste

Contrastes: unilateral y bilateral


La posicin de la regin crtica depende de la hiptesis
alternativa
Ha: 70

Bilateral

H0: m=70
H0: m<70
Unilateral
izquierda

Ha: <70

H0 : = 70
Ha : 70

H0: m=70
H0: m>70
Unilateral
derecha

Ha: >70

Hiptesis estadstica - Contraste

Contrastes: prueba de
significacin p
p_valor < 0.001. a un nivel de significacin = 0.05, se
rechaza la Ho. por lo tanto m>70

H0: m=70
H0: m>70

Se rechaza
H0: m=70

Se acepta
H0: m=70
p_valor < 0.001

a=0.05
H : m=70Tema 7: Contrastes de hiptesis

Bioestadstica.
U.
0
Mlaga.

X 95

44

Hiptesis estadstica Error asociado

TIPOS DE ERROR
Realidad
H0 verdadera
Aceptar H0

Decisin
correcta

H0 Falsa

Error de tipo II
Probabilidad de aceptar Ho
cuando en realidad es falsa
Probabilidad

Rechazo Ho
Acepto Ha

Error de
tipo I
Probabilidad de
rechazar la Ho
cuando en realidad
es verdadera
Probabilidad

Decisin
correcta

Hiptesis estadstica - Significancia

a, p-valor; CRITERIOS DE
RECHAZO

* Sobre a

* Es nmero pequeo,
preelegido al
disear el
experimento

* Conocido a sabemos
todo sobre la regin
crtica

* Sobre p-valor

* Es conocido tras
realizar el
experimento

* Conocido p sabemos
todo sobre el
resultado del
experimento

Sobre el criterio de rechazo

Contraste significativo = p-valor menor que a

Hiptesis estadstica Prueba de


normalidad

Prueba de Kolmogorov-Smirnov
H0: la variable x presenta distribucin
normal
H0: la variable x no presenta distribucin
normal
Grfica de probabilidad de talla

Grfica de probabilidad de peso

Normal

Normal

99.9

99.9

Media
Desv.Est.
N
KS
Valor P

99

80
70
60
50
40
30
20

95
90

Media
Desv.Est.
N
KS
Valor P

80
70
60
50
40
30
20
10

10

1
0.1

99

Porcentaje

Porcentaje

95
90

486.0
124.2
96
0.067
>0.150

0.1

100

200

300

400
500
peso

600

700

800

900

p-valor> a
=0.05
Se acepta
Ho
la variable
x presenta
distribucin normal

25

30

35

40

talla

p-valor<a =0.05
Se rechaza Ho
la variable x no presenta
distribucin normal

31.84
2.841
96
0.116
<0.010

Comparacin de dos grupos aleatorios


Comparacin de la media de 2 poblaciones
Se prueba la diferencia entre las medias de dos muestras

Correlacin
En la teoria de probabilidades y estadstica, la correlacin (a menudo
medida como un coeficiente de correlacin) indica la fuerza y direccin
de una relacin lineal entre dos variables al azar o aleatorias. En el uso
estadstico general, la correlacin se refiere a si dos variables son
independendientes.

Anlisis de datos de conteo o proporcin


Nmeros enteros (no contnuos, propiedades diferentes de distribucin)
o proporcin

Comparacin de dos grupos aleatorios

mparacin de la media de 2 muestras

La prueba t
H0: medias no diferentes
H1: medias diferentes

Suposiciones

Independencia de casos (trtabaja con rplicas verdaderas!!!) - este


es un requerimiento del diseo.
Normalidad las distribuciones en cada uno de los grupos son
normales
Homogeneidad de varianzas - la varianza de datos en grupos
debera ser la misma (se usa la prueba F o prueba de Fligner para la
homogeneidad de varianzas).
Estos en conjunto conforman las suposiciones communes de que

Comparacin de dos grupos aleatorios


Antes de realizar comparaciones que asuman normalidad,
necesitamos probar si la distribucin de los datos es
normal (no siempre se realiza antes!!!)

En caso de no haber normalidad: hay 2 posibles


enfoques
Estadstica
1. Cambiar la distribucin (usar GLMs)
avanzada

20
10
0

Probit (proporcin)
Transformacin BoxCox

Frequency

Arcoseno (porcentaje)

30

Raz cuadrada

0 10

itmico (datos asimtricos)

Frequency

50

2. Transformacin de datos

30

40

E.g. Poisson (datos de conteo)


E.g. Binomial (proporcin)

10

mass

15

-0.5 0.5

1.5

2.5

fishes$logmass

Comparacin de dos grupos aleatorios


Antes de cualquier prueba para comparar las medias de
dos poblaciones, necesitamos probar si las varianzas
de las dos muestras son significativamente
diferentes. La prueba puede no ser muy simple. Esta es
llamada
la F de
Fisher.
Para
compara
dos
varianzas, todo lo que hay que
hacer es
dividir la varianza mas grande entre la mas
pequea.
F calculado
F<-var(A)/var(B)

qf(0.975,nA-1,nB-1)

F crtico

Si el F calculado es muy grande que el valor


crtico se rechaza la hiptesis nula
La prueba puede
realizada en R con
el commando
var.test()

Introduccin a R (Rstudio)

Das könnte Ihnen auch gefallen