Sie sind auf Seite 1von 50

Estadstica Aplicada: Didctica de la

Estadstica y Mtodos Estadsticos en


Problemas Socioeconmicos.
Universidad Nacional de Colombia.
Sede Medelln

Enseanza de la Estadstica como parte de la


Metodologa de Investigacin
Dr. Ignacio Mndez Ramrez.
IIMAS-UNAM y IASI

Medelln Colombia 20 de julio de 2010


1
Panorama de la Pltica
1. Tres Preguntas Bsicas:
2. Filosofa de la ciencia. Mtodo cientfico. Objetividad
3. Modelos estadsticos.
4. Papel de la estadstica y el diseo en el Apoyo a
relaciones causales
1. Contrastacin de hiptesis.
2. Explicaciones Alternativas.
3. Factores de Confusin.
4. Significancia Estadstica.
5. Estrategia de modelado.

5. Consideraciones Didcticas

Universidad Nacional de 2
Colombia . sede Medelln
Universidad Nacional de 3
Colombia . sede Medelln
1.- Hacer ciencia es ser totalmente
objetivo

Universidad Nacional de 4
Colombia . sede Medelln
2.- Las estaturas de los seres
humanos tienen distribucin
normal

Universidad Nacional de 5
Colombia . sede Medelln
3.- En una investigacin se tienen dos grupos de
personas, uno realiz ejercicio fsico vigoroso EFV,
durante un ao y el otro (testigo o control) no lo
hizo. Al trmino del ao se midieron los cidos
grasos en suero.
Los resultados son:
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1
Se efecta una prueba de t y se tiene P <0.001.
Se concluye el EFV disminuye los valores de
cidos grasos. 6

Universidad Nacional de Colombia . sede Medelln


La respuesta en las tres
preguntas es .
NO

Es necesario evaluarlas a la luz de


consideraciones filosficas,
metodolgicas y estadsticas.

Universidad Nacional de 7
Colombia . sede Medelln
1.- No se puede ser totalmente objetivo.

En todo trabajo de Investigacin, se


tiene un marco epistmico.

En muchas reas de investigacin


tradicionales como la Biologa,
Medicina, Agronoma, etc., este marco
es tcito, es decir, se asume
inconscientemente.

Universidad Nacional de 8
Colombia . sede Medelln
Adems es muy comn que sea un marco
totalmente errneo,a partir de la filosofa del
Positivismo o Empirsmo Lgico.
El uso de este marco hace que la
investigacin sea muy rgida, pretendiendo
ser totalmente objetiva y racional.
Los filsofos modernos han rechazado
unnimemente este marco epistmico, y han
postulado entre otras cosas, que la ciencia
no es totalmente objetiva, que hay actos en
el proceso de investigacin cientfica, que no
pueden ser justificados totalmente de forma
racional. Universidad Nacional de
Colombia . sede Medelln
9
<Positivismo> <Nueva Filosofa>
*Objetivo *Objetividad intersubjetiva
*Emprico *Constructivismo
*Racionalidad en el mtodo *Racionalidad en el cientfico
*Reduccionista *Sistmico
*Certeza. *Minimizar errores
*La Matemtica es la realidad *La matemtica aproxima la realidad
*Causalidad Determinstica *Causalidad Probabilstica

Ya s Tengo una Este


As se
como teora que mtodo
debe
es! funciona funciona
hacer!
bien.

10
La estadstica cuando se aplica a otra disciplina, lo
que pretende es contribuir a que el conocimiento
que se adquiere sobre un aspecto de la realidad, est
en la medida de lo posible libre de errores, o que
stos sean pequeos.

Representacin

Universidad Nacional de 11
Colombia . sede Medelln
Epistemologa, Metodologa
Estadstica y las Ciencias Fcticas
Para contribuir al objetivo de tener conocimiento
vlido (libre de errores y sancionado por la
comunidad de cientficos), es necesario contemplar
los aspectos epistemolgicos de las disciplinas
involucradas, disear la forma de captar la
informacin ms econmica, factible y adems que
sea cientfica en el sentido de minimizar errores.

Universidad Nacional de 12
Colombia . sede Medelln
Cita
"Modern statistics--concerned with discovering
patterns and structures in nature, with unearthing
relationships which defy unaided perception and
with providing powerful tools for us to improve our
understanding of the world around us-- ought to
be regarded by the general public as one of the
most exciting of disciplines."
David J. Hand. Breaking misconceptions--
statistics and its relationship to mathematics
The Statistician, 1998: 47, pert2, pp. 245-250
Universidad Nacional de 13
Colombia . sede Medelln
La estadstica moderna encargada de descubrir
patrones y estructuras en la naturaleza, de
desenterrar relaciones que desafan la percepcin
normal y de proveernos con herramientas
poderosas para que mejorar el entendimiento del
mundo que nos rodea debera ser considerada
por el pblico en general como la ms excitante
de las disciplinas

Universidad Nacional de 14
Colombia . sede Medelln
Los razonamientos con consideraciones
estadsticas intervienen en todas las
etapas del proceso.
El estadstico debe entender y colaborar
en todos los aspectos de la investigacin.
Es un cientfico ms de un grupo de
trabajo Universidad Nacional de Colombia . sede Medelln
15
ASPECTOS EPISTEMOLGICOS
.- Interesa principalmente cmo es el mundo y no
tanto por qu es as.
.- El encontrar, cmo es el mundo, tiene relacin
con la explicacin de por qu es as.
.- En la medida de tener mejores explicaciones, se
pueden encontrar nuevas regularidades, esto
constituye el complejo terico metodolgico con el
que construimos el conocimiento.
.- No hay objetividad Absoluta. Hay Objetividad
intersubjetiva.
.- La matemtica est en la mente, no en la
realidad. Ningn modelo es verdadero, pero hay
algunos muy tiles. Universidad Nacional de 16
Colombia . sede Medelln
.- No existe un mtodo cientfico infalible
y obligado. El enfoque cientfico
consiste en una bsqueda comprometida,
exhaustiva e integral de metodologas
que minimicen o eviten los errores en la
adquisicin del conocimiento
.- No se puede ser totalmente racional,
en el sentido de que todo los que se hace
esta basado en premisas lgicas
.- No hay hechos puros. Hay
interpretaciones de hechos a la luz de
teoras y subjetividad, considerando
siempre el diseo de investigacin.
Universidad Nacional de 17
Colombia . sede Medelln
Elaboracin de proyectos
.- Se pueden considerar dos ciclos ligados en el
proceso de elaboracin de un proyecto (protocolo).
C1.- Problema Marco Terico Hiptesis
Variables.
C2.- Hiptesis Diseo-
Diseo: Poblaciones, mtodos de muestreo,
mediciones, intervenciones, seguimiento.
Antes de realizar una investigacin, se debe efectuar
una critica fuerte a todo el proyecto. Se busca
coherencia entre las partes y la minimizacin 18de
errores. Universidad Nacional de Colombia . sede Medelln
Tipos de diseos, mediciones,
modelos, supuestos, anlisis, Problema, marco terico,
etc.. hiptesis. Conceptos, objetivos,
poblaciones, elementos, etc.
Encuestas, cohortes,
experimentos, etapas, Instrumentos, limitaciones
estratos, bloques, prcticas, trabajo de campo,
apareamiento, modelos de tiempo, dinero, etc.
regresin logsticos,
generalizados, discriminante,
factores, ecuaciones 19
Universidad Nacional de
estructurales, etc Colombia . sede Medelln
Realizacin de la investigacin
Conduccin Obtencin de Informacin- Anlisis
Exploratorio Construccin, verificacin y seleccin
de modelos Interpretacin Discusin
Conclusiones y recomendaciones Reporte.
Hay indivisibilidad del mtodo de estudio con las
explicaciones (teora) que se tienen sobre el propio
objeto estudiado.
Mtodo Teora

Objeto Teora

Universidad Nacional de 20
Colombia . sede Medelln
Interpretacin
La visn rgida de la ciencia positiva y su
adhesin en forma acrtica produce:
.- Poca creatividad en la metodologa.
.- Se copian diseos y procedimientos.
.- Bsqueda de objetividad, que puede paralizar.
.- Fe ciega en la matemtica.

logP/(1-P) = XB
21

Universidad Nacional de Colombia . sede Medelln


Enfoque dogmtico en Agronoma: Buen
Experimento!
n=4 es parte del mtodo cientfico.
Un experimento busca minimizar el error experimental
Uso de bloques frecuentemente inadecuado
Para cualquier experimento un coeficiente de
variacin mayor a 20% indica que est mal el estudio.
Un tamao ptimo de parcela experimental para un
cultivo, vlido para todo tipo de tratamientos y
condiciones de experimentacin. Pseudorepeticin
Uso dogmtico (mgico) del 5% de significacin
No hay crtica para los diseos y los anlisis
La distribucin normal existe en la naturaleza 22
Universidad Nacional de Colombia . sede Medelln
2. Las estaturas de los seres humanos tienen distribucin
normal
Con elevada frecuencia bilogos, matemticos,
agrnomos, etc. ; con menor frecuencia siclogos,
socilogos, etc., contestan Verdadero
La Normal es una propiedad
objetiva de la naturaleza,
P(Y 0) 0 existe por si sola. Slo hay
que descubrirla.
Existe una estatura negativa! Se ignora el diseo, a qu
poblacin de humanos se
refiere? todos los que
Nios existen? a mujeres de 30 a
Mujeres
Hombres 50 aos , clase media, que
viven en Mxico, D.F.?
23
Basquetbolistas
X1 Y1
X2 Y2
X3 Y3
Xk Yp

P(Y / X ) P(Y / noX ) 24


Universidad Nacional de Colombia . sede Medelln
H ~ Hiptesis
D ~ Diseo
E ~ Esperado ( condicionado a H , D y SA)
SA ~ Supuestos Adicionales para el funcionamiento de H
25
con diseo D.
Universidad Nacional de Colombia . sede Medelln
* Teora: H, D, SA E

* Prctica: D: ocurre O (Resultado Observado)

Concordancia (contrastacin) E con O?

a).- Concuerdan E con O : se apoya H

b).- No concuerdan E con O : No se apoya H

Cmo se define
la concordancia?
Universidad Nacional de 26
Colombia . sede Medelln
3. En una investigacin se tienen dos grupos de
personas, uno realiz ejercicio fsico vigoroso EFV,
durante un ao y el otro (testigo o control) no lo
hizo. Al trmino del ao se midieron los cidos
grasos en suero.
Los resultados son:
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1
Se efecta una prueba de t y se tiene P <0.001.
Se concluye el EFV disminuye los valores de
cidos grasos 27

Universidad Nacional de Colombia . sede Medelln


Con elevada frecuencia bilogos, matemticos,
agrnomos, etc. ; con menor frecuencia siclogos,
socilogos, etc., contestan en pregunta 3:
Verdadero

Universidad Nacional de 28
Colombia . sede Medelln
3. En una investigacin se tienen dos grupos de personas, uno
realiz ejercicio fsico vigoroso EFV, durante un ao y el otro
(testigo o control) no lo hizo. Al trmino del ao se midieron
los cidos grasos en suero. Preguntas Bsicas
Cmo eran las personas en caractersticas
inherentes a ellas, tales como sexo, edad, tipo de
alimentacin, raza, estado de salud, etc.?
Cmo se asign el EFV? Lo eligieron las
personas, fue con incentivos, fue al azar, etc.?
Cmo se define EFV y NoEFV?
En qu condiciones se realiz el EFV y el noEFV,
cambios climticos, de salud, de organizacin,
sociales, alimenticios, etc.?
Cmo se midieron los cidos grasos, fue igual29
para ambos grupos? Universidad Nacional de Colombia . sede Medelln
Grupo Media P <0.001
EFV 12.3
qu
Control 18.6 papel
juega?

30
Explicaciones alternativas A, B,...Q. Niegan
H, y explican la cercana de E con O de otro
modo. Son de Nulidad
H, D, SAH E
A, D, SAA E
Teora: B, D, SAB E
.................
Q, D, SAQ E

Prctica: D ocurre O

a) Concuerdan O con E. Se apoyan por igual H, A, B, ... Q


b) No concuerdan O con E. No se apoyan H, A, B, ... Q. 31
Universidad Nacional de Colombia . sede Medelln
Explicaciones alternativas A, B,...Q. Niegan H, y explican
la cercana de E con O de otro modo. Son de Nulidad

Grupo Edad Media


Explicacin
EFV 20-25 aos 12.3 alternativa: Las
diferencias en ac.
Control 47-62 aos 18.6 grasos de deben
a la edad y no al
EFV
SA: Supuestos adicionales:
La edad y el EFV estn edad Ac.
asociados. La edad produce
grasos
cambios en c. Grasos.
La edad es un Factor de
Confusin en la relacin
EFV
EFV Ac grasos 32
o no
Universidad Nacional de Colombia . sede Medelln
33
Universidad Nacional de Colombia . sede Medelln
Etapa de planeacin: Cambiar el diseo D o
cambiar la hiptesis emprica H, de manera
que los SA de las explicaciones alternativas,
no operen, o sean improbables.

Etapa de anlisis y discusin: Mostrar


debilidad terica, poca plausibilidad o
imposibilidad de los SA de las explicaciones
alternativas.
Universidad Nacional de 34
Colombia . sede Medelln
Control de factores de confusin
1. Homogeneizacin.- Que los factores de confusin
no varen en todos los elementos del estudio.
2. Formacin de bloques o estratos homogneos.-
Comparaciones dentro de los bloques y sus
promedios. No interaccin.
3. Aleatorizacin.- Se asignan al azar a los
elementos de estudio las variantes del posible factor
causal o tratamientos. Tiende a homogenizar la
distribucin de todas las variables presentes en los
elementos de estudio.
4. Anlisis estadstico:- Se modela la influencia
conjunta de tratamientos y factores de confusin. Se
obtienen los Efectos ajustados
35
Universidad Nacional de Colombia . sede Medelln
3. En una investigacin se tienen 200 hombres de 25-
50 aos, se asignan al azar 100 de ellos para que
se sometan a ejercicio fsico vigoroso (EFV),
durante un ao y el resto (testigo o control) no lo
haga (noEFV).
Se vigila que las condiciones de vida sean
semejantes en ambos grupos durante el ao.
Al trmino del ao, de cada individuo se toma una
muestra de sangre y se congela de inmediato, para
que en todas despus del mismo tiempo de fro y
con los mismos instrumentos se miden los cidos
grasos en suero.
36
Universidad Nacional de Colombia . sede Medelln
3. En una investigacin se tienen dos grupos de
personas, uno realiz ejercicio fsico vigoroso EFV,
durante un ao y el otro (testigo o control) no lo
hizo. Al trmino del ao se midieron los cidos
grasos en suero.
Los resultados son:
Grupo n Media Desv. Est.
EFV 100 12.3 2.8
Control 100 18.6 3.1

Se efecta una prueba de t y se tiene P <0.001.


Se concluye el EFV disminuye los valores de
37
cidos grasos Universidad Nacional de Colombia . sede Medelln
Con elevada frecuencia bilogos, matemticos,
agrnomos, etc. ; con menor frecuencia siclogos,
socilogos, etc., contestan en 3 : Verdadero

Universidad Nacional de 38
Colombia . sede Medelln
Explicacin alternativa A.-
Hiptesis de Nulidad Estadstica
No es cierta H y ocurre O cercano a E por azar.
SAA: Hay variacin natural en c. grasos en los
humanos, aunque sean semejantes (la misma
poblacin), pueden darse por azar promedios bajos en
los de EFV y altos en los de noEFV. Bajo A, ambos
39
grupos son muestras de la misma poblacin de sujetos.
Se mide
Yi
Ac graso ..... .....
EFV noEFV Se mide
Yi
(Riqueza conceptual: poblaciones, Ac graso
medias poblacionales, etc.)

Explicacin alternativa A: EFV noEFV


Se espera que los promedios muestrales sean iguales, EA

YEFV YnoEFV
Se efecta el diseo, D y se obtiene O (observado):
YEFV YnoEFV Dif (O E A ) Dif (O E )
40
Universidad Nacional de Colombia . sede Medelln
La discrepancia entre O y EA, Dif, es compatible
con la hiptesis alternativa del Azar , A?
La discrepancia entre YEFV y YnoEFV es factible o
probable por azar o es improbable.?
Fisher: 0.05 o 0,01
Universidad Nacional de 41
Colombia . sede Medelln
De las posibles Explicaciones alternativas A,
B,...Q. Niegan H, y esperan E de otro modo.
Son de Nulidad, si hay significancia estadstica,
se considera que A: El azar produce E esta
eliminada, pero subsisten B,...Q

Universidad Nacional de 42
Colombia . sede Medelln
H, D, SAH E
A, D, SAA E Improbable
Teora: B, D, SAB E
..........
Q, D, SAQ E

La significancia estadstica slo elimin una


explicacin alternativa, el azar. Slo esto!
Se puede decir que EFV noEFV , pero no a que se
debe la diferencia , ya que subsisten explicaciones
alternativas (B, , Q) 43
En la bsqueda de apoyo a hiptesis de causalidad
probabilstica, se buscan diseos y modelos que
representen bien la realidad, y que permitan valorar si
hay cambios en la distribucin de la variable de
respuesta o efecto Y, al cambiar los valores de la
variable causal, condicionado a valores fijos de
variables que representan explicaciones alternativas.
f (Y / X , A, B....Q) f (Y / X * , A, B....Q)
Donde X y X* son diferentes valores de la variable
causal y A,B,...Q son situaciones fijas de las
explicaciones alternativas. Son los efectos corregidos o
efectos de X sobre Y ajustados por A, B, ...Q 44
Universidad Nacional de Colombia . sede Medelln
En estadstica es comn que se plantee un modelo para
explicar las caractersticas de generacin de los datos.
El modelo puede representar la situacin esperada de
una hiptesis de causalidad, o puede ser el modelo de
negacin de una hiptesis.
Se evala la concordancia entre los datos observados, O
y los esperados E, si el modelo es cierto.
Usualmente esta discordancia se valora de acuerdo a la
probabilidad de una discordancia como la obtenida o
an mayor suponiendo cierto el modelo.
Es el Valor de P. Universidad Nacional de
Colombia . sede Medelln
45
M1. Modelo mayor, con ms parmetros
M2.- Modelo menor, o modelo reducido, con menos
parmetros.
Se obtiene a partir de M1, al especificar el valor de
uno o ms parmetros, o establecer relaciones entre
ellos.
Se obtiene una medida de la discrepancia entre E1 y
O, Disc (M1); tambin la discrepancia entre E2 y O,
Disc (M2). Universidad Nacional de 46
Colombia . sede Medelln
Disc (M2) es mayor que Disc (M1), pero es mucho
mayor o no?
La diferencia entre el ajuste de ambos modelos, se
valora en trminos de la probabilidad (P) de una
diferencia como esa o mayor si M2 es cierto.
Si P< 0.05 se adopta M1, si P>0.05 se considera M2
como bueno. (Principio de Parsimonia o Navaja de
Ockam)
Universidad Nacional de 47
Colombia . sede Medelln
La gran dificultad en la enseanza es que se dan los
conceptos de probabilidad y de estadstica desligados entre
si. Vg. despus de 3 o 4 clases sobre probabilidades de
ciertos resultados en juegos de azar, o urnas, (espacios
equiprobables), se pasa a la prueba de hiptesis sobre una
media, a comparar dos medias, donde ahora se usa otro
concepto de probabilidad. !Con razn los alumnos sufren y
no entienden. Otro gravsimo problema es que no se toca
el hecho de que la estadstica se usa como parte del
proceso de adquisicin de conocimientos en muchas
disciplinas y como tal, deben contemplarse los diseos de
investigacin de donde surgen los datos. Los datos nunca
son datos puros, estn ligados a un propsito y a un
diseo. Debe contemplarse la estadstica como parte de la
48
metodologa de investigacin
1. Enfatizar que la estadstica aplicada se convierte en
parte de la metodologa de investigacin.
2. Minimizar temas de Estadstica descriptiva. Si es
importante, pero se debe ligar a la caracterizacin
de una poblacin. El concepto de poblacin(es) en
estudio es fundamental .
3. Presentar los conceptos de probabilidad clsica y
subjetiva, pero con mas nfasis el de probabilidad
frecuentista. Regularidad Estadstica como
estabilizacin de frecuencias relativas al incrementar
el tamao de la muestra. Limite de frecuencias
relativas. Ley de los grandes nmeros. Modelos de
distribucin de eventos en las poblaciones. 49
Universidad Nacional de Colombia . sede Medelln
4.-Distribuciones derivadas del muestreo .
Distribuciones para estadsticos, estimadores y
estadsticas de prueba. Teorema Central del
Limite. Regularidad Estadstica de segundo nivel.
Error estndar
5.- Intervalos de confianza y pruebas de hiptesis.
6.-Liga de los conceptos con investigaciones reales.
7.-Debe quedar muy claro que la inferencia es para
conocer algo de la regularidad estadstica de una
medicin en una o ms poblaciones. Esto se
inserta en las hiptesis de la investigacin

Universidad Nacional de 50
Colombia . sede Medelln

Das könnte Ihnen auch gefallen