Sie sind auf Seite 1von 20

Mtodos

Estadsticos
Tema 1: Introduccin

Tema 1: Introducin

Que es la estadstica ?

Estadstica (De Estadista) f. Censo o recuento


de la poblacin, de los recursos naturales e
industriales, del trfico o de cualquier otra
manifestacin de un Estado, provincia pueblo
etc. // Estudio de los hechos morales o fsicos
del mundo que se prestan a numeracin o
recuento y a comparacin de las cifras a ellos
referentes.

Real Academia Espaola, Diccionario de la


lengua espaola.
Tema 1: Introducin

Que es la estadstica ?

A menudo la informacin de que se dispone es incompleta.

Existe incertidumbre en cualquier proceso en el que se extienden


conclusiones que aquel que se tiene informacin.
El mtodo de razonamiento que nos conduce a esta extensin es
conocido como inductivo.

La misma experiencia realizada repetidas veces arroja resultados


diferentes.

Mediciones repetidas de una misma persona


Determinar el rendimiento de una variedad de maz sembrndola
varias veces
La variabilidad introduce un elemento de incertidumbre.

Actividad importante de la estadstica es cuantificar la


incertidumbre
Tema 1: Introducin

Definicin
La Estadstica es la Ciencia de la
Coleccin, manejo , descripcin y
presentacin de los datos referentes a un
fenmeno que presenta variabilidad o
incertidumbre para su estudio metdico,
y poder de esa forma hacer anlisis sobre los
mismos, para la toma de decisiones u obtener
conclusiones.
Tema 1: Introducin

Para qu sirve la estadstica?

La Ciencia se ocupa en general de fenmenos observables

La Ciencia se desarrolla observando hechos, formulando


leyes que los explican y realizando experimentos para validar
o rechazar dichas leyes

Los modelos que crea la ciencia son de tipo determinista o


aleatorio (estocstico)

La Estadstica se utiliza como tecnologa al servicio de las


ciencias donde la variabilidad y la incertidumbre forman parte
de su naturaleza
Tema 1: Introducin

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin

Decidir qu datos recoger (diseo de experimentos)

Qu unidades de produccin pertenecern al estudio (muestras)

Estratificado? Por Distrito de Desarrollo rural (conglomerados)?

Describir (resumir) los datos obtenidos

Rendimiento medio de maz en cada DDR (estadsticos)


% de la poblacin con un cierto rendimiento de acuerdo con insumos y labores aplicados
(frecuencias), grficos,...

Realizar una inferencia sobre la poblacin

Rendimiento agrcola
Costos de produccin
labores? Insumos? Otros factores riego y temporal?

Recoger los datos (muestreo)

Todos los productores de maz con un cierto valor de activos.


Criterios de exclusin Cmo se eligen? Descartamos los que son de autoconsumo?

Qu datos recoger de los mismos (variables)

La productividad de maz el estado de Guanajuato es diferente en los DDRs


En qu sentido? Mayor rendimiento? menor costo?

El rendimiento agrcola del maz en el DDR Celaya difiere de los otros DDRs.

Cuantificar la confianza en la inferencia

Nivel de confianza del 95%


Significacin del contraste: p=5%
Tema 1: Introducin

Mtodo cientfico y estadstica


Formulacin
de hiptesis

Obtener
conclusiones

Disear
experimento

La informacin sea relevante al


problema.

Las conclusiones que de ella se


extraigan tengan un cierto grado
de confiabilidad.

Recoger datos
y analizarlos

Tema 1: Introducin

Poblacin y muestra

Poblacin es el conjunto sobre el que estamos interesados en


obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.

Muestra es un subconjunto de la poblacinal que tenemos


acceso y sobre el que realmente hacemos las observaciones
(mediciones)
Debera ser representativo
Esta formado por miembros seleccionados de la poblacin
(individuos, unidades experimentales).

Tema 1: Introducin

Variables

Una variable es una caracterstica observable que vara entre los


diferentes individuos de una poblacin. La informacin que disponemos
de cada individuo es resumida en variables.

En los individuos de la poblacin mexicana, de uno


a otro es variable:

El grupo sanguneo

Su nivel de felicidad declarado

{Deprimido, Ni fu ni fa, feliz, Muy Feliz} Var. Ordinal

El nmero de hijos

{A, B, AB, O} Var. Cualitativa

{0,1,2,3,...} Var. Numrica discreta

La altura

{162 ; 174; ...} Var. Numrica continua

Tema 1: Introducin

Tipos de variables

Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden
hacer operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar

Ordinales: Si sus valores se pueden ordenar de menor a mayor

Sexo, tipo de cultivo, especie, Religin, Nacionalidad, Fumar (S/No)


La nica relacin aritmtica que se admite es la de igualdad
La nica estadstica valida es la frecuencia de una clase

Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor


No solo se admite la relacin de igual, sino adems de la mayor que y menor que
Frecuencias, mediana

Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)

Discretas: Si toma valores enteros

Nmero de hijos, Nmero de especies, Num. de cumpleaos


las anteriores relaciones ms la suma
Media, varianza, coeficiente de variacin

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Peso de un individuo, rendimiento por ha de una planta, Dosis de medicamento administrado, edad
las anteriores relaciones ms la suma
Media, varianza, coeficiente de variacin

Tema 1: Introducin

10

Es buena idea codificar las variables


como nmeros para poder procesarlas
con facilidad en un ordenador.
Es conveniente asignar etiquetas a
los valores de las variables para
recordar qu significan los cdigos
numricos.

Sexo (Cualit: Cdigos arbitrarios)

Raza (Cualit: Cdigos arbitrarios)

1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz

Se pueden asignar cdigos a


respuestas especiales como

1 = Blanca
2 = Negra,...

Felicidad Ordinal: Respetar un orden al


codificar.

1 = Hombre
2 = Mujer

0 = No sabe
99 = No contesta...

Estas situaciones debern ser tenidas


en cuentas en el anlisis. Datos
perdidos (missing data)

Tema 1: Introducin

11

Aunque se codifiquen como nmeros, debemos recordar siempre el


verdadero tipo de las variables y su significado cuando vayamos a
usar programas de clculo estadstico.
No todo est permitido con cualquier tipo de variable.

Tema 1: Introducin

12

Los posibles valores de una variable suelen denominarse modalidades.

Las modalidades pueden agruparse en clases (intervalos)


Edades:

Hijos:

Menos de 20 aos, de 20 a 50 aos, ms de 50 aos


Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Las modalidades/clases deben forman un sistema exhaustivo y


excluyente
Exhaustivo: No podemos olvidar ningn posible valor de la variable

Mal: Cul es su color del pelo: (Rubio, Moreno)?


Bien: Cul es su grupo sanguneo?

Excluyente: Nadie puede presentar dos valores


simultneos de la variable

Estudio sobre el ocio

Mal: De los siguientes, qu le gusta: (deporte, cine)


Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

Tema 1: Introducin

13

Presentacin ordenada de datos


7

Gnero

Frec.

Hombre

6
5
4
3
2

Mujer

1
0
Hombre

Mujer

Las tablas de frecuencias y las representaciones


grficas son dos maneras equivalentes de presentar la
informacin. Las dos exponen ordenadamente la
informacin recogida en una muestra.
Tema 1: Introducin

14

Tablas de frecuencia

Exponen la informacin recogida en la muestra, de forma que no se pierda nada de


informacin (o poca).

Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad

Frecuencias relativas (porcentajes): Idem, pero dividido por el total

Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas

Muy tiles para calcular cuantiles (ver ms adelante)

Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8


Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

Sexo del encuestado

Vlidos

Hombre
Mujer
Tot al

Frecuencia
636
881
1517

Porcentaje
41, 9
58, 1
100,0

Nmero de hijos

Porcentaje
v lido
41, 9
58, 1
100,0

Vlidos

Nivel de felicidad

Vlidos

Perdidos
Total

Frecuencia
Muy f eliz
467
Bastante f eliz
872
No demasiado f eliz
165
Total
1504
No contesta
13
1517

Porcentaje
30,8
57,5
10,9
99,1
,9
100,0

Porcentaje
v lido
31,1
58,0
11,0
100,0

Porcentaje
acumulado
31,1
89,0
100,0

Perdidos
Tot al

0
1
2
3
4
5
6
7
Ocho o ms
Tot al
No cont esta

Frecuencia
419
255
375
215
127
54
24
23
17
1509
8
1517

Porcentaje
27, 6
16, 8
24, 7
14, 2
8, 4
3, 6
1, 6
1, 5
1, 1
99, 5
,5
100,0

Porcentaje
v lido
27, 8
16, 9
24, 9
14, 2
8, 4
3, 6
1, 6
1, 5
1, 1
100,0

Tema 1: Introducin

Porcentaje
acumulado
27, 8
44, 7
69, 5
83, 8
92, 2
95, 8
97, 3
98, 9
100,0

15

Datos desordenados y ordenados en tablas

Variable: Gnero

Gnero Frec.

Frec. relat.
porcentaje

Hombre 4

4/10=0,4=40%

Mujer

6/10=0,6=60%

Modalidades:

H = Hombre
M = Mujer

6
10=tamao
muestral

Muestra:
MHHMMHMMMH

equivale a
HHHH MMMMMM
Tema 1: Introducin

16

Ejemplo

Cuntos individuos tienen


menos de 2 hijos?
frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos

Qu porcentaje de individuos
tiene 6 hijos o menos?
97,3%

Qu cantidad de hijos es tal


que al menos el 50% de la
poblacin tiene una cantidad
inferior o igual?
2 hijos

Nmero de hijos

0
1
2
3
4
5
6
7
Ocho+
Tot al

Frec.
419
255
375
215
127
54
24
23
17
1509

Porcent.
(v lido)
27, 8
16, 9
24, 9
14, 2
8, 4
3, 6
1, 6
1, 5
1, 1
100,0

Porcent.
acum.
27, 8
44, 7
69, 5
83, 8
92, 2
95, 8
97, 3
98, 9
100,0

Tema 1: Introducin

50%

17

Grficos para v. cualitativas

Diagramas de barras

Alturas proporcionales a las frecuencias (abs. o


rel.)
Se pueden aplicar tambin a variables discretas

Diagramas de sectores (pay, polares)

No usarlo con variables ordinales.


El rea de cada sector es proporcional a su
frecuencia (abs. o rel.)

Tema 1: Introducin

18

Grficos
419
40 0

Recuento

Son diferentes en funcin de que las


variables sean discretas o continuas.
Valen con frec. absolutas o relativas.

30 0

255
215
20 0

127
10 0

54
24

Diagramas barras para v. discretas

Se deja un hueco entre barras para indicar


los valores que no son posibles

23

17

7 Ocho o m s

Nme ro de hijos

25 0

Histogramas para v. continuas

El rea que hay bajo el histograma entre


dos puntos cualesquiera indica la cantidad
(porcentaje o frecuencia) de individuos en
el intervalo.

20 0

Recuento

375

15 0

10 0

50

20

40

60

80

Edad del e ncue stado

Tema 1: Introducin

19

Diagramas integrales

Cada uno de los anteriores diagramas tiene su correspondiente diagrama


integral. Se realizan a partir de las frecuencias acumuladas. Indican, para
cada valor de la variable, la cantidad (frecuencia) de individuos que poseen
un valor inferior o igual al mismo.

Tema 1: Introducin

20

Das könnte Ihnen auch gefallen