Beruflich Dokumente
Kultur Dokumente
ESTADÍSTICA
Guía de Estudio
Cuarto Semestre
2007
Datos curriculares de la asignatura
Asignatura: Estadística
Licenciatura: Ciencias Políticas y Administración
Pública
Semestre: Cuarto
Área: Técnica-Instrumental
Secuencia: Investigación de Operaciones
Carácter: Obligatoria
Créditos: 08
Clave: 0427
PRESENTACIÓN
Introducción general 11
Objetivos generales 13
Criterios de evaluación-acreditación 14
Bibliografía general 89
Ciencias Políticas y Administración Pública
10
Estadística
Introducción general
11
Ciencias Políticas y Administración Pública
La Estadística inferencial comprende las técnicas con las que, con base únicamente
en una muestra sometida a observación, se toman decisiones sobre una población o proceso
estadístico. Dado que estas decisiones se toman en condiciones de incertidumbre, suponen
el uso de conceptos de probabilidad.
Mientras que a las características medidas de una muestra se les llama estadísticas
muestrales, a las características medidas de una población estadística, o universo, se les
llama parámetros de la población. El procedimiento para la medición de las características
de todos los miembros de una población definida se llama censo. Cuando la inferencia
estadística se usa en el control de procesos, al muestreo le interesa en particular el
descubrimiento y control de las fuentes de variación en la calidad de la producción.
12
Estadística
Objetivos generales
13
Ciencias Políticas y Administración Pública
• El alumno deberá presentar tres exámenes parciales. Podrá reponer uno de ellos,
sólo en caso de haber aprobado por lo menos dos, con la finalidad de mejorar la
calificación del que no acreditó.
14
Estadística
Unidad 1.
1. Organización y representación gráfica de la información
Datos y descripción 1.1 La información estadística
2 (estadística descriptiva) 1.2 Variable
1.3 Organización de la información
1.4 Representación gráfica de la información
2. Evaluación de parámetros
2.1 Medidas de tendencia central
3 2.2 Medidas de posición
2.3 Medidas de dispersión
2.4 Medidas de concentración
Unidad 2.
1. Definición clásica y estadística de probabilidad
Modelos de probabilidad 2. Probabilidad matemática
(estadística inferencial) 2.1 Experimentos aleatorios
2.2 Espacio de eventos
5 3. Elementos de la teoría de las probabilidades
3.1 Definición y axiomas
3.2 Propiedades
3.3 Sucesos mutuamente excluyentes y sucesos
independientes
3.4 Regla de la adición
3.5 Regla de la multiplicación (probabilidad condicional)
3.6 Teorema de la probabilidad total
3.7 Teorema de Bayes
3.8 Análisis combinatorio
3.9 Permutaciones
3.10 Combinaciones
15
Ciencias Políticas y Administración Pública
Unidad 3.
1. Variable aleatoria
Dependencia probabilística 2. Distribución de probabilidad univariada, discreta y
continua
2.1 Función de distribución de probabilidad
2.2 Función de densidad de probabilidad
2.3 Propiedades y medidas de asociación de las
6 distribuciones de probabilidad
3. Distribuciones discretas
3.1 Binomial
3.2 Hipergeométrico
3.3 Poisson
4. Distribuciones continuas
4.1 Normal
Unidad 4.
1. Teorema del límite central
Introducción al teorema del 2. Estimación
8 límite central y estimación 2.1 Estimación puntual
2.2 Estimador insesgado
2.3 Estimador consistente
2.4 Estimador eficiente
2.5 Estimador suficiente
3. Métodos de estimación
9 3.1 Estimación por intervalos
4. Cálculo del tamaño de la muestra
16
Estadística
Introducción
Este material tal vez no agote toda la gama de posibilidades para la organización y
representación gráfica, pero sí cubre los principales métodos utilizados en la Estadística
descriptiva y en la paquetería para PC.
Los datos, que representan la materia prima para la Estadística, se obtienen a través
de encuestas, observaciones, experimentos o de información contenida en estudios previos.
La captación de información a través de encuestas se utiliza típicamente en el
levantamiento de censos o muestras.
17
Ciencias Políticas y Administración Pública
Las formas de obtener información son muy diversas, dependen del tipo de estudio
que se pretende llevar a cabo. Así, las técnicas a utilizar en cada caso son muy distintas, no
es igual realizar un muestreo que un censo o que un experimento.
18
Estadística
Temario
19
Ciencias Políticas y Administración Pública
Objetivos de la unidad
Bibliografía básica
NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.
20
Estadística
Actividades de aprendizaje
1. De la siguiente lista de variables indique con una letra Q si es cuantitativa y con una
C si es cualitativa.
a) La edad de un individuo
b) La religión de una persona
c) La temperatura
d) El clima
e) La humedad
f) La belleza
g) La escolaridad de una persona
h) El PIB
i) La nacionalidad
j) El estado civil
2. De la siguiente lista de variables indique con una D si es discreta o con una C si es
continua.
a) Salario de un individuo (en pesos).
b) Estatura de una persona (en mieras).
c) Producto Interno Bruto.
d) El índice de Precios al Consumidor
e) El número de automóviles que circulan por una carretera en un día
f) El número de personas atendidas en un hospital en un día
3. La inversión anual de un grupo de industrias textiles es la siguiente (en miles de pesos)
10, 12, 8, 40, 6, 8, 10, 30, 2, 8, 6, 14, 16, 20, 25, 28, 30, 26, 30, 4, 6, 10,
18, 17, 13, 17, 21, 7, 6, 8, 14, 7, 15, 19, 27, 22, 0, 14, 6, 8, 9, 11, 13,
15, 18, 20, 30, 60, 12, 6, 5, 5, 6, 8, 7, 12, 15, 36, 30, 52
21
Ciencias Políticas y Administración Pública
GRUPO QUINQUENAL F
DE EDAD (AÑOS) (NO. DE INDIVIDUOS)
De 12 a 14 339,615
De 15 a 19 1,783,772
De 20 a 24 2,042,290
De 25 a 29 1,719,700
De 30 a 34 1,403,740
De 35 a 39 1,366,196
De 40 a 44 1,058,956
De 45 a 49 911,326
De 50 a 54 639,951
De 55 a 59 531,732
De 60 a 64 454,205
De 65 a 69 326,399
De 70 a 74 201,376
De 75 y más 178,799
Total 12,955,057
Encuentre:
a) Límite superior e inferior de cada clase.
b) Límite superior e inferior real de cada clase.
c) Punto medio por clase.
d) Rango de cada clase.
22
Estadística
23
Ciencias Políticas y Administración Pública
a) Con los datos anteriores construya una ojiva de P.M. vs fa, para cada uno de los
censos. Haga las comparaciones pertinentes.
b) De la ojiva para 1970 estime el porcentaje de la PEA cuyos ingresos son:
i. superiores a $300.
ii. inferiores a $1500.
iii. entre $400 y $1200.
c) Construya las tablas de cada censo utilizando salarios reales, en unidades
monetarias de la base del índice de Precios al Consumidor y haga algunas
comparaciones generales entre cada censo.
Preguntas de evaluación
24
Estadística
Bibliografía complementaria
CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.
25
Ciencias Políticas y Administración Pública
26
Estadística
Introducción
27
Ciencias Políticas y Administración Pública
28
Estadística
Temario
Objetivos de la unidad
29
Ciencias Políticas y Administración Pública
Bibliografía básica
NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.
Actividades de aprendizaje
30
Estadística
31
Ciencias Políticas y Administración Pública
Preguntas de evaluación
Bibliografía complementaria
CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.
32
Estadística
Introducción
33
Ciencias Políticas y Administración Pública
Temario
1. Variable aleatoria
2. Distribución de probabilidad univariada, discreta y continua
Función de distribución de probabilidad
Función de densidad de probabilidad
Propiedades y medidas de asociación de las distribuciones de probabilidad
3. Distribuciones discretas
Binomial
Hipergeométrica
Poisson
4. Distribuciones continuas
4.1 Normal
Objetivos de la unidad
Bibliografía básica
NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.
34
Estadística
Actividades de aprendizaje
X = No. de accidentes 0 1 2 3
P(X) = Probabilidad de accidentes 1/6 2/6 2/6 1/6
35
Ciencias Políticas y Administración Pública
10. Supongamos que el tiempo registrado muestra que un promedio de 5 de los 30 días
de noviembre son días de lluvia, (a) Suponiendo una distribución binomial con cada
día como un evento independiente, encuentre la probabilidad de que el próximo
mes de noviembre tengamos cuando mucho tres días de lluvia, (b) Dar razones
fenomenológicas que justifiquen no usar la distribución binomial.
11. Sea X una variable aleatoria de una distribución binomial con E[X] = 2 y σ2 = 4/3.
Hallar la distribución de X.
12. ¿Cuál es la función de densidad hipergeométrica y cuáles los parámetros que la
determinan?
13. Una muestra de tamaño 3 es extraída de una caja de 12 artículos. Si 4 de los
artículos son defectuosos, ¿Cuál es la probabilidad de objetos no defectuosos en la
muestra?
14. Considérese el caso de 10 votantes de los cuales 7 son de cierto partido A y 3 de
otro distinto B. Se ha tomado una muestra de 5 de ellos. ¿Cuál es la probabilidad de
que en la muestra haya 3 del partido A?
15. ¿Cuál es la función de densidad de poisson y cuáles los parámetros que la
determinan?
16. Con los datos del problema 10 utilice la aproximación de poisson a la distribución
binomial y compare los resultados para ver que tan buena es la aproximación.
17. Supongamos que el número de artículos de cierta clase comprados en una tienda
durante una semana sigue una distribución de poisson con μ = 50. ¿De cuánto será
la existencia que el comerciante tiene para producir la probabilidad de 0.98 para que
sea capaz de satisfacer la demanda? Usar la aproximación a la normal.
18. Supongamos que en una tienda entran 60 personas por hora, (a) ¿Cuál es la
probabilidad que durante un intervalo de 5 minutos no entre alguno en la tienda?,
(b) ¿Cuál es el intervalo de tiempo en el cual la probabilidad es 1/2 para que no
entre alguna persona en este intervalo?
19. ¿Cuál es la función de densidad uniforme y cuáles los parámetros que la determinan?
20. ¿Cuál es la función de densidad normal y cuáles los parámetros que la determinan?
21. Tenemos una máquina automática que estampa piezas, si controlamos la longitud de
la pieza X que está distribuida normalmente con esperanza matemática igual a 50
mm. Y no mayor que 68 mm. Encontrar la probabilidad de que la longitud de una
36
Estadística
Preguntas de evaluación
1. ¿Qué se entiende por variable aleatoria?
2. ¿Qué es una variable discreta?
3. ¿Qué es una variable continua?
4. ¿Qué es una distribución de probabilidad?
5. ¿Qué es la función de distribución de probabilidad?
6. ¿Qué es la función de densidad de probabilidad?
7. ¿Qué es la distribución Binomial?
8. ¿Qué es la distribución Hipergeométrica?
37
Ciencias Políticas y Administración Pública
Bibliografía complementaria
CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.
38
Estadística
Introducción
39
Ciencias Políticas y Administración Pública
Así, por ejemplo, supongamos que se desea conocer el ingreso promedio de las
familias mexicanas; un procedimiento sería realizar un censo que abarcara a todas las
familias mexicanas, lo cual requiere de una cantidad estratosférica de recursos y de tiempo;
después de efectuado el censo, sería válido dudar de que se hubiera proporcionado con
veracidad la magnitud de su ingreso.
40
Estadística
Temario
Objetivos de la unidad
Bibliografía básica
NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.
41
Ciencias Políticas y Administración Pública
Actividades de aprendizaje
1. Explique:
a) El concepto de estimador insesgado, consistente, eficiente y suficiente.
b) La diferencia entre estimación puntual y por intervalos.
2. ¿Qué utilidad aporta el cálculo de estimadores?
3. De una población de 450 se obtiene una muestra aleatoria simple de 81 unidades, la
media aritmética y desviación estándar de los ingresos mensuales en la muestra fue
de $1,200.00 y de $270.00 respectivamente:
a) ¿Podría decir cuáles son los parámetros de la población?
b) ¿Cuáles son los estadísticos?
c) ¿Cuál es la estimación de punto del ingreso medio mensual en la población?
d) ¿Cuál es la estimación de intervalo a un nivel de confianza del 99.73%
suponiendo que la desviación estándar de la población es σ = 270?
4. Determine los estimadores insesgados y eficientes de μ y σ2, tomando como base
los siguientes datos. Una muestra de cinco medidas del diámetro de una esfera se
registran como: 6.33, 6.37, 6.36, 6.32, 6.37 cm.
5. Se requiere encontrar el intervalo de confianza del 95% para el coeficiente
intelectual medio de los estudiantes de cierto colegio. Se ha tomado una muestra
aleatoria de 5 estudiantes y los resultados obtenidos son: 160, 170, 165, 175, 180.
¿Cuál es el intervalo buscado?
6. Dos grupos de cerdos fueron cebados con dietas diferentes. Se tomó una muestra
aleatoria de 9 cerdos de cada grupo y las medias muéstrales encontradas fueron X1
= 80Kg y X2 = 90 Kg, se admite que los pesos estaban distribuidos normalmente y
las desviaciones típicas eran σ1 = 9Kg y σ2 = 18Kg. Encuentre el intervalo de
confianza del 90% para la diferencia de medias.
7. En 1969 la especialidad de Relaciones Internacionales de la Facultad de Ciencias
Políticas y Sociales de la UNAM tenía un total de 356 egresados. Se diseñó una
muestra aleatoria simple con objeto de investigar la situación ocupacional de estos
egresados. La muestra se calculó para un nivel de confianza de 95%, precisión de
8% y estimado P= 0.7. ¿Cuántos egresados deberá contener la muestra?
42
Estadística
Preguntas de evaluación
Bibliografía complementaria
CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.
43
Ciencias Políticas y Administración Pública
44
Estadística
Unidad 1.
Los valores observados de una variable son aquellos que se obtienen a través de una
muestra, un censo o un experimento. Mientras que, los valores posibles de una variable son
todos aquellos que puede asumir una variable, aún aquellos que no sean observados. Esto
es, los valores observados son un subconjunto de los valores posibles. Por ejemplo, la
estatura de una persona adulta normal puede estar en un intervalo de valores que van desde
un metro cuarenta centímetros, hasta dos metros y diez centímetros, este intervalo
representa los valores posibles de la variable, mientras que, los valores observados serán
aquellos que se obtengan al levantar una muestra o un censo.
45
Ciencias Políticas y Administración Pública
En una variable continua siempre existen uno o más valores entre dos puntos contiguos,
lo que imposibilita la numeración del conjunto. Por ejemplo, la estatura de un individuo se
mide, por cuestiones prácticas, hasta centímetros, sin embargo, esto no quiere decir que no
existan estaturas en milímetros, millonésimas de milímetro, etc.
Esto implica que en medio de dos valores muy próximos existen uno o más valores que
no se han numerado. Si se acordara que las estaturas sólo se expresaran hasta centímetros,
los valores que asume la variable sí se podrían numerar y en este caso la variable ya no
sería continua sino discreta. Suele ocurrir que una gran variedad de variables discretas son
ordenadas de acuerdo al orden que siguen los números naturales, sin embargo, esto es sólo
una coincidencia, porque muchas variables que impliquen conteo asumirán valores
naturales, por ejemplo, el número de automóviles que entran a un estacionamiento en una
hora.
3. La forma más elemental de organizar los valores de una variable se denomina Serie
Simple de Datos y consiste en ordenarlos en forma creciente. Ejemplo:
La cantidad de pares de zapatos vendidos diariamente durante un mes por una casa
comercial es como sigue:
31, 35, 41, 48, 43, 52, 38, 41, 55, 37, 34, 43, 50, 40, 45
48, 48, 47, 56, 57, 45, 32, 45, 43, 45, 47, 53, 50, 38, 46
46
Estadística
En los intervalos de clase se agrupan los individuos u objetos cuyo valor numérico de la
variable se encuentra comprendido entre los límites de dicha clase. Si bien el censo no
especifica cuál es el ingreso de cada individuo, la masa de datos agrupada en el intervalo es
tan grande que seguramente la distribución de valores dentro del intervalo es homogénea o
uniforme. Sin embargo, cuando la información no es abundante es posible que algunos
valores se concentren hacia algún extremo del intervalo, lo que ocasiona que los límites del
intervalo no sean representativos. Esto es, al construir un intervalo de clase se debe
procurar que la información ahí agrupada se distribuya homogéneamente a lo largo del
intervalo.
6. Se denomina punto medio o marca de clase al valor medio del intervalo de clase, el
cual se obtiene de sumar los límites inferior y superior de cada clase y dividir entre
dos, esto es:
(Li+ Ls)/ 2
El punto medio representa el valor numérico que se le asigna en promedio a cada
individuo u objeto que pertenece a esta clase.
47
Cienciias Políticass y Administtración Públlica
A B
Diagra
ama de pastel do
onde cada interva
alo de clase está
á representado por
p una rebanada
a.
48
Estadística
9. Generalmente las ojivas son gráficas acumulativas de las frecuencias, por esta razón
es creciente el comportamiento de esta función.
49
Ciencias Políticas y Administración Pública
Dentro de los diversos tipos de ojivas que se pueden construir, existen dos de
particular interés, la ojiva “más de...” y la “menos de...”. La primera consiste en ir
desagregando los elementos de cada clase del total, empezando por la primera, luego la
segunda, etc., en este caso la gráfica es decreciente. Mientras que, en la ojiva “menos de”
las frecuencias se van agregando clase por clase, como en una ojiva convencional. En
ambos casos el encabezado de cada clase se comienza con la frase “más de...” o “menos
de...” y se establece un valor de la variable que esté comprendido en el intervalo en
cuestión.
50
Estadística
10. Estas medidas permiten evaluar la tendencia que tiene la gran masa de datos, esto
es, el valor de la variable alrededor del cual se aglomera la mayoría de las
observaciones. Las medidas que se estudiarán son la moda, la mediana, la media, la
media geométrica y la media armónica.
La Moda
Hasta aquí se ha evaluado la moda para una serie simple de datos, sin embargo, su
obtención se vuelve un poco más complicada para una distribución de clases y frecuencias.
En este caso, se puede demostrar de manera muy sencilla que la expresión es:
∆
Mo = Linf +
∆ ∆
donde:
51
Ciencias Políticas y Administración Pública
La Mediana
donde:
52
Estadístiica
La Me
edia Aritmé
ética
Es la med
dida de tenndencia cenntral más im
mportante pues,
p a difeerencia de las
l
anterioores, involuccra a todos los datos enn su cálculoo. La media, para una seerie simple de
datos, se calcula su
umando éstoos y dividiénndolos por ell número total, esto es:
X=
N
La media representa
r e punto de equilibrio
el e dee todos los datos,
d por ejeemplo, si caada
dato fuera
fu una pessa y fuera coolocada una en cada valoor a lo largoo de una reglla graduada en
años, empezando
e por
p la menorr edad y term
minando conn la mayor. La
L edad prom
medio o meddia
seria el
e punto en donde
d se equuilibra dicha regla si se sooporta en unna cuña.
18 19 20 21 2
22 23 24 255 26 27
21.33 años
a
X=
N
53
Cienciias Políticass y Administtración Públlica
Dondee:
r
N=∑ i es el número
n totall de datos
i=1
r es el número de clases
c o cateegorías.
i es el
e número dee datos por cllase.
xi es el punto med
dio de cada clase.
X = = + + +…
…+
N
que reepresenta el peso o factor de pondderación de cada categooría. Este faactor indica la
d datos (N)) con que contribuye cadda clase al valor del punnto medio de la
fraccióón del total de
mismaa. Por esta raazón, el valoor de la mediia no sólo deepende del valor
v del punnto medio, siino
de la cantidad
c de datos
d que esttén agrupadoos en la categoría o clasee corresponddiente.
Algunas prropiedades im
mportantes de
d la media son las siguiientes:
M(a) = a
M(a X)
X = a M(X)
54
Estadístiica
La Me
edia Geomé
étrica
Mgg = . . .… . = ∏
donde significa la productoria, es decir, sinntetiza el prooducto de loos valores dee Xi, desde quue
i = 1 hasta
h que i = N.
La media geométrica
g p datos aggrupados se calcula
para c a traavés de la exppresión:
Mg = = ∏
donde Xi es el pu
unto medio de
d la clase, fi la frecuenncia y r el número
n de cllases. En esste
caso el
e cálculo dee la media geométrica
g se complica con la fórm
mula precedennte, porque Xi
elevaddo a la fi pueede sobrepassar los límitees de una callculadora, poor ello conviene utilizarr el
siguiennte artificio::
M =
Mg =( . . .… . )1/N
55
Cienciias Políticass y Administtración Públlica
log Mg
M = log( . . .… . )1/N = log ( . . .… . )
logg Mg = log
g( . . .… . ) = (log + log + log +…+ log )
aplicanndo nuevam
mente la proppiedad del incciso iii) a caada sumandoo:
log )
56
Estadístiica
La Me
edia Armón
nica
N
Ma=
Para datos
d dos la expresión de la media
agrupad m armóniica es:
N
Ma=
Los Cu
uantiles
Los cuantiles proporcionan el valoor que asumee la variable para una fraacción del tootal
de la población.
p Por
P ejemplo, si una poblaación es dividida en tress partes los cuantiles
c serrán
tres y se denomin
nan primero, segundo y tercer
t tercilees. El primeero nos indicca el valor que
q
asumee la variable para el prim
mer tercio dee la poblacióón, el segunddo para los dos
d tercios y el
terceroo para el totaal de la pobllación. Si la población se
s divide en cuatro se llaaman cuartilees,
en cinnco quintiles,, en diez decciles y en cien percentilees. El últimoo cuantil siempre indicaa el
total de
d la població
ón por eso coincide con el límite supperior de la última
ú clase..
57
Ciencias Políticas y Administración Pública
Las medidas de posición tienen mayor importancia cuando se maneja una gran masa
de información, en una serie simple de datos resulta poco práctico ubicar los cuantiles si los
datos no han sido organizados en una distribución de clases y frecuencias, en cuyo caso los
cuartiles se encuentran a través de la siguiente expresión:
Cr = Lic +
12. Como se podrá apreciar, existe una gran variedad de parámetros para distintos
propósitos, en esta sección se tratarán los relacionados con la dispersión de la
información.
Rango
58
Estadístiica
Varia
anza y Desv
viación Típiica
S2 =
N
S2 =
N
Al igual qu
ue en la meddia, la disperrsión es pondderada por los factores fi/N, esto es, la
variannza no sólo depende
d de la magnitudd de la dispeersión, sino del
d “peso” que
q tenga caada
clase respecto
r a laas demás.
59
Ciencias Políticas y Administración Pública
a) Var(a) = a
b) Var(aX) = a Var(X)
c) Var(a+X) = Var(X)
Coeficiente de Variación
S
CV =
Por ejemplo, dos distribuciones poseen la misma varianza S2, sin embargo, una
tiene una media de 50 y otra de 450, esto quiere decir que la primera tiene un coeficiente de
dispersión mayor que la segunda, esto es, la dispersión relativa de los datos respecto al
punto de equilibrio de la distribución es menor en el segundo caso que en el primero, sin
embargo, la dispersión absoluta es la misma.
La Asimetría
60
Estadística
= Md = Mo
Por esta razón, una forma de medir la asimetría ha sido evaluar la distancia entre la
media y la moda, o la media y la mediana y estandarizarla dividiendo entre la desviación
típica. Particularmente, el primer y segundo coeficientes de asimetría de Pearson, están
basados en este principio:
3( – Mo)
Asimetría =
S
3( – Md)
Asimetría =
S
Otra forma de evaluar el grado de asimetría de una serie de datos agrupados consiste
en recurrir al tercer momento respecto a la media y dividirlo por la desviación típica al
cubo, esto es:
61
Ciencias Políticas y Administración Pública
La Curtosis
14. Una medida de concentración mide el ritmo de acumulación de una variable, en este
sentido, es muy similar a la técnica utilizada para obtener una ojiva. Esta medida de
la concentración para una serie de datos agrupados se denomina Índice de Gini, y
no es una medida promedio como las estudiadas con anterioridad, es una medida
que se obtiene de consideraciones geométricas sobre la curva de Lorenz.
Curva de Lorenz
Como se recordará, las ojivas son gráficas acumulativas de los valores de la variable
y muestran gráficamente el ritmo de acumulación de una variable, por esta razón, la forma
gráfica de apreciar la concentración de una variable tiene que estar relacionada con las
ojivas. La curva de Lorenz es una ojiva invertida, esto es, las frecuencias acumuladas se
grafican en el eje X y el producto de f por X acumulado se gráfica en el eje Y.
62
Estadística
Curva de Lorenz
Índice de Gini
XiYi+1 – Xi+1Yi
IG =
(100)2
donde:
Xi = ia%
Yi = ( iXi)a%
63
Ciencias Políticas y Administración Pública
Curva de Lorenz
Unidad 2.
En el caso en que n → ∞ (sea n grande), esta razón (f/n) tenderá el valor a/c, puesto que
cada uno de los c casos posibles se presentará n/c veces, pero a de ellas son favorables, o
sea na/c, por lo que f ≡ na/c será el número de veces que ganemos.
64
Estadística
4. Que un fenómeno o suceso sea aleatorio, quiere decir que no podemos afirmar un
resultado a priori de su comportamiento. Por ejemplo, una moneda al ser arrojada,
tiene 2 posibilidades, que caiga sol, o bien águila, sin embargo, no podemos
predecir cuál de los 2 resultados será el que aparecerá. Ahora la pregunta adecuada
sería: ¿De dónde proviene la aleatoriedad de un fenómeno?
Hay que señalar que un fenómeno no es determinista o aleatorio, sino depende de las
condiciones en que se realice éste, para que sea lo uno o lo otro. Esto es, la arbitrariedad de
las condiciones es lo que nos permite fenómenos o eventos aleatorios.
65
Ciencias Políticas y Administración Pública
66
Estadística
67
Ciencias Políticas y Administración Pública
P (A ∩ B) = P(B) x P(A/B)
P (A ∩ B) = P(A) x P(B/A)
Puesto que A ∩ B = B ∩ A
10. Sean A1, A2,…, Ak eventos mutuamente excluyentes, tales que A1 ∪ A2, ∪,…, Ak =
S (espacio total de eventos). Por otra parte, sea X un evento arbitrario de S.
Entonces:
P(X) = P(A1) P(X/A1) + P(A2) P(X/A2) +… P(Ak) P(X/Ak)
68
Estadística
11. Sea A1, A2, …, Ak un espacio completo de eventos, y sea X un evento cualquiera de
S, entonces:
P(Ai) P(X/Ai)
P(Ai/X) =
P(Ai) P(X/Ai) +...+ P(Ak) P(X/Ak)
Unidad 3.
Esta regla de asociación o función es uno a uno, es decir, le asocia a una variable
aleatoria solamente un valor real del conjunto de números reales (R).
69
Ciencias Políticas y Administración Pública
3. En general todos los fenómenos que se presentan tanto en las ciencias sociales como
en las exactas son de carácter continuo, puesto que están relacionados con
mediciones del comportamiento intrínseco del fenómeno aleatorio, como por
ejemplo, la medición de las estaturas de los estudiantes; la medición del diámetro de
los anillos de un motor; el ingreso de la población económicamente activa; el precio
de cierto producto en el mercado.
Esto quiere decir que, tanto la continuidad como la discreción de la variable aleatoria,
están determinadas por el tipo de fenómeno aleatorio a estudiar, ya que depende del
conjunto de valores reales que le asignemos.
Así, la variable aleatoria continua se define como la función que asume un conjunto de
valores no numerables (infinito) del sistema de números reales, donde entre uno y otro
valor sucesivo que puede tomar la variable aleatoria hay un conjunto infinito de valores
intermedios, es decir, la distancia entre uno y otro valor sucesivo es tan pequeña que tiende
a cero.
70
Estadístiica
¿P
Por qué distriibución?
Poorque existee un rango de valores que puedee tomar, y no solameente un valoor,
conseccuentementee, las probabbilidades quee se les pueden asignar a cada valoor que tome la
variabble aleatoria o a un conjuunto de ellass, nos produce una distriibución de probabilidade
p es,
cuyo intervalo
i de definición es
e [0, 1], porrque la probbabilidad estáá normalizadda, es decir, la
probabbilidad de occurrencia dee cualquier evento
e de unn fenómeno aleatorio es 1. Asimism
mo,
la probbabilidad dee no-ocurrenncia de cualqquier eventoo de un fenóómeno aleatoorio es 0. Así,
A
los inntervalos de definición de la variiable aleatorria pueden ser cerradoos, abiertos o
semiceerrados y ten
nemos que:
Similarmen
nte para un evento
e falso o vacío:
Así, si la variable
v aleaatoria tiene un
u comportam
miento discrreto, la probbabilidad de un
eventoo o conjunto de eventos estará dada por la probaabilidad de éste, o bien, por
p la suma de
probabbilidades dee los eventoos del conjuunto, las cuuales serán discretas, siimbólicamennte
tendreemos:
71
Cienciias Políticass y Administtración Públlica
P(a ≤ x ≤ b) =
P(-∞, λ)
λ = P(-∞ < x(w) ≤ λ)) = P(x(w) ≤ λ)
P(x ≤ λ)
λ = F(λ) =
donde (x) es la fu
unción de deensidad de prrobabilidad de la variablle aleatoria x(w).
x
La función
n de distribuución es unaa función accumulativa, puesto
p que λ puede tom
mar
cualquuier valor dee R, y de ésta manera representaráá la probabilidad de cuaalquier evennto
desde -∞ hasta ell valor λ incclusive, es decir,
d acumuula la probabbilidad de loos eventos del
d
espaciio de eventoss.
72
Estadístiica
En el caso
c discreto
o la podemos definir de la siguiente manera:
a)
(x) 0
b)
c)
donde a y b son cu
ualquiera dos valores de x que satisffacen a < b.
73
Cienciias Políticass y Administtración Públlica
En caso de
d variables aleatoriass discretas también se deben cum
mplir las trres
propieedades ya señaladas paraa el caso conntinuo, con las siguientees modificacciones para los
l
incisos b) y c):
b)
c)
Enn los fenómeenos binomiales se denoomina éxito a la ocurrenncia de uno de los eventtos
de la dicotomía,
d y fracaso a la ocurrencia del
d evento contrario.
Si tenemos n eventos
e mueestrados (noss referimos a una muestrra de tamañoo n extraída de
una pooblación “m
muy grande””) de los cuaales k preseentan cierta característicca y n-k no la
74
Estadístiica
8. Esta distrib
bución perteenece a la familia
fa Bernooulli, porquee aquí tambbién existe una
u
dicotomía o policotom n se considdera a cada evento con la
mía, exceptoo que aquí no
misma pro
obabilidad dee ocurrenciaa, es decir, al
a obtener unna muestra la
l hacemos sin
s
reemplazarr nuevamennte el elemeento muestreeado. Por loo que la prrobabilidad de
ocurrenciaa del siguiennte elemento en muestreear se ve conndicionada a la extracciión
anterior, o sea se trata de eventos dependiente
d s, a diferenccia de lo quee ocurría en las
l
distribucio
ones binomiaal o multinom
mial, donde cada evento era indepenndiente.
A seráá: y de que
q el segunndo sea A serrá: . Si extraem
mos una muesstra de tamaaño
n de la
l población
n de N y see desea conoocer la probbabilidad de que k de ellos
e tengan la
caracteerística A y de que n - k no la tengann, tendremoss que:
75
Cienciias Políticass y Administtración Públlica
y el reesto de la mu
uestra (n-k), serán aquelllos de tipo Ā y podrán seer seleccionaados de:
9. La distribu
ución de Poisson
P es utilizada
u paara determinnar las probbabilidades de
ocurrenciaa de eventoss poco probaables o alteernativamentte, que muyy posiblemennte
ocurran, essto es, cuanddo p es un vaalor cercano a cero y q es
e muy cercaano a la uniddad
y con una muestra
m de tamaño
t n graande (n>50)..
Coonsideremos la función de
d densidad binomial, quue como sabemos tiene la
l forma:
…. ….
F(x) = =
! !
76
Estadístiica
…
….
F(x)) = (1-p)qn--x
!
de aquuí reconocem
mos que en laa distribucióón binomial np
n = μ = λ. Entonces:
E
f x n‐x
1 1‐ 1/n
1 1 ‐2
2/n ….. 1 –– x – 1 /n λx / x! 1 – p n / 1 – p
p x
1 – p n
Al enccontrar el lím
mite de la succesión:
Z 1/z
(1 + Z) cuuando z →0, tenemos que:
entoncces si z = -p tenemos:
λ
λ
….
es:
77
Ciencias Políticas y Administración Pública
λ λ
f x donde x = 0, 1, 2, ….
!
78
Estadístiica
x
Dondee:
μ es la mediaa de la distribución
σ la varianzaa de la distribbución
Podemos notar
n de la gráfica
g que la
l curva se aproxima
a asiintóticamentte al eje de las
l
x, haccia ambos laados de la media
m μ, lo que
q significa que los vaalores muy alejados de la
mediaa, ya sea a la izquierda o a la derechaa, tienen pocca probabiliddad de realizzarse, debidoo a
que el área bajo laa curva es cada vez menoor.
79
Cienciias Políticass y Administtración Públlica
Entoncces:
Z
(Esta es
e la distribu
ución normall de probabilidad con μ = 0 y σ = l.
Unida
ad 4.
Z
tiene una
u distribucción que se aproxima
a a laa distribucióón normal esstándar cuanddo n → ∞”.
Desde un punto
p de vistta práctico, este
e teoremaa es excesivaamente impoortante, porqque
permitte el uso de la curva noormal cuandoo la variablee X tiene unna distribuciión que difieere
considderablementee de la norrmal. Desdee luego, la mayoría dee las distribuciones de X
difiereen de la norrmal debidoo al tamaño de n, el cuual, cuando n es grandde garantiza la
aproxiimación norrmal de X. Experimento
E os de muestrreo han mosstrado que para
p n > 50 la
forma de f(x) (fun
nción de dennsidad de prrobabilidad)) influye muuy poco sobrre la forma en
que see distribuye X para algunna f(x).
80
Estadístiica
μ √ √
Z
σ
81
Ciencias Políticas y Administración Pública
Los valores muéstrales son utilizados para formar una relación funcional Ô =
f(x1,....,xn ) que no contiene ningún valor desconocido. Esta relación Ô es denominada
estimador de θ.
Como las xi son variables aleatorias que tienen la distribución F(x ; 0), el estimador
Ô es una variable aleatoria cuya distribución dependerá por lo general de θ. Observe que
para cada muestra de tamaño n que sea obtenida, puede calcularse un valor de Ô, este valor
se conoce como estimación de θ: dicho de otra forma, una estimación es un valor
observado de la variable aleatoria Ô = f(x1 ,....,xn).
Cabe señalar que el parámetro θ es estimado por una cantidad única, razón por la
cual este tipo de estimación es conocida como estimación puntual.
82
Estadística
A todo estimador que cumpla con esta propiedad se le conoce como estimador
consistente. Así, un estimador Ô = f(x1 ,....,xn) es consistente si su varianza E(Ô - θ)2,
tiende a tomar el valor cero cuando el tamaño de la muestra n tiende a tomar valores muy
grandes, es decir, tiende a infinito.
E(Ô1 - θ)2
E(Ô2 - θ)2
6. Debido a que cualquier información que sea recabada implica un costo, tanto
monetario como de tiempo, es importante no desperdiciar información, es por esto
que existen los estimadores que en su cálculo incluyen toda la información
disponible: los estimadores suficientes.
83
Ciencias Políticas y Administración Pública
Así, considérese una muestra aleatoria de tamaño n extraída de una población normal de
varianza σ2 y supóngase que el estadístico muestral es Ô. El problema consiste en estimar el
parámetro θ de la población utilizando un intervalo de valores de la variable aleatoria X.
Puesto que σ2 es la varianza de la población, tenemos que σ2Ô es la varianza de la
distribución muestral del estimador Ô. Aunque θ es un valor desconocido, se sabe por la
teoría del muestreo que Ô es una variable aleatoria con distribución de probabilidad cuya
media y varianza están dadas por μÔ y σ2 Ô.
Además, por el teorema central del límite, está distribuida normalmente con media μ
84
Estadística
–
p
σ σ σ
sustituyendo Z=
σ
resulta:
p(-Z < < Z) = β
σ
de donde:
p( – Z σ < μ < + Z σ ) = β
10. Supongamos que x1, x2,….., xn son los valores obtenidos de una muestra aleatoria
de tamaño n extraída de una población cuya media μ es desconocida pero cuya
varianza σ2 se supone conocida, se distinguirán dos casos:
85
Cienciias Políticass y Administtración Públlica
-Z μ + Z
11. Si el estim
mador Ô es laa proporciónn de éxitos enn una muestrra de tamañoo n extraída de
una poblaación binom
mial en la que
q p es laa proporciónn de éxitos (es decir, la
probabilidaad de éxito)), los límitess de confiannza para p vienen
v dadoss por p ± zσ
σp,
donde p es
e la proporcción de éxittos en la muestra
m de taamaño n. Coon los valorres
obtenidos de
d σp, se tiene que los líímites de connfianza paraa la proporcióón poblacionnal
son dados por:
p z =p z
p z =p z
si el muestreo
m es sin
s reemplazo de una pobblación finita de tamaño N.
Para calcu
ularse estos límites
l de coonfianza pueede utilizarsse el estimaddor muestrall p
para laa proporción
n poblacionaal p, que genneralmente da
d una aproxximación sattisfactoria paara
do más exaacto para obbtener estos límites de confianza a un nivel de
n >300. Un métod
confiaanza determin
nado por z, es
e transform
mar la proporrción p a unidades tipificcadas.
Z=
86
Estadística
p=
p ± zασp
87
Ciencias Políticas y Administración Pública
88
Estadística
Bibliografía general
CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill,
1985.
NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México,
Siglo XXI, 1990.
89
APUNTES
"
DATOS DEL TUTOR
NOMBRE
CORREO ELECTRÓNICO
FECHAS DE TUTORÍA
n s
o t
p u
q v
r w