Sie sind auf Seite 1von 70

Mdulo 1:

1 ESTADISTICA: DEFINICIN

Definicin: Es el conjunto de mtodos y tcnicas que permiten determinar, de una


muestra debidamente representativa de una poblacin, los valores estadsticos, a fin
de poder inferir sobre los parmetros poblacionales con un cierto grado de bondad"

Esta definicin comprende tanto a la estadstica descriptiva como a la estadstica


inferencial. Mark Berenson y David Levine1, definen Estadstica descriptiva como El
conjunto de mtodos que incluyen la recoleccin, presentacin y caracterizacin de
un conjunto de datos con el fin de describir apropiadamente sus caractersticas.
Mientras que a la estadstica inferencial la definen como Conjunto de mtodos que
hacen posible la estimacin de una caracterstica de la poblacin o la toma de una
decisin referente a una poblacin basndose solo en los resultados de una muestra.
La comprensin de estas definiciones se ve facilitada si se aclaran convenientemente
algunos trminos de las mismas.

1.1 POBLACIN:

Qu se entiende por poblacin?

Definicin: El conjunto de datos cuantificable pertenecientes al sistema en estudio


constituye la poblacin."

Esto implica que si el sistema en estudio es la produccin agrcola ganadera de la


Provincia de Crdoba, entonces el mismo estar constituido por todos los
establecimientos agropecuarios de la Provincia. Si en cambio se pretende estudiar la
edad promedio de los estudiantes de la Universidad Empresarial Siglo 21, la poblacin
estar conformada por todos los estudiantes de esa Institucin. Si se presenta en un
Estudio Publicitario, la necesidad de plantear una campaa para promover la venta
de un nuevo perfume en la ciudad de Crdoba, la poblacin a estudiar estar
constituida por todas las mujeres de dicha ciudad en condiciones de seleccionar y
elegir un perfume. Si se pretendiere realizar un estudio sobre la calidad de los tomates
producidos en las quintas de los alrededores de la ciudad, entonces todas las quintas
con produccin de tomates prxima a la ciudad de Crdoba se constituirn en la
poblacin.
Pudiere ser de importancia para un nuevo gobierno provincial prever el
comportamiento de los contribuyentes a las obligaciones impositivas, en caso de
reducir el monto de los impuestos, en este caso la poblacin estar constituida por
todos los contribuyentes
A fin de poder tomar las medidas ms adecuadas ser necesario contar con la mayor
informacin posible, si los datos informativos con los que contamos provienen del
estudio de toda la poblacin, no sera necesario realizar ninguna inferencia, decimos
que se ha efectuado un censo de la poblacin. Pero en ese caso dicha mayor

1
Estadstica Bsica en Administracin pg.2

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -1-


Profesor: MARIO MARN
exactitud va acompaada por un mayor costo y tiempo que evidentemente encarece el
proceso. Es decir, los resultados que puede entregarnos un censo tienen el carcter
de ser exactos, pero los costos que determinan los mismos pueden no justificar
dicha exactitud cundo, con muestras debidamente seleccionadas se determinan
esos valores con un cierto grado de error que se puede regular y que ms adelante
veremos.
Por otra parte en algunas situaciones particulares el censo se presenta impracticable o
puede no ser conveniente. Piense el lector que si el estudio se refiriere al
comportamiento de las abejas en un colmenar, la poblacin tendra el carcter de
infinita y por lo tanto sera imposible censarla.
Supongamos que se desata una epidemia en la poblacin y debemos analizar la
respuesta a un cierto medicamento. Pretender estudiar la respuesta de toda la
poblacin a la nueva droga llevara un tiempo enorme tal que al cumplirse tal vez no
tendra sentido la aplicacin del medicamento.
Una Empresa automotriz recibe de una Autopartista una partida de 500 pernos de
pistn, Recepcin debe decidir su aceptacin. Dentro de los ensayos a realizar sobre
las piezas, adems de dimensiones y dureza se debe efectuar un ensayo de traccin
para el cual sera necesario destruir la pieza, en este caso sera entonces imposible
ensayar todas ellas. Por otro lado, si el verificar las dimensiones constituyere otro
ensayo a realizar, genera en la cantidad de pernos verificados un efecto particular
sobre el operario que lo realiza, lo cual lo lleva a cometer errores, en algunos casos
superiores a los que se cometeran efectuando un muestreo. Tendramos tambin
que tener en cuenta el costo de mano de obra que representa la verificacin de esos
elementos.
Esto que hemos expresado nos lleva a la necesidad de poder tomar decisiones en
base a las inferencias que sobre una poblacin podemos hacer de resultas del anlisis
y estudio de una muestra de la misma.

1.2 MUESTRA:

De acuerdo a lo visto en el tem anterior, estudiar el comportamiento de una poblacin


a travs de un censo, se torna en la mayora de los casos impracticable, es por esa
razn que el anlisis se efecta por medio de una muestra que est constituida por
una parte de todos los valores poblacionales.

Definicin: Una muestra estar constituida por un subconjunto de la poblacin ."

Cada uno de los elementos que forman parte de la muestra se denominan


observacin.

MUESTRA DEBIDAMENTE REPRESENTATIVA

Si bien es cierto que una muestra est constituida por elementos pertenecientes a la
poblacin, tendremos que comprender que no todo subconjunto de la poblacin se
constituye en una muestra debidamente representativa. Vale tal vez recordar que en
1936 en vsperas a las elecciones presidenciales de EE.UU., la encuestadora
LITERARY DIGEST pronostic el triunfo del candidato Republicano con un apreciable

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -2-


Profesor: MARIO MARN
margen por sobre su opositor Roosevelt. El pronstico se basaba sobre los resultados
de una encuesta hecha sobre una muestra de dos millones de habitantes. No
obstante el triunfo fue del candidato demcrata y el error en la inferencia se deba a
que los encuestados fueron seleccionados entre los poseedores de automviles y
abonados telefnicos. En esos momentos los que estaban mejor posicionados para
poseer automvil y lneas telefnicas correspondan a la clase media y alta, en su
mayora con tendencias republicanas, pero el triunf qued en manos de Roosevelt
apoyados por la masa poblacional de menores recursos.

Definicin: Una muestra se dice que es debidamente representativa de una poblacin


cuando presenta sus mismas caractersticas.

Presentar las mismas caractersticas que la poblacin implica que, si el 20% de la


poblacin cumple con una determinada propiedad, se espera que el 20% de la
muestra cumpla con esa misma propiedad.
Esto permite disminuir los errores que se cometen cuando se efecta la inferencia de
los parmetros poblacionales a partir de los valores determinados en la muestra.

1.3. VALORES ESTADSTICOS

El estudio realizado sobre una muestra nos permite determinar valores cuyas
caractersticas nos referiremos ms adelante y a los cuales se los denomina
estimadores pudiendo tambin tomar el nombre de valores estadsticos, mediante
los cuales se podr efectuar una correcta estimacin sobre los valores de la
poblacin.
Por otra parte, los valores propios de la poblacin toman el nombre de Parmetros.
Si se pretendiere determinar el salario de los empleados metalrgicos del Pas,
tomaramos una muestra constituida por operarios de distintas empresas y distintas
provincias y siempre proporcional al nmero de operarios de cada lugar, el salario
promedio obtenido en la muestra se denomina estadstico, mientras que el salario
promedio de toda la poblacin obrera metalrgica se constituye en parmetro

1.4. PARMETROS

Definicin: Los valores en estudio, que en la muestra toman el nombre de


Estadsticos, en la poblacin se los denominan Parmetros.

Definicin: Se define como bondad al margen de seguridad con que se realiza la


inferencia de acuerdo a los estudios realizados sobre la o las muestras.

Aseverar que tal poltico ganar las prximas elecciones presidenciales no tiene peso
como informacin si no se lo acompaa con un grado de seguridad. Indicar que las
encuestas los dan ganador por tal cantidad de puntos, solo es tomado en cuenta
cuando se acompaa esa informacin con una determinada seguridad.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -3-


Profesor: MARIO MARN
2. Variable, Datos
Debemos tener en cuenta que la Estadstica basa su aplicacin en el estudio y anlisis
de nmeros los que se denominan Datos. Si dichos datos son obtenidos a travs de
una muestra, se los llama observaciones, las que deben responder a una
determinada caracterstica que es la que tenemos en estudio, puede ser la
produccin avcola en la provincia, la inversin de dinero en publicidad en los distintos
medios durante el ao 1998, o a la cantidad de precipitaciones en el sur de la
provincia, la concurrencia a un Centro Comercial, las temperaturas mximas diarias
durante el mes de marzo en una determinada localidad, el nmero de alumnos
ingresados en cada una de las Universidades de la provincia. De Crdoba en el
corriente ao, cada una de estas toma el nombre de Variable. En definitiva cada vez
que nos aboquemos a un estudio estadstico debemos de tener en cuenta que dicho
estudio corresponde a una Variable, y que de sta se tendrn Datos y los que
corresponden a Observaciones realizadas. Mediante la aplicacin de mtodos y
tcnicas estadsticas se estudian estas observaciones y se determinan los
estadsticos.

2.1 TIPO DE VARIABLE

En una fbrica de automotores puede considerarse necesario determinar el nmero de


automviles de cada modelo producidos durante el ltimo trimestre, a fin de poder
compararlo con las unidades producidas durante el mismo perodo del ao anterior y
poder prever la produccin para los futuras perodos. Al Ministerio de Agricultura y
Ganadera, le ser imprescindible definir la cantidad de hectreas sembradas de maz
en todo el Pas y en condiciones de ser levantadas en la prxima cosecha. En la
localidad de Embalse de Ro Tercero, se tienen piletas en donde se efecta la cra de
pejerreyes y por lo tanto le ser de suma importancia definir, para cada perodo del
proceso el tamao promedio de los peces. Para una planta generadora de energa
elctrica, le es necesario determinar los picos de consumo de energa durante el da y
el consumo durante las diferentes pocas del ao. Puede ser deseable para la
Secretara de Cultura de la Municipalidad de la ciudad de Crdoba, definir el grado de
calidad que poseen los Artistas Plsticos, para lo cual ser necesario valorizar las
obras de cada uno de ellos. Observar el lector que el tipo de dato de cada una de las
incgnitas en estudio puede tener caractersticas diferentes. En el estudio de la
produccin de automviles, la cantidad de unidades producidas es un nmero entero
definido, no es as en el caso de querer determinar la longitud de los peces que se
cran en Embalse, ya que la exactitud de la misma depender del instrumento con que
se realice el proceso. En el caso de pretender determinar el grado de calidad de los
maestros plsticos de Crdoba, no hay la menor duda en que, la definicin de la
misma depender del criterio experiencia y capacidad de quien realice la valorizacin
de cada obra. Es decir ser necesario efectuar una clasificacin de los tipos de datos:

Discretos

Cuantitativos
Continuos
Tipos de Datos
Nominales
Cualitativos

Jerarquizados

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -4-


Profesor: MARIO MARN
Discretos: Se dice que un valor es discreto cuando es el resultado de un conteo.

Nmero de televisores por hogar


Cantidad de alumnos aprobados o reprobados en una evaluacin
Nmero de habitantes por mdicos en una localidad; etc.
Tmense stos como modelos de datos discretos

Continuos: Se dice que una variable es del tipo continuo cuando asume
valores dentro de un intervalo de nmeros reales.

Las alturas de los alumnos de un curso


La longitud de peces en un lago
El volumen de precipitaciones anuales etc.

Es decir en definitiva, cuando el valor del dato u observacin se mide en un intervalo,


decimos que es del tipo continuo

Nominales: Cuando los valores que adopta la variable en estudio puede ser
clasificada de acuerdo a categoras, tal como lo sera el responder a una encuesta
efectuada al personal de una Empresa automotriz y en la cual se plantea la situacin
de cada uno en cuanto a su estado civil. Sabemos que en este caso se tendran las
categoras de:

Soltero casado viudo divorciado

O el caso de realizar un estudio en un club social, en donde nos encontraremos con


que sus asociados se encuentran categorizados por edad segn:

Infantiles cadetes mayores

En estos casos en donde los datos se pueden agrupar por categoras es necesario
introducir, a fin de poder realizar su estudio, una cierta codificacin. De cualquier
manera no se podrn hacer estudios matemticos entre categoras.

Jerarquizados: Este tipo de dato se presenta cuando es necesario otorgarle a la


variable una cierta jerarqua de orden. Supongamos tener que estudiar el grado de
calidad de las obras expuestas por un cierto nmero de plsticos de Crdoba a fin de
asignar los correspondientes premios. A tal efecto ser necesario acudir al juicio de
un perito que permita definir el grado de categora de cada uno de los participantes,
esto implica que en el proceso de jerarquizar las obras de cada uno influir el
criterio de quin realiza el estudio, tal vez de ser otro el que efecte el anlisis pudiere
modificar dicho orden. Como conclusin entonces no podr en este tipo de variable
asegurar la exactitud del clculo

2.2. VALORES ESTADSTICOS

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -5-


Profesor: MARIO MARN
Al definir los objetivos de la Estadstica, expresbamos la necesidad de poder inferir
sobre las caractersticas de la poblacin, a travs del anlisis y estudio de la muestra.
Todos los valores que se determinan en la muestra se denominan estadsticos,
mientras que los valores propios de la poblacin se denominan parmetros. Adems
los valores estadsticos se pueden clasificar de acuerdo a sus caractersticas de la
siguiente manera:

Media

Mediana
De tendencia
central o posicin Moda
Valores
estadsticos Rango
De dispersin Desvo medio
Varianza
Desviacin estndar
Coeficiente de variacin

SERIE SIMPLE

A los efectos de preparar un Congreso Internacional en una zona del Sur del Pas, se
ha solicitado el registro de las temperaturas mnimas de los ltimos once das del mes
de julio del ao anterior, obteniendo como respuesta los siguientes datos:

-2 0 1 -1 -3 -1 -2 -2 1 0 -2

La primera operacin a realizar para el estudio de esa muestra es la de ordenar


las observaciones de menor a mayor.
El conjunto de observaciones ordenadas de menor a mayor se denomina Serie
Simple.

-3 -2 -2 -2 -2 -1 -1 0 0 1 1

En este caso, la variable en estudio est dada por las temperaturas y cada una de las
observaciones corresponder a un nuevo valor adoptado por la incgnita.

x = temperatura
n = nmero de observaciones = 11

La Serie simple se puede expresar como:

x1 x2 x3 x4 . . . . . . . . . . . . . . . . . . . . . . . . . . .xn

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -6-


Profesor: MARIO MARN
dnde:

x1= -3 y xn = 1

Con todos los valores que adopta la variable en estudio se genera una distribucin,
denominada Distribucin de la Variable en estudio

2-3. MEDIA

Se define como media aritmtica o promedio de una distribucin al cociente entre la


suma de todas las observaciones dividido el nmero total de ellas:

Es conveniente aclarar que la media poblacional se define como:

x1 + x2 + x3 + . . . . + xN
= --------------------------------
N

N tamao de la poblacin

Cuya denotacin general es

xi
1
=
N

Mientras que en la muestra el estadstico x corresponde a la media de la muestra.


x1 + x2 + . . . . . . . + xn
x = -------------------------------- n es el nmero de observaciones.
n

Se denota como:

x
1
i
x=
n
El siguiente diagrama representa la analoga entre la media poblacional para una
poblacin y la media muestral para una muestra:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -7-


Profesor: MARIO MARN
Poblacin


Muestra
Tamao: N
x
Tamao: n

En nuestro caso:

-3+ (-2)+ (-2)+ (-2)+ (-2)+ (-1)+ (-


1)+0+0+1+1
x = ------------------------------------------------------ = -1
11
Dentro de los valores estadsticos de posicin central la media es el de mayor
representatividad, pero debemos tener presente que a su vez es el ms sensible a
los valores extremos de la distribucin
Los valores extremos de la distribucin pueden influir en el valor de la media y de esa
manera hacerle perder su condicin de referente, tenga Ud. en cuenta el siguiente
ejemplo: En una Empresa con 9 operarios que ganan cada uno de ellos la cantidad de
$1000 mensuales, y con un Gerente general cuyo sueldo es de $10.000, el sueldo
promedio para esa distribucin ser:

1000 + 1000 + 1000 +. . . . + 10000 19.000


= ---------------------------------------------- = -------------
10 10

= $ 1900

Esto estara indicando que el sueldo promedio de los empleados de la empresa es de


$1900, cifra esta que de ninguna manera representa la realidad.

Recordar

MEDIA Cantidad de elementos


Poblacin N
Muestra x n

2.4. MEDIANA

Se define como Mediana de una distribucin, al valor que ocupa el punto medio de la
distribucin
Ocupar el punto medio de la distribucin implica que la mediana deja a la izquierda la
misma cantidad de valores que a la derecha. Todos los valores que se encuentran a la
izquierda son menores o eventualmente iguales a l, mientras que los valores que se
ubican a la derecha sern mayores o eventualmente iguales a l.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -8-


Profesor: MARIO MARN
Continuando con el ejemplo referido a las temperaturas en una localidad del Sur:

-3 -2 -2 -2 -2 -1 -1 0 0 1 1
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11

Me = x6 = -1

Teniendo presente que el nmero de observaciones n = 11 el valor que ocupa el


lugar central de la distribucin corresponder a x 6 y por lo tanto la mediana toma el
valor de -1.
Cuando el nmero de componentes de la distribucin es impar, la mediana est
perfectamente definida, pero para el caso de que n sea par, no se tiene un nico valor
central, en este caso la mediana estar dada por el promedio de los dos valores
centrales. Suponiendo que se le quitara el ltimo valor a la distribucin de
temperaturas que estamos analizando, el nmero de observaciones n = 10 y los dos
valores centrales seran x5 y x6.

-3 -2 -2 -2 -2 -1 -1 0 0 1
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

x5 + x 6
Se tendra en este caso que Me = -------------
2

Podemos generalizar el valor de la mediana para una distribucin de n valores


teniendo en cuenta que el nmero de observaciones sea par o impar:

Si n es impar Me = x i donde i = (n+1)/2

Mediana x(n/2) + x(n/2 +1)


Si n es par Me = ------------------
2

Para determinar el valor de la mediana de una serie simple o distribucin de


frecuencia es necesario tener en cuenta el nmero de observaciones, si n es impar, la
mediana pertenece a la distribucin y est dada por el valor que ocupa el punto
central de la misma. En el caso de que n sea impar, el valor de la mediana est dado
por el promedio de los dos valores centrales, esto implica que puede pertenecer a la
distribucin solo en el caso de que los valores centrales sean iguales:

a) 4 6 6 8 Me = 6
b) 2 10 18 20 Me = 14

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -9-


Profesor: MARIO MARN
c) 4,3 5,8 6,2 7,2 8,5 9,6 Me = 6,7
d) 2 3 3 6 9 Me = 3
e) 3,5 4,7 6,8 7,3 9,6 10 12,5 Me = 7,3

Observe el lector que a diferencia de la media o promedio la cual se ve influenciada


por los valores extremos, segn ya vimos, no ocurre lo mismo con la mediana la cual
se presenta como insensible a los valores extremos y por lo tanto describe con mayor
exactitud las distribuciones en donde los valores extremos son sensibles .Son ejemplo
de este tipo de distribuciones:

a) los ingresos personales


b) Las retribuciones generales en una empresa
c) Gastos domsticos
d) Ingresos netos por hogar, etc.

No obstante todo esto las propiedades que presenta la media y que veremos
ms adelante la hace ms atractiva para su utilizacin.

2.5. MODA

Se define como Moda de una distribucin al valor que ms veces se repite.


En nuestro caso -2 se repite en cuatro oportunidades y por lo tanto ste valor se
constituye en moda de la distribucin.

Mo = -2

Con respecto a este valor es necesario aclarar que si en una distribucin se tiene ms
de un valor con el mismo mximo de repeticiones, cada uno de ellos se constituir en
una nueva moda, es decir que una distribucin puede tener ms de una moda. En
caso de tener dos modas se la denomina bimodal y en caso de tres trimodal, etc.
As mismo si se presentare el caso en que todos los valores de la distribucin tienen
el mismo nmero de repeticiones, diremos que dicha distribucin no tiene moda.

FRECUENCIA

Dada una distribucin se define como Frecuencia de un valor, al nmero de veces que
el mismo se repite.

Ejemplo:
En la distribucin correspondiente a las temperaturas mnimos tomadas en una
localidad del Sur del Pas durante los ltimos 10 das, defina para cada valor su
frecuencia:
-2 -2 -4 -1 -1 -1 0 -3 -2 -1

para -4 su f = 1
-3 su f = 1
-2 su f = 3
-1 su f = 4
0 su f = 1

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 10 -


Profesor: MARIO MARN
f = 10

Tenga en cuenta que la suma de todas las frecuencias es igual al nmero total de
observaciones.

2.6. DISTRIBUCIN DE FRECUENCIA

En la mayora de los casos nos encontraremos con una cantidad de observaciones n


que superan los 20, por lo tanto pretender operar con una serie simple se tornara
engorroso, en estos casos ser conveniente seleccionar los valores de acuerdo a una
determinada clase y determinar de cada una de ellas su frecuencia, de all que es
comn encontrar a este tipo de distribucin como Distribucin de intervalos, a los
efectos de facilitar el aprendizaje del alumno subdividiremos este tipo de distribucin
en dos grupos:

1) cuando la amplitud de intervalo es igual a 1


2) cuando la amplitud del intervalo de clase toma un valor mayor a 1

Caso a analizar
Supongamos tener que estudiar el nmero de accidentes que se producen en una
playa de estacionamiento durante los ltimos 50 das. Los datos relevados son los
siguientes

5 6 4 4 4 3 2 7 5 4 4 1
0 4 2 1 3 2 2 0 1 4 4 7
4 3 2 1 4 2 5 4 3 5 6 7
4 4 5 2 3 6 4 3 1 3 4 4
5 6

Es observable que trabajar con todos los valores como lo presenta la serie simple
sera por dems engorroso si no se dispusiera de una computadora, pero si
clasificamos los valores, en este caso de acuerdo a su valor numrico y para cada
uno de ellos determinamos su frecuencia, podramos confeccionar una tabla de las
siguientes caractersticas:

Tabla 1.1
Clase xi fi
1 0 2
2 1 5
3 2 7
4 3 8
5 4 16
6 5 5
7 6 4
8 7 3

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 11 -


Profesor: MARIO MARN
f i =i 50

Si ahora analizamos la tabla de esta manera, se simplifica enormemente la


determinacin de la media ya que en lugar de efectuar la suma de todas las
observaciones, efectuaremos el producto de cada valor por su frecuencia y la suma de
estos productos lo dividiremos por el nmero total de observaciones.

( Xi . fi )
1
8
x =
fi
1

Nota: Debemos tener presente que estamos frente a una muestra


A los efectos de facilitar los clculos, generemos en la tabla una nueva columna
conteniendo los productos de xi * fi.

Tabla 1.2
Clase xi fi xi * fi
1 0 2 0
2 1 5 5
3 2 7 14
4 3 8 24
5 4 16 64
6 5 5 25
7 6 4 24
8 7 3 21
50 177

De esta manera podemos calcular la media como:


n

( xi. fi )
i =1
x= = 177 / 50 = 3,54
n
El valor de la media o promedio de la distribucin es de

x = 3, 54

2.7. FRECUENCIA RELATIVA

Definicin: Se define como frecuencia relativa de un valor y se expresa como fri, al


cociente entre su frecuencia y la suma de todas las frecuencias (la suma de todas las
frecuencias es igual al nmero de elementos de la distribucin).
fi
fri =
f
=
i

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 12 -


Profesor: MARIO MARN
fi = n por lo tanto tambin se puede expresar

fi
fr i = ---------
n
Podemos ampliar la tabla de frecuencias con una nueva columna que contenga la fr de
cada clase:

Tabla 1-3

Clase xi fi xi * fi fri
1 0 2 0 0,04
2 1 5 5 0,1
3 2 7 14 0,14
4 3 8 24 0,16
5 4 16 64 0,32
6 5 5 25 0,1
7 6 4 24 0,08
8 7 3 21 0,06
50 177 1

Propiedad:
La sumas de todas las frecuencias relativas correspondientes a los valores
clases de una distribucin es igual a 12:

fri = fr1 + fr2 + fr3 . . . . . . . . + fr n

Tener en cuenta:

El concepto de frecuencia relativa, la media de una distribucin poblacional tambin se


puede expresar como:

(xi. fi)
= -------------- = (xi. fi/fi) es decir
fi

2
Demostracin
fri = fr1 + fr2 + fr3 . . . . . . . . + fr n

f1 f2 f3 fn fi
= --- + --- + ---- + + --- = ------- = 1
fi fi fi fi fi

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 13 -


Profesor: MARIO MARN
= (xi. fri)

2.8 FRECUENCIA ACUMULADA

Se define como frecuencia acumulada de una clase (por ejemplo i) y se la denota


como fai, a la suma de su frecuencia y la suma de las frecuencias de los valores que
le anteceden.

Analicemos la tabla 1.3 de la pgina anterior,(corresponda al nmero de accidentes


que se produjeron durante los ltimos 50 das en una playa de estacionamiento),
teniendo en cuenta la definicin de frecuencia acumulada tendremos:

Tabla 1.4
Clase xi fi xi * fi fri fai
1 0 2 0 0,04 2
2 1 5 5 0,1 7
3 2 7 14 0,14 14
4 3 8 24 0,16 22
5 4 16 64 0,32 38
6 5 5 25 0,1 43
7 6 4 24 0,08 47
8 7 3 21 0,06 50
50 177 1

Cules son las bondades que nos brinda la frecuencia acumulada:


a) Nos indica con su lectura el nmero de valores pertenecientes a la distribucin
que se ubican a la izquierda de cada uno de ellos. Si se quiere saber cuntos
das se registraron menos de 2 accidentes, se tendr la frecuencia acumulada
del 1, es decir 7, lo que implica que de los 50 das analizados solo en 7 de ellos
se tuvieron menos de dos accidentes diarios, pero con valores menores o iguales
a 2 se tuvieron 14, quiere decir que, de los 50 das, en 14 de ellos se tuvieron 2 o
menos de 2 accidentes diarios, este anlisis indica tambin que, del total de das
analizados, 7 de ellos tuvieron exactamente 2 accidentes diarios.
b) Ms adelante cuando efectuemos su graficacin Ud. podr visualizar con mayor
claridad esta propiedad.
c) Tambin nos permite determinar rpidamente el valor de la mediana. Analizando
nuestro caso, el nmero de observaciones es par, por lo que la mediana ser el
promedio de los dos valores centrales, el x n/2 y el x (n/2 + 1). . Para determinar el
valor que ocupa la posicin n/2 (en este caso 50/2 =25, el x 25, nos ubicamos en la
columna correspondiente a frecuencia acumuladas y determinamos a cul de las
clases le corresponde la menor frecuencia acumulada que contiene a n/2, en
este caso le corresponde a la quinta clase, cuyo valor es el 4, desde la x 23 ,
hasta la x38 le corresponden 4, por lo tanto la Me = 4

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 14 -


Profesor: MARIO MARN
2.9 FRECUENCIA DESACUMULADA

Se define como frecuencia desacumulada de un valor, fds de una distribucin, a la


diferencia entre el nmero total de observaciones y su frecuencia acumulada.

Es decir que para un valor cualquiera se verifica que:


fdsi = n - fai

Analicemos la Tabla 1.5 a la cual se le creo una nueva columna conteniendo la


frecuencia desacumulada, aplicando su definicin

Tabla 1.5
Clase xi fi xi * fi fri fai fds
1 0 2 0 0,04 2 48
2 1 5 5 0,1 7 43
3 2 7 14 0,14 14 36
4 3 8 24 0,16 22 28
5 4 16 64 0,32 38 12
6 5 5 25 0,1 43 7
7 6 4 24 0,08 47 3
8 7 3 21 0,06 50 0
50 177 1

De la definicin se desprende que:


fai + fdsi = n
Bien podemos decir que la frecuencia desacumulada es el complemento a n de la
acumulada, es decir que para cada uno de los valores nos indica cuantos tenemos a la
derecha de l. La frecuencia desacumulada del valor de x=2, nos indica que la
distribucin posee 36 observaciones mayores que ese valor. Tambin podramos
valernos de este parmetro para la determinacin de la mediana, dejamos para que
Ud. efecte el anlisis correspondiente a esa situacin Analizaremos ms adelante el
diagrama representativo de ambas frecuencias correspondientes a una distribucin

DISTRIBUCIN DE FRECUENCIAS PARA DATOS NOMINALES

Consideremos las ventas de los distintos tipos de sabor de gaseosas realizadas en el


Bar de una Universidad durante un da de concurrencia normal del alumnado.
Colas 55
Naranja 63
Limn 72
Tnicas 44
Agua c/gas 15
Agua s/gas 18
Jugos 33

En este caso no tiene sentido determinar el valor de la media de la distribucin,


tngase en cuenta que las clases estn dadas por los distintos tipos de bebidas, luego
tiene sentido decir que la ms vendidas son las bebidas de limn, siguindole en

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 15 -


Profesor: MARIO MARN
importancia las de naranja, es decir el valor de tendencia central que utilizaremos en
casos como estos le corresponde a la Moda. S sera conveniente generar una tabla
de frecuencias y determinar los porcentajes de cada uno de los sabores.

Tabla 1.6

xi fi fri fi%
Agua c/gas 15 0,05 5
Agua s/gas 18 0,06 6
Jugos 33 0,11 11
Tnicas 44 0,1467 14,67
Colas 55 0,1833 18,33
Naranjas 63 0,21 21
Limn 72 0,24 24
fi = 300 fi% = 100

3-0 DIAGRAMAS
El poder graficar los valores estadsticos nos permite realizar una lectura rpida de la
distribucin y sacar conclusiones inmediatas de la misma.
Sera suficiente abrir una hoja de clculo para observar la cantidad variada de grficos
con que puede ser representada una distribucin: Diagramas de: Lneas, Barras,
Barras acumuladas, de Sectores o circular, Diagramas x-y, de Bastones etc. En este
texto haremos referencia a los diagramas: Circular, de Bastones e Histogramas y a
una combinacin de los grficos de Bastones, Barras y x-y Dispersin.

Ejercicio
Supongamos tener para analizar las notas obtenidas por 20 alumnos de una divisin
en la asignatura de Estadstica:

9 7 6 6 6 5 3 4 5 5 8
7 8 7 7 6 5 6 4 10
Generaremos una distribucin de frecuencias complementndola con: Frecuencias
relativas, Frecuencia acumulada y por ltimo Frecuencia desacumulada.

Tabla 1.7
Xi fi fr i fa fds
3 1 0,05 1 19
4 2 0,1 3 17
5 4 0,2 7 13
6 5 0,25 12 8
7 4 0,2 16 4
8 2 0,1 18 2
9 1 0,05 19 1
10 1 0,05 20 0

20 1

Toda vez que se presenta una tabla tal como la 3.1, la primera pregunta que surge es,
que se debe graficar debe de tenerse siempre en cuenta que cada vez que se

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 16 -


Profesor: MARIO MARN
habla de graficar estamos deseando volcar en forma grfica una cierta relacin. En la
presente situacin, la variable en estudio es la calificacin, por lo cual se podra
graficar la relacin:
Calificacin y frecuencia Calificacin y
frecuencia relativa Calificacin y
frecuencia acumulada Calificacin y
frecuencia desacumulada

3.1 Diagrama de bastones:

Llevaremos en el eje de las abscisas las calificaciones y en el eje de las ordenadas las
frecuencias y representamos mediante un segmento centrado en cada una de las
calificaciones su correspondiente frecuencia; tendremos nuestro primer diagrama.
Cada uno de los bastones corresponde a la frecuencia de cada calificacin y toma el
nombre de densidad de frecuencia entendindose como tal al cociente:
fi
dfi = ---- es decir frecuencia por unidad de intervalo de clase
x
Grfico 1.1

Diagrama de Bastones

5
Frecuencia

0
3 4 5 6 7 8 9 10
Calificaciones

3.2 DIAGRAMA DE SECTORES

Para este grfico debemos tener presente que el ngulo central del crculo es de 360
y que cada una de las clases estar dada por un sector cuyo ngulo ser proporcional
a su frecuencia:

Supongamos la calificacin de 3 cuya frecuencia es 1 tendremos que:


20 (suma de todas las frecuencias) ------------------------ 360
a 1 (frecuencia del 3) ----------------------- 1 = 360. 1 / 20 = 18

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 17 -


Profesor: MARIO MARN
Analicemos la calificacin del 4 cuya frecuencia es 2:

Si a 20 (frecuencia total) ---------------------------- 360


A 2 (frecuencia del 4) ---------------------------- 2 = 360. 2 /20 = 36

Repitamos el procedimiento para el 5 el cual tiene frecuencia 4


Si a 20 le corresponde ----------------------------360
A 4 ---------------------------- 4 = 360. 4/20 = 72

Debe tenerse en cuenta que en todos los casos la operacin que nos permite
determinar el ngulo de cada sector est dado por el producto entre 360 y el cociente
de la frecuencia de la calificacin en estudio y la suma de todas las frecuencias (N),
cociente ste que segn ya vimos corresponde a la frecuencia relativa (fri = f / N), es
decir que el ngulo correspondiente a un determinado sector est dado por el producto
entre 360 y su frecuencia relativa:

i = 360. fri

Grfico 1.2

Diagrama de Sectores
10 3
9
4
8

En realidad es ms interesante plantear este mismo diagrama pero expresado en


porcentajes, para lo cual el anlisis es muy similar al anterior. Al total de
observaciones, 20 en este caso, le corresponder el 100% y por lo tanto para
cualquiera de las observaciones con frecuencia fi le corresponde ser:
Si a 20 --------------------------- 100%
fi --------------------------- %i = 100. fi / 20
Nuevamente nos encontramos con que el porcentaje correspondiente a cada una de
las calificaciones estar dado por el producto entre 100 y la frecuencia relativa
correspondiente a cada una de ellas. El grfico tiene la misma estructura anterior.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 18 -


Profesor: MARIO MARN
Grfico 1.3

Diagrama de Sectores Calificaciones


en porcentajes
10 3
9 5% 5% 4
5%
10%
8
10%

5
20%
7
20%

6
25%

3.2-HISTOGRAMA DE FRECUENCIAS:

ste es otro de los diagramas de gran utilizacin para el cual es necesario considerar
un sistema de ejes cartesianos ortogonales, debiendo representar en el eje de las
abscisas las calificaciones y en el de las ordenadas la frecuencia, las clases estn
dadas por las calificaciones. El intervalo entre dos clases sucesivas se denomina
amplitud de intervalo, en este caso es la unidad y se la expresa como x = 1. Si
consideramos el diagrama de bastones y a partir del extremo inferior de cada uno de
ellos llevamos tanto a izquierda como a derecha la mitad del intervalo, en nuestro
caso 1 / 2 = 0,5 y levantamos las ordenadas correspondientes, nos encontramos con
un diagrama de barras sin discontinuidades al que denominaremos Histograma, en
este caso de Histograma de Frecuencias.

Grfico 1.4

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 19 -


Profesor: MARIO MARN
Histograma de Frecuencias

6
5
Frecuencia
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 11
Calificaciones

La superficie encerrada por cada una de las barras est dada por el producto entre la
base x por la altura que segn ya vimos estaba dada por la densidad de frecuencia.

dfi = fi /x por lo tanto:

Si = x. dfi = x. fi / x = fi

Cada una de ellas tendr un valor igual a su frecuencia y el rea total del diagrama
ser entonces la suma de todas las frecuencias e igual a N.

Si = fi = N

3.4 - POLGONO DE FRECUENCIAS

Si se unen los puntos medios superiores de cada una de las barras del histograma y
se considera cero las frecuencias de las clases adyacentes a los extremos de la
distribucin, se formar con el eje de las abscisas un polgono denominado, en este
caso, como Polgono de Frecuencias:

Grfico 1.5. Polgono de frecuencias

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 20 -


Profesor: MARIO MARN
6

3
fi

0
2 3 4 5 6 7 8 9 10 11
xi

El rea encerrada por el polgono de frecuencias es igual al rea encerrada por el


histograma de frecuencias.
Consideremos la barra del histograma correspondiente al valor de la variable x = 6.
Observamos que mientras que la superficie del tringulo superior de la barra que
pertenece al histograma no pertenece al polgono, la superficie del tringulo inferior no
perteneciente al histograma si pertenece ahora al polgono, como las superficies de
ambos tringulos son iguales3, lo son tambin las superficies del polgono y del
histograma de frecuencias.

3.5 - HISTOGRAMA DE FRECUENCIAS RELATIVAS


Si en el eje de ordenadas se representan a las frecuencia relativas en lugar de las
frecuencias, se obtiene el Histograma de Frecuencias Relativas que tendr las
mismas caractersticas que el diagrama de frecuencias ya que fr i = fi / N, es decir que
se divide a los valores de la ordenada por un valor constante N y por lo tanto
grficamente representa un cambio de escalas.
En este caso la altura de cada barra esta dada por la densidad de frecuencia relativa

dfri = fri / x
Y por lo tanto al igual que en el diagrama anterior, la superficie encerrada por cada
una de las barras del Histograma ser igual a su frecuencia relativa:
Si = x. fri / x = fri
De tal manera que el rea encerrada por el Histograma de frecuencias relativas ser
ahora igual a la suma de todas las frecuencias relativas y por tal razn igual a 1:

Si = fri = 1

Grfico 1.6

3
Dos tringulos rectngulos en A y A con los ngulos y iguales por opuestos por el vrtice, y
alternos internos entre paralelas y el lado 11 = 22= x / 2 por lo tanto son iguales.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 21 -


Profesor: MARIO MARN
Histograma de Frecuencia Relativas

0,3

0,25

0,2
fr

0,15

0,1

0,05

0
2 3 4 5 6 7 8 9 10 11
x

3.6 POLGONO DE FRECUENCIAS RELATIVAS

De la misma manera en que definimos al polgono de frecuencias, se define tambin al


polgono de frecuencias relativas. Tanto la superficie encerrada por el polgono de
frecuencias relativas como el del Histograma de esas mismas frecuencias son iguales
a 1.

Grfico 1.7

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 22 -


Profesor: MARIO MARN
Histograma y Polgono de Frecuencias Relativas

0,3

0,25

0,2

0,15

0,1

0,05

0
2 3 4 5 6 7 8 9 10 11

3.7 FRECUENCIA ACUMULADA

Supongamos analizar el nmero de accidentes de trabajo que se producen


diariamente en una empresa metalrgica local, para lo cual se han considerado los
detectados durante los ltimos veinte das.
5 4 6 3 4 5 3 7 3 4 2 0
2 1 3 4 2 5 6 1

Confeccionaremos una tabla de frecuencias:

Tabla 1.8
xi fi fai
0 1 1
1 2 3
2 3 6
3 4 10
4 4 14
5 3 17
6 2 19
7 1 20
fi = 20

Para confeccionar el grfico de frecuencias acumuladas llevaremos sobre el eje de las


abscisas los valores observados y en el eje de las ordenadas las frecuencias
acumuladas.
Para el primer valor de la distribucin cero, la frecuencia acumulada vale 1, este valor
se mantendr constante hasta 1 en donde la frecuencia acumulada toma el valor de 3,
se mantiene constante hasta el valor observado de 2 en donde la fa adopta el valor de

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 23 -


Profesor: MARIO MARN
6 y as sucesivamente hasta el valor de 7 en donde fa toma el valor de 20 y se
mantiene constante con este valor. Siga esto en el grfico 1.8.

Grfico 1.8

FRECUENCIA ACUMULADA
Frecuencia acumulada

22
20
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9
OBSERVACIONES

Observe el lector con que claridad este diagrama le entrega informacin. Por ejemplo
analizando la observacin 4, el punto inferior de la barra indica que menores a 4
accidentes diarios se han producido en 10 oportunidades mientras que el punto
superior indica que en 14 oportunidades se han producido 4 o menos accidentes
diarios. De igual manera en 17 oportunidades se produjeron menos de 6 accidentes en
un da y que en solo 2 oportunidades se produjeron 6 accidentes.
De igual manera podemos graficar la frecuencia desacumulada conjuntamente con la
acumulada tal como lo muestra el Grfico 1.8 denominado comnmente como grfico
de escalones. Debe tenerse en cuenta que para cualquier valor observado la suma de
la frecuencia acumulada y la desacumulada es igual al nmero total de observaciones.

fa + fds = n

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 24 -


Profesor: MARIO MARN
Grfico 1.9

22
20
18
16
Frecuencia

14 Frecuencia acumulada
12
10 Frecuencia
8 desacumulada
6
4
2
0
0 1 2 3 4 5 6 7 8 9
Observaciones

La interseccin de ambas grficas debe de verificarse para fa = fds = n/2.


En el punto de interseccin ambas frecuencias son iguales por lo que podemos decir
que:
fa + fds = fa + fa = n
por lo que
2 fa = n
y
fa = n / 2

RELACIN ENTRE MEDIA, MEDIANA Y MODA

Cuando nos referimos al histograma de frecuencias relativas decamos que el rea


encerrada por cada una de las barras nos entregaba el valor de la frecuencia relativa
del valor correspondiente a dicha barra... Si este concepto lo extendemos a toda la
distribucin podemos asegurar que considerando un determinado intervalo de las
observaciones el rea encerrada por el histograma en dicho intervalo ser igual a su
frecuencia relativa, valor que segn ya vimos multiplicada por 100 nos entrega el
porcentaje de observaciones comprendidas en ese intervalo. Adems demostramos
que la superficie encerrada por el histograma de frecuencias relativas era igual a la
superficie del polgono de fr. Simplificando, el rea encerrada por el polgono de
frecuencias relativa es igual a 1 y esto implica tambin que encierra el 100% de las
observaciones.

Analicemos las distribuciones correspondientes a las calificaciones obtenidas por tres


divisiones que denominaremos como A, B y C en la asignatura de Estadstica:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 25 -


Profesor: MARIO MARN
Tabla 1.9
A B C
xi fi fi fi
1 6 0 0
2 8 1 0
3 5 2 1
4 4 4 1
5 3 5 2
6 2 6 4
7 1 5 5
8 1 4 7
9 0 2 5
10 0 1 2
30 30 27

Las tres distribuciones tienen caractersticas distintas, veamos:

A) =. (xi.fi) / N = 3,1667

Me = (x15 + x16) / 2 = 3

Mo = 2

B) =. (xi.fi) / N = 6

Me = x16 = 6

Mo = 6
C) = (xi.fi) / N = 7,296

Me = x14 = 8

Mo = 8

Si graficamos los histogramas y polgonos de las frecuencias relativas de cada una de


las distribuciones relativas suavizando convenientemente los lados del polgono, nos
encontraremos con los siguientes grficos:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 26 -


Profesor: MARIO MARN
Grfico 1.10 (Divisin A)
Histograma y polgono de frecuencias
relativas

0,3
0,25
0,2
Frecuencia

0,15
relativa

0,1
0,05
0
1 2 3 4 5 6 7 8 9 10
Observaciones

Grafico 1.11 (Divisin B)


Histograma y polgono de frecuencias
relativas

0,25

0,2

0,15

0,1

0,05

0
1 2 3 4 5 6 7 8 9 10 11
Observaciones

Grafico 1.12 (Divisin C)


Histograma y polgono de frecuencias
relativas

0,3
0,25
0,2
0,15
0,1
0,05
0
1 2 3 4 5 6 7 8 9 10 11
Observaciones

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 27 -


Profesor: MARIO MARN
En el caso de la divisin B se observa una cierta simetra respecto a un eje vertical
coincidente con la mediana la moda y la media, decimos entonces que la distribucin
es del tipo Normal, y que en ese caso coinciden los tres valores ; Me y Mo.
En el A la distribucin se presenta en forma asimtrica y en este caso decimos que
corresponde a una asimtrica derecha asignndosele un signo positivo. A su vez, la
observacin de mayor ordenada le corresponder a la moda y la media tendr que
dividir al rea total en dos reas iguales, de acuerdo a su grfica y a sus valores se
observa que la media tiene un valor mayor a la mediana y que a su vez sta se ubica
entre la media y la moda.
Al analizar la ltima distribucin C observamos que la misma es asimtrica, tiene sesgo
izquierdo y se le asigna signo negativo. Nuevamente la moda queda definida por
correspndele a la abscisa de mayor ordenada, la mediana Me si bien en este caso
coincidira con el valor de la moda, la media se ubica a la izquierda de la moda, no
olvidemos que la distribucin pivotea en ese punto. La mediana se ubica en general
entre la media y la moda aunque en este caso por tratar con variable discreta, la Me
coincide con la Mo.
En toda distribucin sesgada ya sea a la derecha o a la izquierda, el segmento
comprendido por la media y la mediana es aproximadamente un tercio del segmento
comprendida entre la media y la moda.

Una distribucin puede ser:

Simtrica = Me = Mo

Distribucin Derecha < Me < = Mo


Asimtrica
Izquierda > Me > = Mo

3.2 DISTRIBUCIN DE INTERVALOS DE CLASE


En una unidad militar de entrenamiento para futuros oficiales, se han determinado los
tiempos que tardan los integrantes de un pelotn en cruzar la pista de combate. Estos
valores expresados en minutos son los siguientes:
3,1 3,4 3,6 3,6 3,6 3,7 3,7 3,8 3,8 3,9 3,9
4 4 4,1 4,2 4,2 4,3 4,3 4, 4,5 4,6

El jefe de pelotn necesita realizar un estudio estadstico sobre estos tiempos a los
efectos de determinar:
a- Qu proporcin de hombres tardan menos de 3,5 en cruzar la pista de
combate
b- Qu proporcin de los hombres del pelotn tardan menos de 4 en cruzar la
pista

En casos como el presentado, donde el nmero de observaciones es mayor a 20 y la


variable en estudio es del tipo continua, se hace necesario definir como clases a
intervalos y determinar como frecuencia de cada uno de ellos al nmero de
observaciones que contienen. En este caso la distribucin toma el nombre de
distribucin de intervalos de clase.
Para generar una distribucin de intervalos de clase debe tener en cuenta:
a) La cantidad de intervalos: La determinacin del nmero de intervalos, a los que
llamaremos como k est relacionada con el nmero de observaciones n.
Mientras que algunos operadores definen:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 28 -


Profesor: MARIO MARN
k= n
Otros deciden optar por la expresin:

k = 1+ log2(n)

Pero en general se puede definir el valor de k teniendo en cuenta que:

5 <= k <= 15
Es decir que el nmero de intervalos debe estar comprendido entre 5 y 15. Una
cantidad menor de intervalos da lugar a una distribucin con informacin insuficiente.
Por otro lado una cantidad mayor a 15 intervalos genera una distribucin que resulta
engorroso operar.
Para el caso que tenemos en estudio y teniendo en cuenta que n = 21, la raz
cuadrada de 21 es de 4,58 y considerando la ltima condicin, adoptaremos para k el
valor de 5, k = 5.

b) La amplitud de intervalo x para la cual adoptaremos la expresin:

xN x1
x =
k
Para nuestro caso:

4,6 3,1
x = = 0,3
5

c) No puede haber un intervalo con frecuencia cero, si esa situacin se


presentare, ser necesario modificar la cantidad de intervalos o la amplitud de
intervalo.

d) Al definir los lmites de los intervalos debe tenerse en cuenta la posibilidad


que uno de ellos puede ser cerrado y el otro abierto:

e) Es conveniente que todos los intervalos tengan el mismo tamao y cuando


esto no sea posible, los intervalos de diferente amplitud deben ubicarse en los
extremos

f) No es conveniente que las observaciones coincidan con los lmites de los


intervalos, de esta manera desaparece la duda en cuanto a la pertenencia de una
observacin a un intervalo o a su adyacente.
En este caso particular, teniendo en cuenta que todas las observaciones tienen un
solo decimal, y que el menor es 3,1, adoptaremos como inicio de la distribucin el
valor de 3,09, de esta manera nos aseguramos que la primera observacin quede
contenida en el primer intervalo, y adems como la amplitud de intervalo es de 0,3, en
ningn caso una observacin coincidir con los lmites.

3,09 3,39 3,69 3,99 4,29 4,6


[`---------------)[--------------)[-----------------)[-----------------)[--------------------]

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 29 -


Profesor: MARIO MARN
Podemos ahora confeccionar la tabla de distribucin de intervalos de clase, teniendo
en cuenta que, a los efectos de referenciar a cada intervalo, definiremos al punto
medio de cada uno de ellos como el valor representativo e igual a la semisuma de sus
lmites, toma el nombre de marca de clase y se lo denota como x mi.

3,09 3,39 3,69 3,99 4,29 4,6


[`---------------)[--------------)[-----------------)[-----------------)[-------------------]

3,24 3,54 3,84 3,14 3,44

3.2 DETERMINACIN DE LA MEDIA

Para determinar la media de la distribucin consideramos que todos los valores


pertenecientes a cada intervalo estn uniformemente distribuidos en dicho intervalo,
de esta manera la suma de todos ellos estar dada por el producto entre la marca de
clase por la frecuencia de ese intervalo.

=
(x mi
* fi )
N
Para su determinacin creamos una nueva columna conteniendo los productos de
xmi*fi:

Tabla 1.10
Li ls fi xmi xmi * fi
3,09 3,39 1 3,24 3,24
3,39 3,69 4 3,54 14,16
3,69 3,99 6 3,84 23,04
3,99 4,29 5 4,14 20,7
4,29 4,6 5 4,445 22,225
21 83,365

83,365
= = 3,9697
21

Esto nos indica que el tiempo promedio empleado por los integrantes del pelotn para
cruzar la pista de combate es de 3,9697

HISTOGRAMA DE FRECUENCIA
Para confeccionar el Histograma y Polgono de frecuencias debemos tener presente
que las frecuencias de los intervalos adyacentes a los extremos de nuestra distribucin
son nulas, adems se representa en el eje horizontal las marcas de clase.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 30 -


Profesor: MARIO MARN
Grfico 1.13

4
f

0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x

3.3 DETERMINACIN DE LA MEDIANA

La mediana tendr que estar ubicada en el intervalo cuya menor frecuencia


acumulada contiene a la observacin X (n/2), es por lo tanto conveniente determinar las
columnas que contengan a las frecuencias acumuladas y desacumuladas.

Tabla 1. 11
Li ls fi xmi Xmi * fi fai fdsi
2,79 3,09 0 2,94 0 0 21
3,09 3,39 1 3,24 3,24 1 20
3,39 3,69 4 3,54 14,16 5 16
3,69 3,99 6 3,84 23,04 11 10
3,99 4,29 5 4,14 20,7 16 5
4,29 4,6 5 4,445 22,225 21 0
4,6 4,39 0 4,74 0 21 0

De acuerdo a la tabla, la mediana se ubica en el intervalo [3,69 ; 3,99) al que


denominaremos intervalo medial, y para el cul la frecuencia acumulada es de 11 y
por lo tanto contiene a los valores correspondientes a x 10 y x11, pero faltara
determinar el valor que ms se aproxime al real.
Para la determinacin de la mediana en una distribucin de intervalos de clase
tendremos dos mtodos:

a) Mtodo grfico
Tracemos los diagramas correspondientes a la frecuencia acumulada:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 31 -


Profesor: MARIO MARN
Analizando dicho diagrama podemos observar que de los 21 integrantes del pelotn
solo 5 de ellos cruzan la pista en menos de 3,54, es decir que, mediante anlisis del
diagrama podemos reconstruir la tabla.

Grfico 1.14

25

20

15
fa

10

0
2,94 3,24 3,54 3,84 4,14 4,445 4,74
x

Combinemos en un mismo diagrama, las representaciones de frecuencia acumulada y


desacumulada. Este grfico toma el nombre de Ojiva.

Grfico 1.15

25

20

15
fa - fds

10

0
2 2,5 3 3,5 4 4,5 5
-5
x

Como ambas frecuencias se representan en el eje vertical, en el punto interseccin


ambas son iguales y como su suma

Fa + frds = N

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 32 -


Profesor: MARIO MARN
Debe verificarse que el valor de esas frecuencias, en ese punto es igual a N/2.
Como la mediana es el valor que ocupa el punto medio, la abscisa correspondiente al
punto interseccin tendr su valor. Por lo tanto las coordenadas del punto interseccin
sern (Me; n/2).

b) Mtodo Analtico

Analizaremos el intervalo medial:

Grfico 1.16

12
12

10
10

0
3,69
3,69 Me 3, 99
3,99

Li x Ls

Al iniciar el intervalo 3,69 su frecuencia acumulada tiene el valor de 5 (que


denominaremos frecuencia acumulada inferior y la denotaremos como fai). De la
misma manera al finalizar ese intervalo (x = 3,69) su frecuencia acumulada es de 11 (a
la denominaremos frecuencia acumulada superior y la denotaremos como fas). Esa
variacin de frecuencia acumulada de 5 a 11 es justamente la frecuencia
correspondiente al intervalo medial (fm = 6). Adems como el total de observaciones
es de 21, N/2 = 10,5.
Consideremos los tringulos 123 y 123 ambos rectngulos en 2 y 2 respectivamente.
Esos tringulos son semejantes y por lo tanto sus lados homlogos son
proporcionales.

23 1-2
---------- = -------------
2 3 1 2
Si reemplazamos tendremos:

fm x

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 33 -


Profesor: MARIO MARN
------ ------- = ---------
(N/2 fai) Me Li
Despejando Me tendremos:

x (N/2 fai)
Me = Li + -----------------
fm

En este caso particular, la Me = 3,69 + 0,3 *((10,5 - 5) / 6

Me = 3,965

3.4- DETERMINACIN DE LA MODA

Se define como intervalo modal al intervalo de mayor frecuencia, en este caso


corresponder a [3,69; 3,99) con frecuencia 6, coincide con el medial, pero bien podra
no coincidir, para la determinacin de la moda, consideremos en el histograma de
frecuencia, el intervalo modal y los intervalos adyacentes.

Grfico 1.17

4
f

0
3,54 3,84 4,14
x

Li Ls

Si definimos a d1 = (frecuencia del intervalo modal) (frecuencia del intervalo que le


antecede):
di = 6-4 = 2
Y como d2 = (frecuencia del intervalo modal) (menos la frecuencia del intervalo que
le sucede):
d2 = 6-5 = 1

Como li se define al inicio del intervalo modal (3,69), el valor de la moda de una
distribucin de intervalos de clase esta dada por la expresin:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 34 -


Profesor: MARIO MARN
Mo = Li + x. ( d1/(d1+d2) )

En este caso tendremos:


Mo = 3,69 + 0,3 (2 / (2+1)) = 3,89

Conclusiones:
En una distribucin de intervalos de clase, la moda se encuentra siempre ubicada en
el intervalo modal, pero desplazada hacia el intervalo adyacente de mayor frecuencia.
Los valores determinados para la media, mediana y moda, indican que la distribucin
tiene un leve sesgo derecho:

Media = 3,9697
Mediana Me = 3,965
Moda Mo = 3,89

> Me > Mo

4- VALORES DE DISPERSIN

Son suficientes los valores de posicin central para determinar las caractersticas de
una distribucin? Para responder a esta pregunta observemos la siguiente situacin:

Tenemos tres distribuciones que presenten la misma media, la misma moda y la


misma mediana pero no obstante ello las tres son distintas.

Pueden tenerse dos distribuciones mismo nmero de elementos o tambin


conformadas por los mismos elementos y no obstante ello ambas son distintas.

Tabla 1. 12

X1 F1 X2 F2
0 0 0 0
1 3 1 6
2 4 2 8
3 7 3 4
4 5 4 3
5 4 5 2
6 2 6 2
7 1 7 1
8 0 8 0
26 26

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 35 -


Profesor: MARIO MARN
Grfico 1.19

8
7
6
5
4
3
2
1
0
0 2 4 6 8 10

Grfico 1.20

9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9

Es necesario entonces considerar valores que nos determinen cuan dispersos estn.
Estos valores se denominan valores de dispersin:

4.1 RANGO O AMPLITUD

Definicin
La diferencia entre los valores extremos de una distribucin se denomina Alcance o
Rango y se lo denota como R

Si definimos a xn como el mayor valor observado y a x1 como el ms pequeo,


entonces:

R = xn x1

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 36 -


Profesor: MARIO MARN
Si bien, una vez ordenados todos los valores, el clculo de la amplitud o recorrido es
simple e inmediata, no nos brinda ninguna informacin sobre las caractersticas de los
valores intermedios. Veamos las siguientes distribuciones:

A) 0 1 1 2 4 6 8 10 12 14

B) 50 50,1 50,2 50,3 50,5 50,6 50,7 50,8 60 64

En la distribucin A
R = 14 0 = 14

En la distribucin B
R = 64 50 = 14

Ambas tienen el mismo nmero de elementos, el mismo alcance, no obstante ello son
distintas, es decir que el Rango o Amplitud de una distribucin nos entrega una
informacin limitada.

4.2 DESVO MEDIO


Para determinar el grado de dispersin de los valores de la distribucin, debemos
definir con respecto a qu punto de referencia se toman las distancias, el punto de
referencia ms utilizado es la media de la de la distribucin

Considerando el ejercicio de pgina 39 (Los tiempos que los integrantes de un


pelotn tardan en cruzar la pista de combate), la distribucin de intervalos la
representbamos como:

3,09 3,39 3,69 3,99 4,29 4,6


[`---------------)[--------------)[-----------------)[-----------------)[-------------------]
3,24 3,54 3,84 3,14 3,44

d1
= 3,9697
d2

En el primer intervalo se encuentra una sola observacin, la cual consideramos es


coincidente con la marca de clase, luego su distancia respecto a la media ser:

d1 = xm1 -

La dispersin de los valores ubicados en el segundo intervalo, en este caso son 4 y


habiendo considerado que los mismos se encuentran uniformemente distribuidos en
dicho intervalo, la dispersin respecto a la media estar dada por el producto de la
distancia de la marca de clase por el nmero de observaciones

d2 = xm2 -

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 37 -


Profesor: MARIO MARN
Podramos intentar considerar como un valor representativo de la dispersin de los
valores respecto a la media, al promedio de los desvos medios:

pdm =
(x mi ). fi
N

Pero nos encontramos con que la suma de todos los desvos es nula y siempre lo
sern por considerar como punto de referencia a la media. Todas las distancias de las
marcas de clase que se ubiquen a la izquierda de la media sern negativas, mientras
que las distancias de los que se ubiquen a la derecha sern positivas. El problema
radica en anular los signos negativos, para ello podemos:

a) considerar los desvos absolutos medios, de esta manera no se tendra ningn


desvo negativo y la suma de los desvos absolutos medios sera distinta de cero,
salvo el caso en que todas las observaciones sean iguales. La expresin matemtica
quedara como:

DM =
x mi
. fi
N

Esta expresin se define como Desvo medio (Promedio de los desvos absolutos
medios).

En nuestro caso en estudio conformaremos la tabla correspondiente a la distribucin


de intervalos pero incluiremos una nueva columna conteniendo los desvos absolutos
medias.

Tabla 1. 13

Li ls fi xmi Xmi * fi fai fdsi !xi - media!.fi


2,79 0 0 2,94 0 0 21 0,000
3,09 3,39 1 3,24 3,24 1 20 0,730
3,39 3,69 4 3,54 14,16 5 16 1,719
3,69 3,99 6 3,84 23,04 11 10 0,779
3,99 4,29 5 4,14 20,7 16 5 0,851
4,29 4,6 5 4,445 22,225 21 0 2,376
4,6 4,99 0 4,74 0 21 0 0,000
21 83,365 6,455

Aplicando la frmula correspondiente, el desvo medio ser:


6,455
DM = ------------------
21

DM = 0,3074

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 38 -


Profesor: MARIO MARN
4.3 VARIANZA
Otra forma de obtener todos los desvos positivos, sera elevndolos al cuadrado es
decir:

pdmc =
(xmi )2 .if
N
Esta expresin que definimos como: el promedio de los desvos cuadrticos medios y
se denomina Varianza.
Es conveniente entonces considerar una nueva columna conteniendo la suma de los
desvos cuadrticos medios tal como la tabla:

Tabla 1. 14
2
Li ls fi xmi Xmi * fi fai fdsi !xi -media!.fi (xi-media) .fi
2,79 0 0 2,94 0 0 21 0,000 0
3,09 3,39 1 3,24 3,24 1 20 0,730 0,53255244
3,39 3,69 4 3,54 14,16 5 16 1,719 0,73878118
3,69 3,99 6 3,84 23,04 11 10 0,779 0,10102891
3,99 4,29 5 4,14 20,7 16 5 0,851 0,14490505
4,29 4,6 5 4,445 22,225 21 0 2,376 1,12925624
4,6 4,99 0 4,74 0 21 0 0,000 0
21 83,365 6,455 2,647

Var(x) =2,647 / 21 = 0,126 minutos al cuadrado

Tambin se la denota como:

2 = 0,126 min utoscuadrados

4.4 DESVIACIN ESTANDAR

La Varianza es un valor que determina un cierto grado de dispersin, pero en relacin


a lo que nosotros buscbamos, nos encontramos con que no tenemos el promedio de
los desvos medios, si no que contamos con el promedio de los desvos cuadrticos
medios. Una aproximacin estara obteniendo la raz cuadrada de la varianza:

= ( xi ) 2
fi
N
O abreviando

= Var ( x) =

= 0,126 = 0,3549

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 39 -


Profesor: MARIO MARN
Definimos a la desviacin estndar como la raz cuadrada de la varianza y
prcticamente entrega el grado de dispersin de los valores de una distribucin con
respecto a la media.
Para dos distribuciones con la misma media, tendr ms dispersin aquella que tiene
una mayor desviacin estndar, tal como lo indica la grfica
Grfico 1.21
Frecuencia

Desvo estndar = 2
Desvo estndar =0,5
Desvo estndar =1

4.4 COEFICIENTE DE VARIACIN

En muchas oportunidades es conveniente comparar distribuciones de distinta media o


de distinto tipo, por ejemplo si analizamos alturas y peso de los alumnos de un curso
de una Universidad, los valores de posicin central y de dispersin de una de ellas
estarn dados en metros o centmetros, pero los de la otra sern en Kg. , luego en
principio sera incorrecto pretender comparar las dispersiones de esas distribuciones,
a fin de poder comparar se opera con el Coeficiente de Variacin, que est dado por el
cociente entre el desviacin estndar de la distribucin y su media, expresada de
manera porcentual:


CV = . 100%

Como tanto la desviacin estndar y la media tienen las mismas unidades, al dividirlas
se simplifican y nos queda un coeficiente, es adimensional. Por otra parte el CV
entrega la proporcin de la desviacin estndar respecto de la media. En el caso que
nos ocupa el:

0,3549
CV = .100 = 8,94
3,9697'

CV = 8,94%

Supongamos que se realiza el estudio de altura y peso de los alumnos de un curso, y


que los resultados arrojados son:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 40 -


Profesor: MARIO MARN
Desviacin estndar Media CV
Del Peso = 10Kg 71 k.o. 14,08%

Altura = 6cm 168 cm 3,57%

Estos ltimos valores del CV indican que, la distribucin correspondiente a la altura


tiene menos dispersin que la correspondiente a los pesos.

4.5 CUARTILES Y PERCENTILES

En muchas ocasiones es necesario contar con una subdivisin de los datos en


determinadas fracciones, llamados en de manera general como fractiles. De esta
manera una fraccin o proporcin de datos caen en un fractil o por debajo de ste. De
acuerdo al nmero de subdivisiones los fractiles toman un nombre determinado, as
estas pueden ser:
a) en 10 partes. En este caso cada una de esas partes toman el nombre de
decil
b) en cuatro partes: En ese caso cada una de ellas toma el nombre de cuartil
c) en cambio si la subdivisin es en 100 partes, se la denomina a cada una de
ella como centil.
El alcance interfractil, dada por la diferencia entre dos fractiles constituye una medida
de dispersin entre ellos.
En general los fractiles ms utilizados lo constituyen los cuartiles y percentiles.
Subdividir a los datos en cuatro fractiles implica que el 50% de los datos estn por
debajo del segundo cuartil y el 75% de las observaciones estn por debajo del tercer
cuartil, representados grficamente implica:

X1 Q1 Q2 Q3 Xn

Una cuarta parte de las observaciones se encuentran por debajo de Q1, como que
tambin estn por debajo de Q2. Entre Q3 y Q1 se concentra el 50% de las
observaciones. Es necesario aclarar que Q1 como Q2 y Q3 son los puntos fractiles,
por debajo de cada uno de ellos se encuentran los porcentajes los correspondientes
porcentajes de datos.
Cuando el nmero de valores no es lo suficientemente grande la determinacin exacta
de los cuartiles puede ser complicada, ya que es factible que el valor del cuartil quede
entre observaciones, de cualquier manera en general podemos decir que la
determinacin de cada cuartil quede satisfecha con las expresiones:
La determinacin de los cuartiles para datos no agrupados est dada por las expresiones:

Q1 = X (1 / 4 N +1 / 4)
Q2 = X (1 / 2 N +1 / 2)
Q3 = X (3 / 4 N +1 / 4)

Observe que el valor del segundo cuartil corresponde al valor de la mediana. Si


recordamos que, el rea encerrada por el polgono de frecuencias era igual al nmero

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 41 -


Profesor: MARIO MARN
de observaciones, sera lgico suponer entonces que en un diagrama correspondiente
al polgono de frecuencias suavizado, las superficies encerradas por dicho diagrama
sern proporcionales al nmero de observaciones correspondientes a la misma. Con
este concepto definimos los cuartiles grficamente segn grfico 1.22.

Grfico 1.22

Q1 Q2 Q3

Se define como Rango Intercuartil o propagacin media a la diferencia:


R I = Q3 Q1

Percentiles: De la misma manera en que la distribucin en estudio la podemos dividir


en cuatro partes, en el caso de hacerlo en 100 cada una de ellos tomar el nombre de
percentil, un percentil z cualquiera es un valor tal que z por ciento de las
observaciones quedan a su izquierda mientras que (100 - z) porcientos de los
valores quedan a su derecha. El percentil 80 est dejando a su izquierda el 80% de los
valores de la distribucin, es decir todos aquellos menores a l, y por lo tanto el 20%
de la distribucin lo superan, es decir quedan a su derecha.
Grfico 1.23
fdp

xi
80

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 42 -


Profesor: MARIO MARN
4.6 REGLA EMPRICA

Segn vimos en el punto anterior, dada una distribucin, el valor de su desviacin


estndar nos indica el grado de dispersin de sus valores con respecto a la media,
pero es en realidad la Regla Emprica, quien relaciona a los dos parmetros : y con
el siguiente enunciado:
En el intervalo centrado en la media y tal que su origen izquierdo est dado por la
media menos un desviacin estndar y el derecho por la media ms un desviacin
estndar, se agrupa el 68 % de los valores de la distribucin; En el intervalo
comprendido por la media menos dos desviaciones estndar y ms dos desviaciones
se ubica el 95% de los valores de la distribucin, por ltimo en el intervalo
comprendido por la media menos tres desviaciones estndar y la media ms tres
desvos estndar se tendr el 99,7% de N (suele considerarse en muchas
oportunidades en este intervalo el 100% de N).
Debe de tener en cuenta que, entre el inicio de la grfica y su fin, se encuentran
ubicados todos los valores de la distribucin N.

Grfico 1.24

fdp

- 3 - 2 -1 +1 +2 +3 xi

68% N

95%N

99,72% N

Resumen Regla Emprica

( 1) se tiene el 68% de N
( 2) se tiene el 95% de N
( 3) se concentra el 100% de N

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 43 -


Profesor: MARIO MARN
MDULO 2: PROBABILIDADES

Siempre que se encare un problema estadstico debe tenerse en cuenta el grado de


posibilidad de que ciertos sucesos hayan ocurrido o vayan a ocurrir. Por ejemplo, a un
poltico le interesar conocer el grado de seguridad de las encuestas que determinan
un porcentaje dado de votantes para las prximas elecciones o a un inversionista le
interesar saber qu grado de riesgo corre su capital en la compra de determinadas
acciones. Las matemticas de las probabilidades se relacionan, en sus orgenes,
con los juegos de azar, por lo que no debe extraar que para el estudio de ella, se
utilicen como ejemplos, resultados posibles en lanzamientos de dados o monedas, en
los posibles resultados de una jugada de ruleta, etc. Independientemente de esas
aplicaciones particulares, el estudio de probabilidades indica que existe incertidumbre
con respecto a la ocurrencia o no de un determinado evento. En muchas
oportunidades puede ser virtualmente imposible predecir cul ser el resultado de una
determinada accin, pero es posible anticipar cul es el resultado que se espera de
dicha accin.
Resumiendo, el estudio de este Mdulo nos lleva a cuantificar cuan probable es la
ocurrencia de un determinado evento.

A continuacin presentamos un problema en el que se requerirn los temas que


desarrollaremos en este mdulo:
La gerencia de una compaa de Seguros est preocupada por el nmero de unidades
automotrices que son robadas en la va pblica en una determinada ciudad.
A partir de ello, efecta la consulta correspondiente a la seccin de robos y hurtos de
la polica quin le reporta la siguiente informacin:
La cuarta parte de los propietarios de automotores de esa comunidad deja las llaves
puestas en los automviles al estacionarlos. Adems y de acuerdo a estadsticas el
5% de los automviles que, estacionados tienen las llaves puestas, son robados de la
va pblica mientras que solo el 1% de los automviles que no tienen las llaves
puestas son robados.
Indique Ud. la probabilidad de que un automvil que ha sido robado en esa ciudad
haya tenido las llaves puestas.

2.1 PROBABILIDADES

Cuando un fenmeno puede presentarse de distintas maneras, la factibilidad de


ocurrencia de cada una de ellas se la define como probabilidad.

Cada una de las distintas maneras en que puede presentarse el fenmeno se


denomina evento.
Cuando lanzamos un dado ste puede presentarse de seis maneras distintas,
refirindonos al nmero que presenta su cara superior, cada una de ellas recibe el
nombre de evento y la designaremos con la letra E, as tendremos

E1: que presente un As


E2: que presente un dos

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -1-


Profesor: MARIO MARN
E3: que presente un tres E4:
que presente un cuatro E5:
que presente un cinco o
E6: que se presente con un seis

La probabilidad de un evento es un nmero real comprendido entre 0 y 1

0 P (E) 1

Y puede representarse como un nmero decimal o como fraccin.

Una probabilidad de valor cero indica la imposibilidad de ocurrencia, por el contrario


una probabilidad igual a 1 significa la certeza. La probabilidad de que al lanzar una
moneda se obtenga una cara o una cruz P (cara o cruz) = 1, as mismo en el
lanzamiento de un dado, la probabilidad de obtener un siete P(x=7) = 0, es imposible,
un dado no puede tener siete caras.

2.2 EVENTOS: DEFINICIN Y CLASIFICACIN

Pero regresemos al lanzamiento de un dado perfectamente balanceado, podramos


considerar tambin como evento, la aparicin de un nmero par en la cara superior
del dado, lo que se dara en el caso de presentarse el dos, el cuatro o el seis y lo
representaremos con la letra A, para diferenciarlo de los anteriores.

A: que salga un nmero par

O podramos considerar tambin la aparicin de un impar claro que en este caso, la


condicin de obtener un nmero impar se satisface con la aparicin del 1, del 3 o del
5, tres de los posibles eventos en el lanzamiento del dado, vemos entonces que es
necesario clasificar los eventos:

Simples
Eventos
Compuestos

Un evento se dice que es compuesto cuando est conformado por ms de un evento


simple, de esta manera, tambin seran eventos compuestos:

B: que se presente con un nmero mayor o igual a 4


C: que sea par y mayor o igual a 4
D: que sea un nmero par o mayor o igual a 4

Claro que tambin podramos expresar al evento C como aquel para el cul debe
cumplirse conjuntamente A y B

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -2-


Profesor: MARIO MARN
C = (A y B)

De la misma manera:

D = (A o B) es decir D se cumple cuando al menos uno de los dos A o B se cumple.

2.2 DETERMINACIN DE PROBABILIDADES

Se tiene tres planteos bsicos para definir una probabilidad, estas son:

a) Planteamiento clsico
b) Planteamiento basado en la frecuencia relativa
c) Planteamiento subjetivo

Cada una de ellas es aplicada segn las circunstancias y es el Estadstico quien


decide su aplicabilidad. Analizaremos cada una de ellas

2.3.1 PLANTEAMIENTO CLSICO

Cuando un fenmeno puede presentarse de n formas distintas, todas ellas igualmente


posibles, y de esas n formas en c de ellas lo hace con una determinada caracterstica,
entonces, la probabilidad de que al presentarse el fenmeno lo haga con la
caracterstica en estudio est dado por el cociente de c sobre n

c
P
n

Si a c se lo denomina como nmero de casos favorables y a n como nmero de


casos posibles podramos expresar la probabilidad clsica como:

Nm ero de casos favorables


P
nm ero de casos posibles

Es necesario tener en cuenta que para que esta expresin sea correcta todas las
formas en que puede presentarse el fenmeno deben ser igualmente posibles.

Con este concepto la probabilidad de que al lanzar un dado presente la cara con un
nmero par ser de:
3
P(A) =
6

3 son los casos favorables (2, 4 y 6) y el nmero de casos posibles es 6.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -3-


Profesor: MARIO MARN
Recordemos el evento C = deba cumplir con la condicin de ser (par) y mayor o igual
que 4, es decir, deba cumplirse simultneamente los eventos A y B

P (C) = P (A y B)

En este caso los eventos favorables son E4 y E6, cumplen con la condicin de ser
pares y mayores o iguales a 4 por lo tanto aplicando el concepto de probabilidad
clsica emprica tendremos:
2
La probabilidad P(C) =
6

2.3.2 PLANTEAMIENTO EN BASE A LA FRECUENCIA RELATIVA.

Analicemos el lanzamiento de una moneda y descartemos la posibilidad de que, en un


lanzamiento la misma caiga de canto (en ese hipottico caso se dejara rodar a la
moneda hasta su cada). Dos son los eventos simples en que puede presentarse el
fenmeno, que se obtenga una cara o una cruz. Luego la probabilidad de obtener una
cara de acuerdo al planteamiento clsico ser:

1
P(cara) = 0,5
2

Por otra parte si en 10 lanzamientos se obtuvieron cuatro caras y seis cruces entonces
la frecuencia relativa de obtencin de caras es:

4
fr(cara) = = 0,4.
10

Si este valor lo representamos grficamente en un sistema de ejes coordenados


ortogonales donde, en el eje de las abscisas llevamos el nmero de lanzamientos y
en las ordenadas las frecuencias relativas, tendremos un punto tal como lo entrega el
diagrama

Grfico 2.1
fr

0,5
0,4 - - - *

10 N

Si seguimos lanzando la moneda y cada 10 nuevos lanzamientos obtenemos la


frecuencia relativa de obtencin de caras para el total de lanzamientos y lo vamos
graficando obtendremos el siguiente diagrama:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -4-


Profesor: MARIO MARN
Grfico 2.2

fr

* *
* * * *
0,5 * * * * *
* * *
*

10 20 30 40 50 60 70 80 90 100 110 N

El diagrama indica que a medida que aumenta el nmero de lanzamientos la


frecuencia relativa de la obtencin de cara se aproxima a 0,5, valor de la probabilidad
entregada por la expresin clsica, esto nos permite enunciar la Ley de los Grandes
Nmeros que dice:

Cuando un fenmeno se pone en evidencia de distintas maneras, la frecuencia


relativa de ocurrencia de cada una de ellas tiende a coincidir con su probabilidad de
ocurrencia cuando el nmero de veces que se presenta el fenmeno es lo
suficientemente grande.

Es decir que en este caso se define como probabilidad a la frecuencia relativa


observada de un evento durante un gran nmero de intentos.

Veamos las caractersticas de ste mtodo mediante el siguiente ejemplo:

De acuerdo a las estadsticas llevadas a cabo por una Ca. de seguros, sta informa
que de las personas del sexo masculinas de 50 aos, aproximadamente 65 de cada
100.000 mueren durante el perodo de un ao. De acuerdo al mtodo de frecuencia
relativa, la probabilidad de que una persona asegurada del sexo masculino con una
edad de 50 aos, muera en el trmino de un ao es de

65
P= 0,00065
100.000

Es necesario tener presente que el grado de bondad de la probabilidad calculada


mediante este mtodo, depende del nmero de veces en que fuera evaluado el
proceso y por tal motivo, determinada la frecuencia relativa. La definicin expresa que
para que la probabilidad de ocurrencia de un proceso coincida con su frecuencia
relativa de ocurrencia, sta debe estar calculada sobre la presentacin de un nmero
suficientemente grande del fenmeno.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -5-


Profesor: MARIO MARN
2.3.3 PROBABILIDAD SUBJETIVA

La probabilidad subjetiva queda librada al criterio de quin la determina en funcin de


la evidencia con que se cuente para la misma, esta puede ser en base a la frecuencia
relativa de ocurrencia en eventos pasados o simplemente de acuerdo a sus supuestos.
Este tipo de probabilidad se da cuando los eventos se presentan un nmero reducido
de veces.
Supngase cumplir las funciones gerente de Recursos Humanos en una Empresa y
debe elegir un candidato de entre cuatro que presentan vitae similares, con iguales
apariencias y niveles de relacin. El que Ud. elija a uno de ellos es haberle asignado
una determinada probabilidad a la potencialidad futura de ese hombre y considera ser
superior a la asignada a los otros. En este caso el hecho de no existir una frecuencia
relativa del fenmeno no lo libera de la toma de decisin. Es importante tener presente
que, personas distintas frente a la misma situacin pueden asignar probabilidades
subjetivas distintas.

2.3 REPRESENTACIN GRFICA

Retomemos el fenmeno correspondiente al lanzamiento de un dado. En muchas


ocasiones es conveniente operar probabilidades en forma grfica, para ello nos
valdremos del Diagrama de Venn. Para la confeccin de este diagrama representamos
mediante puntos cada uno de los eventos simples en que puede presentarse el
fenmeno, cada uno de ellos se denomina punto muestral y el espacio conformado por
todos los puntos muestrales se denominar espacio muestral y se lo denota como (S)

Para el caso que nos ocupa tendremos:

Grafico 2.3
S

E1
E5
E2
E3

E4 E6

Cada uno de los puntos considerados corresponde a cada uno de los posibles eventos
en que puede presentarse el lanzamiento del dado.
Es necesario adems asignarle a cada uno de los puntos muestrales un valor de
probabilidad pero teniendo en cuenta que el valor de probabilidad asignado debe
cumplir con la condicin de ser mayor o igual a cero pero menor o igual a 1:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -6-


Profesor: MARIO MARN
0 P(Ei) 1
donde i vara entre 1 y 6, para este caso

Adems debe cumplirse que, la suma de las probabilidades de todos los puntos
muestrales sea igual a 1

i 6

P(E ) 1
i
i 1

En el caso que nos ocupa, todas las caras tienen la misma probabilidad de ocurrencia,
por lo tanto la probabilidad que le asignaremos a cada punto muestral ser de

P (Ei) = 1/6

La probabilidad de que al lanzar el dado se obtenga un nmero par

A: obtener un par

Este evento compuesto se cumple en el caso de obtener un dos, o un cuatro o un seis


Grficamente tendremos:

Grafico 2.4

S E1
E5
E2 A

E3 E6

E4

A se cumple si se cumple E2 o E4 o E6, y por lo tanto queda verificado grficamente

P(A) = P (E2) + P (E4) + P (E6)

El evento compuesto A es la unin de los eventos simples E2, E4 y E6, teniendo en


cuenta el valor de la probabilidad de ocurrencia asignada a cada una de ellos,
tendremos
P(A) = 1/6 + 1/6 + 1/6 = 3/6

Veamos la probabilidad de obtener un nmero mayor o igual a 4 (recordemos que B es


un nmero mayor o igual que 4.
B se cumple si se verifica E4 o E5 o E6, tambin en este caso grficamente (grfico 5-
3) verificamos que:

P (B) = P (E4) + P (E5) + P (E6)

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -7-


Profesor: MARIO MARN
Grfico 2.5

E1

E2
E5 E3

E4 E6
B

P (B) = 1/6 + 1/6 + 1/6 = 3/6

Analicemos ahora el evento C: que sea par y mayor o igual a 4, en este caso deben
cumplirse ambas condiciones simultneamente

P(C) = P(A y B)

Representado en el grfico 5-4 observamos que la condicin de ser par y mayor o


igual 4 solo lo cumplen los eventos E4 y E6

Grafico 2.6

E1
A
E2
E3

E4 E6 E5
B

Que corresponde justamente a la interseccin de los eventos A y B

P(C) = P(A B) = 2/6.

Analicemos el evento D: obtener un nmero par o un nmero mayor o igual a 4,


Grfico 2.7.

P (D) = P(A o B)

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -8-


Profesor: MARIO MARN
Grfico 2.7

E1
AAA
A E2 E3

E6 E5
E4
B

Grficamente observamos que esta condicin lo cumplen solo los eventos E2, E4, E5
y E6, por lo tanto la probabilidad del evento compuesto D ser:

P (D) = P (E2) + P (E4) + P (E5) + P


(E6) P (D) = 4 / 6

En este caso no podemos aplicar la suma de las probabilidades de A y B porque


tienen una zona en comn (recordemos que esa zona en comn corresponda a (A y
B)) que la estaramos sumando dos veces, por lo que, a fin de obtener correctamente
la probabilidad de D tendramos que restrsela:

P(A o B) = P(A) + P (B) P(A y B)

P(A o B) = 3/6 + 3/6 2/6 = 4/6

conclusin a la que ya habamos arribado grficamente.

Podemos deducir segn lo visto que, grficamente los eventos compuestos surgen de
la unin o interseccin de eventos, sean estos simples o compuestos. La probabilidad
de obtener un nmero par P(A) esta dada por la unin de los eventos simples E2, E4
y E6, mientras que la probabilidad de obtener un par o un nmero >= 4 est dada por
la unin de los eventos compuestos A y B

2.4 REGLA ADITIVA

Tenemos ahora una expresin que nos entrega la probabilidad de la unin de eventos.
Expresin que toma el nombre de Regla Aditiva

P(A o B) = P(A) + P (B) P(A y B)

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) -9-


Profesor: MARIO MARN
Sera conveniente determinar cul es la expresin que nos determina la interseccin
de eventos, para ello analicemos el siguiente caso:

Cul es la probabilidad que habiendo obtenido en el lanzamiento del dado un nmero


> o = a 4 este sea par? A este tipo de probabilidad se denomina condicional y se la
expresa como P(A / B) Expresin que se lee como probabilidad de ocurrencia de A
segn B.
Si la cara obtenida contiene un nmero mayor o igual a 4 tendr que ser el 4 o el 5 o
el 6, solo tres casos posibles y de los cuales solo dos de ellos cumplen con la
condicin de ser par, por lo tanto si nos ajustamos a la definicin clsica de
probabilidades:

casos favorables 2
P(A / B) = =
casos posibles 3

Por otra parte, la condicin que deben cumplir los casos favorables es la de ser mayor
o igual a 4 y adems, deben cumplir con la condicin de ser par, es decir, deben
satisfacer simultneamente A y B, mientras que los casos posibles estarn dados por
los eventos simples que constituyen a B, mayores o iguales a 4. Pudiendo expresarla
como:

P( A B)
P( A / B)
P(B)

La expresin indica que: La probabilidad de ocurrencia de A segn B, est dada por


el cociente entre la probabilidad de ocurrencia conjunta de A y B sobre la probabilidad
de B.
2 3
Si recordamos que la P(A B) y la P (B)
6 6

Reemplazando tendremos
2
P(AB) 2
P(A/ B) = 6
P (B) 3 3
6

Resultado al que habamos arribado por razonamiento y aplicacin de la definicin


clsica.

2.6 REGLA MULTIPLICATIVA

La expresin anterior no solo nos entrega la probabilidad condicionada de ocurrencia


de A segn B sino que, nos permite obtener la expresin multiplicativa, si pasamos el
denominador del segundo miembro multiplicando al primero, e intercambiando los
miembros:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 10 -


Profesor: MARIO MARN
P(A B) P (B) * P(A/ B)

De la misma manera arribaramos a la expresin:

P (B A) P(A) * P (B / A)

Debe tener en cuenta el alumno que:

P(A B) P (B A)

Si tenemos en cuenta que grficamente los eventos compuestos estn conformados


por la unin (suma) o interseccin (producto) de eventos, las expresiones
determinadas por la regla aditiva y multiplicativa nos permitirn resolver las
probabilidades de eventos compuestos.

Regla aditiva: P(A o B) = P(A) + P (B) - P(A y B)

Regla multiplicativa: P(A y B) = P(A). P (B / A) = P (B). P(A / B)

2.7 RELACIN ENTRE EVENTOS

De acuerdo a lo estudiado, hemos visto que dos o ms eventos pueden combinarse


para dar eventos compuestos y esos tipos de combinacin estaban representados
grficamente por una unin de eventos o por una interseccin de ellos.
Matemticamente, la unin esta dada por una disyuncin o, probabilidad de ocurrencia
de por lo menos uno de ellos, esta probabilidad estaba determinada por la regla
aditiva, mientras que a la interseccin le corresponde el conectivo lgico y, es una
conjuncin e indica la ocurrencia simultanea de ambos eventos y su probabilidad
denominada probabilidad conjunta, esta probabilidad es satisfecha por la regla
multiplicativa.
Independientemente del concepto precedente, el evento compuesto generado por la
relacin entre los eventos A y B se la puede clasificar como:

COMPLEMENTARIOS

RELACION ENTRE EVENTOS MUTUAMENTE EXCLUYENTES

INDEPENDIENTES

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 11 -


Profesor: MARIO MARN
2.7.1 EVENTOS COMPLEMENTARIOS

Dos eventos A y B se denominan COMPLEMENTARIOS cuando la suma de sus


probabilidades es igual a 1:
P(A) + P (B) = 1

Si tenemos presente el espacio muestral en donde cada una de los eventos posee una
probabilidad y la suma de todas ellas es igual a 1, nos indica que dada el evento A, su
complemento estar constituido por todos los puntos muestrales de dicho espacio
que no pertenezcan a A y se lo denomina como A (todo lo que no es A constituye su
complemento)

Grfico 2.8

A
A BA

2.7.2 EVENTOS MUTUAMENTE EXCLUYENTES

Se dice que dos eventos son mutuamente excluyentes cuando la ocurrencia de uno de
ellos implica la no ocurrencia del otro.

Grfico 2.9
S

Grficamente no presentarn ningn punto en comn.

En el lanzamiento de un dado, la obtencin de un cuatro es mutuamente excluyente


con cualquiera de las otras cinco opciones. Representado grficamente en un
diagrama de Venn.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 12 -


Profesor: MARIO MARN
Podemos decir que todos los eventos simples en que puede presentarse un fenmeno
son mutuamente excluyentes. Consideremos nuevamente el lanzamiento de un dado
perfectamente balanceado, seis son los eventos simples posibles, y todos ellos son
mutuamente excluyentes, la ocurrencia de uno de ellos implica automticamente la no
ocurrencia de los otros. Ninguno de ellos tiene puntos en comn Grafico 2.10.

Grfico 2.10
S

E1
E5
E2
E3

E4 E6

El no poder ocurrir simultneamente implica que la probabilidad de ocurrencia


simultnea de ellos sea igual a cero.

P (E1 E2) = 0
Al igual que P (E2 E5) =
0

Y en general dados dos eventos A y B si son mutuamente excluyentes debe cumplirse


que

P(A B) = 0

Por lo tanto en este caso, cuando los eventos son mutuamente excluyentes, la
probabilidad de ocurrencia de por lo menos uno de ellos ser igual a la suma de sus
probabilidades:

P(A B) = P(A) + P (B)

Acotacin:
Como conclusin podemos decir que dados dos eventos A y B, si son
complementarios ambos eventos A y B, este ltimo = A ser exhaustivamente
excluyentes ya que no es posible obtener otro resultado para el fenmeno que no sea
uno de ellos. Resumiendo, si dos eventos son complementarios indefectiblemente son
mutuamente excluyentes.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 13 -


Profesor: MARIO MARN
2.7.3 EVENTOS INDEPENDIENTES

Supongamos que lanzamos una moneda, la probabilidad de obtener una cara es de .


Si lanzamos otra moneda, la probabilidad de obtener una cara ser tambin de .
Cul es la probabilidad de que se obtenga una cara en la segunda moneda
habindose obtenido una cara en la primera? Consideramos que ser tambin de ,
no existe relacin alguna entre el resultado de la primera y la probabilidad de
ocurrencia de la segunda moneda, tendramos que afirmar:

P (cara 2 / cara 1) = P (cara 2)

Que se lee, la probabilidad de que la segunda moneda se obtenga cara, habindose


obtenido cara en la primera moneda es igual a la probabilidad de obtener cara en la
segunda moneda. Decimos que los eventos son independientes.

Definicin
Dos eventos se dicen que son independientes, cuando la ocurrencia de uno de ellos
no modifica la probabilidad de ocurrencia del otro.

Y se expresa como:

P(A / B)= P(A).

La probabilidad que Juan apruebe Estadstica es independiente de que Boca gane en


el prximo partido.

Si recordamos la regla multiplicativa:

P(A B) = P (B). P(A/B)

Cuando los eventos son independientes la P(A/B) = P(A)

Por la tanto la expresin matemtica de la probabilidad conjunta toma la forma de:

P(A B) = P(A). P (B)

Lo que se expresa como:

Cuando dos eventos son independientes, la ocurrencia simultnea de ambos es igual


al producto de sus probabilidades.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 14 -


Profesor: MARIO MARN
En muchas oportunidades se le hace difcil al alumno definir cuando existe
dependencia o independencia de dos eventos. Supongamos que extraemos una carta
de un mazo de cartas espaolas de un total de cuarenta y definimos:

C1 = sacar una carta de espadas en una primera extraccin y


C2 = extraer una carta de espadas en la segunda extraccin

La probabilidad de extraer una carta de espadas en la primera extraccin ser


de

10 casos favorables
P (C1) =
40 casos posibles

Pero la probabilidad de extraer una espada en la segunda extraccin queda


supeditada a la forma en que se realice el proceso, es decir, con reposicin o sin
reposicin.
Si se realiza con reposicin, luego de efectuar la primera extraccin, la carta se coloca
nuevamente en el mazo y se mezcla, la probabilidad de extraer una carta de espadas
ser nuevamente de

10
P (C2) =
40

Los eventos son independientes. Pero si el proceso se realiza sin reposicin, la


probabilidad de extraer una espada en segundo trmino depende de la carta extrada
en la primera oportunidad (que sea o no una espada).
La probabilidad de extraer una espada en la segunda oportunidad no habiendo
obtenido una espada en la primera ser de:
10
P (espada en 2 / no espada en 1) =
39

Mientras que la probabilidad de obtener una espada en la segunda oportunidad


habiendo obtenido una espada en la primera ser:

9
P (espada en 2 / espada en 1) =
39

Aclaraciones

1. Se define como probabilidad marginal a la probabilidad simple correspondiente a un


evento. Si lanzamos una moneda que est perfectamente balanceada, la probabilidad
de obtener una cara es de 0,5, esto es cierto para cualquier lanzamiento, no importa
cuntas veces se lance la moneda ni cuales fueron los resultados anteriores. Cada
nuevo lanzamiento es nico e independiente de los resultados que se hubieren
obtenido en lanzamientos anteriores.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 15 -


Profesor: MARIO MARN
2. En el inicio del estudio de probabilidades se hace complejo definir claramente
sucesos mutuamente excluyentes y eventos independientes a estos efectos se tendr
muy en cuenta la siguiente premisa

Los sucesos mutuamente excluyentes deben ser dependientes, pero los sucesos
dependientes no tienen necesariamente que ser mutuamente excluyentes.

2.8 PROBABILIDADES MARGINALES BAJO DEPENDENCIA ESTADSTICA

La probabilidad marginal en condiciones de dependencia estadstica se determina


mediante la suma de las probabilidades de todos los eventos conjuntos en los que se
presenta el evento sencillo.

Supongamos tener una caja con 10 bolillas que presentan las siguientes
caractersticas:
Tres son rojas con puntos
Una es roja con franjas Dos
son grises con puntos Cuatro
son grises con franjas

La probabilidad de extraer una bola gris, estar dada por la suma de las
probabilidades de obtener una bola gris con puntos y una bola gris con franjas:

P (gris) = P (gris puntos) + P (gris franjas)

Recordar que de manera general la P(A B) = P(A). P (B/A) que se lee La


probabilidad de A y B es igual a la probabilidad de A por la probabilidad de A segn B

En nuestro caso:

La P (gris y puntos) = P (gris) * P (puntos / segn gris)

= 6/10 * 2/6 = 2/10

Adems la P (gris y franjas) = P (gris) * P (franjas / segn gris)

= 6/10 * 4/6 = 4/10

Por lo tanto la probabilidad de obtener una bolilla gris ser: P

(gris) = P (gris y puntos) + P (gris y franjas)

P (gris) = 0,2 + 0,4 = 0,6

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 16 -


Profesor: MARIO MARN
Analicemos la siguiente situacin:

Un Club local con 400 socios los clasifica de acuerdo a su edad, en tres categoras,
Infantiles, Cadetes y Mayores. Adems en cada categora los clasifica de acuerdo a su
sexo en Varones y Mujeres segn consta en la siguiente tabla:

SEXO INFANTILES CADETES MAYORES

Varones 150 100 30

Mujeres 70 30 20

Si se elige azarosamente la ficha de un socio indique Ud. la probabilidad que:

a) Corresponda a una mujer

De acuerdo a la definicin la probabilidad de mujer estar dada por la suma de las


probabilidades de los eventos conjuntos donde se presenta la mujer, es decir

Si designamos a mujer como F, a varn como V, infantiles como I, cadetes como C y


mayores como M podemos expresar:

P( F ) = P( F I) + P(F C ) + P( F M )
= 70 / 400 + 30 / 400 + 20 / 400 = 120 / 400

Resultado al cual podramos haber llegado rpidamente si completamos la tabla


anterior con una nueva fila y una columna ms que contengan los totales:

SEXO INFANTILES CADETES MAYORES TOTALES

Varones 150 100 30 280

Mujeres 70 30 20 120

TOTALES 220 130 50 400

De esta manera la Probabilidad:

P (F) = 120 / 400

Suponga que quiere determinar la probabilidad de que elegida la ficha de un socio


azarosamente, le corresponda a un varn siendo que perteneca a un infantil.
Aplicando la expresin general de probabilidades dependientes tendremos:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 17 -


Profesor: MARIO MARN
P (V I)
P (V / I) =
P (I)

Desarrollando las expresiones del numerador y del denominador tendremos:

P (V) * P (I /V)
P (V / I) =
P (I F) P (I V)

Desarrollando las probabilidades conjuntas del denominador tendramos:

P (V) * P (I /V)
P (V / I) =
P (F)* P (I / F) P (V) * P (I /V)

Expresin que se la conoce como Teorema de Bayes

El teorema o Regla de Bayes en si trata la revisin de las estimaciones iniciales de la


probabilidad dada la evidencia de la muestra. En sntesis permite estudiar nueva
informacin y revisar nuestras anteriores estimaciones.
Para el caso que estamos tratando, aplicar Bayes nos entregara:

220 150
*
P (V / I) 400 220
120 70 280 150
* *
400 120 400 280

Simplificando tendremos

150
P (V/ I) =
220

Claro que la tabla facilita la determinacin de estas probabilidades condicionadas


analizando el problema de la siguiente manera:

La probabilidad de que corresponda a un varn, sabiendo que la ficha pertenece a un


infantil, circunscribe el espacio muestral solo al nmero de infantiles 220 que
corresponder al nmero de casos factibles, por otro lado los casos favorables se dar
por la cantidad de varones infantiles que se tengan, en este caso 150, luego aplicando
la expresin clsica de probabilidades

150
P (V / I) =
220

Analicemos el siguiente problema


Una empresa metalrgica produce pernos de pistn para un determinado tipo de
motor. La produccin se efecta con tres mquinas a las que designaremos como M1,

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 18 -


Profesor: MARIO MARN
M2 y M3. La mquina M1 Produce el 50% de los pernos mientras que la M2 el 30%, se
sabe adems que la mquina M1 produce un 4% de piezas defectuosas mientras que
la M2 produce el 8% y de los pernos producidos por la M3 el 10% presenta fallas.
Si tomamos azarosamente un perno listo para embalar y el mismo est defectuoso,
indique Ud. cul es la probabilidad de que lo haya producido la maquina M1.

De acuerdo a lo solicitado por el enunciado nuestra incgnita es la Probabilidad de que


un perno lo hubiera producido M1 sabiendo que el mismo est defectuoso.

P (D M
P (M1/ D) (1)
1)
P (D)

De acuerdo a los datos tenemos que la probabilidad de que un perno cualquiera lo


produjera cada una de las mquinas ser:

P (M1) = 0,5
P (M2) = 0,3
P (M3) = 0,2

Por otra parte conociendo los porcentajes de pernos defectuosos producidos por
cada una de las mquinas tendremos:

La probabilidad de que habindola producido M1 est defectuoso

P (D / M1) = 0,04

De idntica manera tendremos:

P (D / M2) = 0,08 y

P (D / M3) = 0,1

Desarrollando la expresin (1) de acuerdo al teorema de Bayes tendremos:

P (M1) * P (D /
P(M1 / D) =
M1)
P (D M1) P (D M 2) P (D M
3)

desarrollando el denominador

P (M1) * P (D /
P(M1/D) = M1)
P (M1) * P (D / M1) P (M 2) * P (D / M 2) P (M 3) * P (D /
M 3)

Reemplazando valores tendremos:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 19 -


Profesor: MARIO MARN
P (M1 / D) 0.5 * 0.04 0.02
=
0.5 * 0.04 0.3 * 0.08 0,2 * 0,1 0.02 0.024 0.02

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 20 -


Profesor: MARIO MARN
La probabilidad que un perno, que se sabe est defectuoso, lo produjera M1 es igual
a:

0.02
P (M1 / D) =
0.064

RESOLUCIN DEL PROBLEMA


Al inicio de este mdulo se nos plante el siguiente problema, el cual no podamos
resolver por falta de herramientas, pero ahora estamos ya en condiciones de resolver.

La cuarta parte de los propietarios de automotores de esa comunidad deja las llaves
puestas en los automviles al estacionarlos. Adems y de acuerdo a estadsticas el
5% de los automviles que estacionados tienen las llaves puestas son robados de la
va pblica mientras que solo el 1% de los automviles que no tienen las llaves
puestas son robados. Indique Ud. la probabilidad de que un automvil que ha sido
robado en esa ciudad haya tenido las llaves puestas.

Si definimos como evento A, el dejar las llaves en el estacionamiento, B el evento de


no dejarlas y R que el automvil fuera robado, entonces tendremos:

P(A) = 0,25

Por lo tanto la P (B) 0,75

Adems la probabilidad de que un auto estacionado con las llaves puestas sea robado
es de:

P(R/A) = 0,05

y la probabilidad de que sea robado en caso de no tener las llaves puestas es :

P(R/B) = 0,01

Lo solicitado en el problema es la probabilidad de que habiendo sido robado un


automvil, ste tuviera las llaves puestas. Expresando esta probabilidad condicionada:

P(A R)
P(A/R) =
P(R)

Desarrollando esta expresin tendremos la Regla de Bayes:

P (A) * P(R / A)
P (A/R) =
P (A R) (P (B
R)

Que desarrollando el denominador, tambin podemos expresar como:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 21 -


Profesor: MARIO MARN
P(A) * P(R / A)
P(A/R) =
P(A) * P(R / A) (PB) * P(R / B)

Reemplazando por valores:

0,25 * 0,05
P(A/R) =
0,25 * 0,05 0,75 * 0,01 0,0125
0,02

P(A/R) = 0,6255

COMBINACIONES Y PERMUTACIONES

El estudio de combinaciones y permutaciones se asocia al estudio de anlisis


combinatorio y constituye en realidad una herramienta de gran aplicacin en la
resolucin de probabilidades y en la distribucin de variable aleatoria que veremos
ms adelante.

Supongamos tener un conjunto de cinco elementos a los que denominaremos como:

(a, b, c, d, e)

Denominaremos como n al nmero de elementos que conforman el conjunto, en este


caso n = 5.
Ahora bien, si, con los elementos del conjunto quisiramos formar subconjuntos de r
elementos cada uno, en este caso r = 3, estos seran los siguientes:

(a b c) (a b d) (a b e) (a c d) (a c e) (a d e)
(b c d) (b d e) (b c e) (c d e)

Cada uno de estos subconjuntos de tres elementos cada uno de ellos, formados con
los n elementos del conjunto dado se denominan combinaciones y se las expresa
como:

n C r (Expresin que se presenta en general en las calculadoras).


No obstante es comn encontrar en distintos textos combinaciones expresadas de
diferentes maneras segn el criterio del autor y a saber:

Crn Cnr

En todas ellas se lee como Combinaciones de n elementos tomados de r en r,


matemticamente igual a:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 22 -


Profesor: MARIO MARN
n!
nCr = (11)
r!*(n r)!

n! 5!
= =
r!*(n r)! 3!*(5 3)!

5.4.3.2.1
10
(3.2.1) (2.1)

Definicin

Dos combinaciones son distintas cuando varan en por lo menos un elemento.

A su vez, cada subconjunto de tres elementos pueden expresarse de seis maneras


distintas, permutando los trminos que lo componen:

(A b c) (A c b) (B a c) (b c a) (c a b) (c b a)

(a b d) (a d b) (b d a) (b a d) (d a b) (d b a)

(a b e) (a e b) (b a e) (b e a) (e a b) (e b a)

(a c d) (a d c) (d a c) (d c a) (c d a) (c a d)

(a c e) (a e c) (c a e) (c e a) (e a c) (e c a)

(a d e) (a e d) (d e a) (d a e) (e a d) (e d a)

(b c d) (b d c) (c d b) (c b d) (d b c) (d c b)

(b d e) (b d e) (d b e) (d e b) (e d b) (e b d)

(b c e) (b e c) (c b e) (c e b) (e c b) (e b c)

(c d e) (c e d) (e d c) (e c d) (d e c) (d c e)

Cada una de las distintas formas en que puede expresarse un conjunto se denomina
permutaciones y se las expresa como:

Pr = r!

P (3) = 3 . 2 . 1 = 6

1
Debemos recordar que n! ( factorial de n) = n* (n-1) * (n-2) * . . . . . . . .* ( n-n+1)
Adems, el factorial de cero 0! = 1.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 23 -


Profesor: MARIO MARN
Definicin

Dos permutaciones son distintas cuando varan en la ubicacin de por lo menos un


elemento.

Resumiendo diremos que, por cada una de las combinaciones de tres elementos,
tomadas entre los cinco del conjunto dado, se pueden obtener seis permutaciones.

Al conjunto de combinaciones y permutaciones se las denomina Variaciones o tambin


Permutaciones de n elementos tomados de r en r, y se lo denota como:

nPr = nCr * Pr

n!
nPr = * r! simplificando
r!.(n r)!

n!
nPr =
(n r)!

Para nuestro caso n = 5 y r = 3 tendremos:

5.4.3.2.1
nPr = 60
2.1

Analicemos el siguiente ejercicio:

Supongamos que en un jardn de infantes hay cuatro maestras de las cuales dos de
ellas son casadas y las denominaremos como C1 y C2, por otra parte las otras dos se
denominaran S1 y S2. Si es necesario elegir a dos de las maestras para acompaar a
los nios a un paseo, y la eleccin se efecta de manera totalmente aleatorio, indique
la probabilidad:
A que las dos maestras elegidas sean casadas.
B Que las dos sean solteras
C Que una sea casada y la otra soltera.

En casos como el planteado puede ser conveniente operar con el diagrama de VENN,
en el cul volcaramos todas las duplas posibles a elegir, que no seran ms que las
combinaciones de dos elementos tomados del conjunto original de cuatro, y a saber:

(C1 C2 S1 S2)

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 24 -


Profesor: MARIO MARN
S

C1C2 C2S1

C1S1 S1S2
C2S2
C1S2

Cada punto muestral es una combinacin.

Al elegir una dupla, esta tendr que ser necesariamente una de las seis
combinaciones, todas igualmente posibles y por lo tanto la probabilidad de cada una
de ellas ser de:

P (Ei) = 1 / 6

A) La probabilidad de que ambas sean casadas ser entonces de:

P (C1C2) = 1/ 6

B) La probabilidad de que las dos sean casadas tambin ser igual a:

P (S1S2) = 1/ 6

Solo una combinacin cumple con esa condicin.

C) De las seis combinaciones posibles, en cuatro de ellas se tiene una casada y la


otra soltera, por lo que la probabilidad de:

P (SC) = 4 / 6

A C1C2 C2S1

C1S1 S1S2 B
C2S2
C1S2
C

P(A) + P (B) + P(C) = 1 / 6 + 1 / 6 + 4 / 6 = 1

Mientras el nmero de eventos simples sea pequeo, podemos resolver estas


probabilidades directas apoyndonos en el diagrama de VENN, pero si su nmero
aumentare ya no sera posible este tipo de planteo.

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 25 -


Profesor: MARIO MARN
Supongamos tener un curso de 32 alumnos conformado por 14 mujeres y 18
varones, si es necesario conformar una comisin de dos alumnos para realizar una
investigacin y sta se efectuare azarosamente, indique la probabilidad de que los dos
alumnos elegidos:
A sean varones
B ambos sean mujeres
C que uno de ellos fuere mejer y el otro varn.

En este caso generaramos un diagrama de VENN pero con otro concepto. Si se


tomar una dupla esta ser una de todas las posibles duplas que se pueden formar
con 32 alumnos. Es decir:

Duplas posibles = 32C2 Su valor lo obtenemos en cualquier calculadora utilizando la


tecla nCr.
32C2 = 496

Estas 496 duplas estarn conformadas por: 1- Varn Varn (V V)


2- Varn Mujer (V M)
3- Mujer Mujer (M M)

VV
VM

MM

Cuntas duplas de (V V) se tienen, tantas como las combinaciones que se pueden


formar con 18 varones tomados de 2 en 2?:

(V V) = 18C2 = 153

La cantidad de duplas de mujer ser el nmero de combinaciones de 2 elementos


cada una de ellas tomadas de entre las 14 mujeres que tiene el conjunto:

(M M) = 14C2 = 91

Si el total de duplas es de 496, podemos obtener el nmero de ellas que estn


conformadas por mujer varn como la diferencia entre el total y la suma de las
duplas (V V) y (M M)

(M V) = 496 (153 + 91) = 252

Ahora estamos en condiciones de responder a las preguntas aplicando la expresin


clsica de probabilidades:

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 26 -


Profesor: MARIO MARN
casos favorables
P (E) =
casos posibles

153
P (V V) = 0,3084
496

91
P (M M) = 0,1834
496

P (M V) = 0,5081

Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) - 27 -


Profesor: MARIO MARN

Das könnte Ihnen auch gefallen