Probabilidad y Estadistica CAPITULO 1

CAPTULO 1.
Conceptos generales de probabilidad
1.1 QU ES ESTADSTICA?
El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y

uso de datos para tomar decisiones y resolver problemas.
La estadstica surge como herramienta en la ingeniera, la ciencia y la
administracin, porque casi todos los procesos y sistemas de la vida real existen
variabilidad; la variabilidad es el resultado de cambios en las condiciones bajo las
que se hacen las observaciones.
1.2 DIVISIN DE LA ESTADSTICA
La estadstica para su estudio se divide en dos grandes (2) rama:
1.2.1 Estadstica Descriptiva
Tiene como finalidad colocar en evidencia aspectos caractersticos (promedio,

probabilidad de datos, etc.) que sirvan para efectuar comparaciones sin pretender
sacar condiciones de tipo general.
Esta designacin se realiz a travs de la elaboracin de cuadros, grficos,
clculos de promedios, varianzas)
Mediante el anlisis de regiones.
1.2.2 Estadstica Inferencial
Busca dar explicaciones al conjunto de observaciones, prueban la significacin o

validez de los resultados; intenta descubrir las causas que originan este
comportamiento.
La estadstica inferencial proporciona mtodos para estimar caractersticas de un
grupo total (poblacin o universo), basndose en datos de un conjunto pequeo
(muestra) de observaciones.
1.3 CONCEPTOS BSICOS DE LA ESTADSTICA
Daremos a conocer solamente el vocabulario estadstico bsico, los dems trminos

se definirn ha mediado que se vaya presentando la necesidad.
1.3.1 Entidad
Cada uno de los elementos de un grupo o conjunto que se va a someter a estudio
estadstico
1.3.2 Variable
1
CAPTULO 1. Conceptos generales de probabilidad
Es el conjunto de las caractersticas de las entidades que interesan en una

investigacin estadstica.
Los valores que pueden tomar una variable en estadstica no se pueden medir
antes de realizar el experimento estadstico; por lo tanto el valor es aleatorio(al
azar).
Las caractersticas que se pueden medir en una entidad son de tipo cuantitativo
(categrico); como cada caracterstica es una variable aleatoria, estas tienen las
siguientes subdivisiones:
Continua
Variable
Cuantitativa
VARIABLE Discreta
ALEATORIA Variable
Cualitativa o
Categorica
1.3.2.1 Variable cuantitativa
Se dice que una variable es cuantitativa siempre que los valores queson el resultado de
medidas numericas.Ejemplo de variable cuantitativa son la densidad, el peso,la
viscocida, la temperatura, etc.
1.3.2.1.1 Variable Cauntitativa Continua
Una variable continua es aquella que teoricamente pueden tomar cualquier

valor dentro de un intervalo de valores. Es decir, una variable continua se
mede unifoermemente. Por ejemplo, si la variable en gramos la definimos
como X, esta puede estar en el intervalo 50 g X 70 g .
1.3.2.1.2 Cuantitativa Discreta Variable
Cuando los valores numericos que pueden tomar una variable son numeros
enteros, la variable se denomina discreta. Por ejemplo, si la variable es la
edad cumplida en aos de una persona, esta solo puede tomar los valores de
1,2,3,, 120 (si la expectativa de voda es 120 aos)
2
1.3.2.2 Variable cualitativa
hay muchas cosas en que no es posible hacer medidas numericas. Por ejemplo,
la variable color puede recibir los valores cualitativas de rojo, verde, amarillo,
etc. Una variable cuyos valores consiste en categorias de clacificacion se
denomina variable cualitativa.
1.3.3 Poblacion o Universo
Conjunto de valores de alguna variable aleatoria relacionado con un conjunto de

entidades. Por ejemplo podemos hablar de una poblacion de pesos, uan
poblacion o un universo de dencidades.
Podemos entonces definir poblacin como el conjunto mas grande de valores (de
una variable), por el cual existe algun interes.
Esta definicion indica que las poblacion son definidas por el investigador y no
estan predeterminadas. Al definir nuestra esfera de interes definimos nuestra
poblacion.
Las poblaciones o universos pueden ser finitos o infinitos. En el campo de
la ingenieria y las ciencias generalmente las poblaciones son infinitas.
1.3.4 Muestra
Una muetra es una parte de la pablacion o universo .

El tamao completo de una poblacion aun siendo finita ( N ) , puede
desanimarnos a intentar investigarla en su totalidad.

Puede ser conveniente o necesario examinar solo una fraccion (muestra) de la
poblacion.
1.4 ETAPAS EN UNA INVESTIGACION ESTADISTICA
Para la realizacion de un estudio estadistico se deben seguir ciertas etapas entre las
cuales las mas importantes son:
I. Plantamiento o formulacion del problema
II. Formulacion de objetos
III. Definicion de la entidad a estudiar o investigar
IV. Formulacion de hipotesisi
V. Metodo de investigacion (total o parcial)
VI. Recoleccion de datos
VII. Generalizacion o inferencia final
VIII. Presentacion del informe y publicacion
Al definir la entidad en la etapa III se debe tener en cuenta:
3
Seleccionar las variables a medir (cuantitativos y cualitativas) y definirlas

correctamente.
Si la variable es cuantitativa continua establecer el tipo de aproximacion
(redondeos).
En la etapa Vsi la investigacion es parcial establecer el tamao de la mustra.
Esquematizacion le etapa III con sus variables
VARIABLES
X = peso en gramos
gm
Y = densidad ( cm3 )
Z = color
ENTIDAD
(producto determinado)
1.5 Redondeo
Redondear una medida numerica es aproximada siempre que se reguistren, en este
texto,resultados finales o intermedios se tendran las suiguientes reglas:
a. Si el digito que queda a la derecha de la posicion del ultimo digito que se

va a retener (registrar) es menor que 5 se registrara el ultimo digito a
retener tal como esta.
b. Si el digito que queda a la derecha de la posicion del ultimo digito que se
va a retener es mayor que 5 se la suma la unidad (1) al ultimo digito que se
va a retener.
c. Si el digito que queda a la derecha de la posicion del ultimo digito que se
va a retener es igual a 5 y el digito que se vba artener es par se deja igual y
si el digito a retener es impar aumantale sumadole 1.
Esquematizando los numerales a, b, c
digito a retener n m
m n
<5 se deja igual
=5 es par se deja igual
impar se le suma la 1
m ultimo digito a retener >5 se le suma la unidad
n digito a la derecha del digito a retener
EJEMPLO
4
resultados finales o intermedios resultados registrados
175.78 7 175.79
175.78 3 175.78
175.78 5 175.78
175.77 5 175.78
1.6DISTRIBUCIONES DE FRECUANCIA
Una distribucion de frecuancia o tabla de frecuancia es una disposicin tabular
de datos; los datos se distribuyen por clases o caregorias con sus
correspondientes frecuancias. Primero se divide el rango de los datos en clases,
si es posible, las clases deben tener el mismo ancho con la finalidad de mejorar
la informacion visnal en la distribucion de frecuancias. Para la solucion del
numero de clases debe emplearse cierto creterio de modo que pueda
desarrollarse un diagrama razonable. El minimo de clases depende del numero
de observacones y de la dispersion de los datos. En general, una distribucion de
ferecuancias que emplea muy pocas clases o demaciadas clases no contiene
mucha informacion, por lo general el minimo de clases debe fluctuar entre 5 y
10 clases.
El numero de clases se puede obtener mediante cualquiera de las formulas siguinetes:
M =1+3.322 log 10 n
M = n
n = tamao de muetra
M = numero de clases
1.6.1 Intervalo De Clase Y Limites De Clases

El simbolo que define una clase se llama intervalo de clase, los minimos
extremos de este intervalo se llaman limete inferior de clase y limete superior de
clase.
LICi: limete inferior de la clase i
LICi lSCi LSCi: limete superior de la clase i
5
El limete inferior de la primera clase debe ser menor o igual que el dato menor
C X min
(LI 1 ) y el limete superior de la ultima debe cumplir la condicion
X max
LSCn .
El limete superior de la primera calse se calculara con la siguiente formula:

LS C1 =LI C1 + ( Caprox )
LS C1 : limete superior de la primera clase
LI C 1 : limete inferior de la primera clase
C : ancho de la clase
aprox : aproximacion de los datos
LICi +lSCi
Marca de clase=
2
La marca de clase es el punto medio de la clase, los datos que se encasillan en una
clase determinada, para efectos practicos miden su marca de clase.
1.7 REGLAS GENERERALES PARA ELABORAR DISTRIBUCIONES DE

FRECUANCIA
Los pasos para elaborar cuadros o tablas de frecuancia son:
I. Toma de datos
II. Encontrar el dato mayor y el menor con el fin de dterminar el rango
donde fluctuan los datos (cuando la variable es cuantitativa)
R= X max X min
X max = dato mayor
X min = dato menor
R= rango
III. Establecer el minimo aproximado de categoria o clase (M) que tendra la

distribucion de frecuancias
R
C=
IV. Encoantrar el tamao de la clase. M
V. construir una tabla de conteo de la forma siguiente:

X min
el limite inferior de la primera clase sera menor o igual a
6
el limite superior de la primera clase sera

VI. los limites inferiores y superiores de las clases se obtienen sumando C al

limite inferior o superior de la clase anterior
LI C 2=LI C 1+C , LI C3 =LI C2 +C , , LI C n=LI Cn1 +C
LS C2 =LS C1 +C , LS C 3=LS C 2+C , , LS C n=LS C n1+ C
LS Cn X max
VII. debe enplearse que , con el fin de que ningun dato se
queda fuera de la tabulacion.
VIII. Establecer los datos examinado cada uno de ellos con el fin de conocer
en que categoria debe colocarse.
El formato general de la tabla de conteo es:
clase conteo frecuancia absoluta

LI C 1LS C2
LI C 2LS C3
.
.
.
LI C nLS C n+1
Total Tabla 1-1
EJEMPLO
A continuacion se desarrollara una tabla de conteo para un analisis de la
resistencia a la tension, en libras por pulgada cuadrada (Psi), de uan muestra de
tamao 80 (n=80) de una nueva aleacion de aluminio y litio, que esta siendo
evaluada como posible material para la fabricacion de elementos estructurales de
aeronaves
Resistencia a la tencion (Psi) de aleacion aluminio-litio
105 221 183 186 121 181 180 143

97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
7
218 157 101 171 165 172 158 169

199 151 142 163 154 171 1448 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Tabla 1-2
Sigiendo las reglas para elaborar distribuciones de frecuancia:

I. Toma de datos
II. Encontrar el dato mayor y el dato menor con el fin de determinar el
rango; para responder a esta regla buscamos el mayor y menor por fila
de la tabla 1-2
Fila Mayor Menor
1 221 105
2 174 97
3 245 110
4 208 115
5 207 123
6 229 76
7 218 101
8 199 142
9 237 87
10 201 118
Despues se busca el mayor dato de los mayores datos por filas y este sera el mayor dato
(245); igual se hace con el menor por filas (76).
X max =245
X min =76
Posteriormente se determina el Rango

R= X max X min
R=24576
R=169
III. Establecer el numero aproximado de categorias o clases
8
n=80 tamao de lamuestra

M =1+3.22 log 80
M =7.32
IV. Encontrar el tamao de la clase
R
C=
M
169
C=
7.32
C=23.
V. Emcontrar los limites inferiores y superiores de la primera clase o

categoria.
LI C 1=X min =76
LS C1 =76+(231)
LS C1 =98
VI. Construir los limites inferiores y superiores de las categorias o clases

subsiguientes.
LI C 2=76+C
LI C 2=76+23
LI C 2=99
LS C2 =98+C
LS C2 =98+23
9
LS C2 =121
Las demas clases se construyen siguiendo la formula:
LI C i=LI C i1+C LS Ci=LS C i1+ C
VII. La tabla de conteo quedara asi:
Clases Conteo Frecuencia Absoluta

76 98 III 3
99 121 IIII II 7
122 144 IIII IIII 10
145 167 IIII IIII IIII IIII IIII 25
168 190 IIII IIII IIII IIII 20
191 213 IIII IIII 9
214 236 IIII 4
237 259 II 2
TOTAL 80
Tabla 1-3
1.7.1 Distribucin De Frecuencia Absoluta, Histograma De Frecuencia

Absoluta, Polgono De Frecuencia Absoluta
A partir de la tabla de conteo 1-3 construimos la distribucin de frecuencia
absoluta, teniendo de ella las clases y la columna de frecuencia absoluta.
Tensin (Psi) Nmero De

Unidades (probetas)
76 98 3
99 121 7 El histograma de frecuencia absoluta y el
122 144 10 polgono de frecuencia son dos
154 167 25 representaciones graficas de la
168 190 20 distribucin de frecuencia. Un histograma
191 213 9 de frecuencias consiste en un conjunto de
214 236 4 rectngulos con:
237 259 2
Total 80 Sus bases en el eje X
horizontal, con el centro en las marcas de clase y longitudes iguales a los
tamaos de clase.
Las ultimas iguales a la frecuencia de clase.
El polgono de frecuencia es una lnea quebrada, se obtiene conectando los puntos

medios de las partes superiores de los rectngulos del histograma. Se acostumbra aadir
las longitudes AM y BN a las marcas de clase extremas asociados a una frecuencia cero.
10
La suma de las reas de los rectngulos del histograma es igual al rea total limitada por
el polgono de frecuencia y el eje X.
Para construir el histograma y el polgono de frecuencia de la tabla 1- 4 se procede as:
a. Se encuentra la marca de clase 1.

76 +98
m 1= =87
2
b. Las marcas de clases siguientes se consiguen as.
mi=mi1+C
mi1=clase anterior
C=tamao de la clase
para el ejemplode las80

m2=87+23=110
probetas sometidas a tension
HISTOGRA MA Y POLIGONO DE FRECUENCIA A BSOLUTA

35
Se construye una grfica X-Y;
30
colocndola en el eje X las marcas de
25 clases y en el eje Y las frecuencias
20 absolutas de cada clase; para el ejemplo
15 de muestra de tamao 80 (n=80)
10 quedando as:
5
0 Tabla 1-4
1 2 3 4 5 6 7 8 9 10
Figura 1-1
1.7.2 Distribucin De Frecuencias Relativa
La frecuencia relativa de una clase es una frecuencia absoluta dividida por la

frecuencia total de todas las clases da como resultado 1, o 100% cuando se
expresa en porcentaje.
Si se sustituyen las frecuencias absolutas de la tabla 1- 4 por sus
correspondientes frecuencias relativas, la tabla resultante se llama una
distribucin relativa o distribucin porcentual.
11
tensin frecuencia relativa

(Psi) (como porcentaje)
76 98 3.75
99 121 8.75
122 144 12.50
145 167 31.55
168 190 25.00
191 213 11.25
214 236 5.00
237 259 2.50
Total 100.00
Tabla 1-5
La representacin grfica de la
tabla 1-5, es un histograma y
polgono de frecuencias relativas.
Figura 1-2
HISTOGRA MA Y POLIGONO DE FRECUENCIA RELATIVA O PORCENTUA L

35
30
25
20
15
10
0
1 2 3 4 5 6 7 8 9 10
12
1.7.3 Distribucin De Frecuencias Acumulada Absoluta Y Ojiva.

La frecuencia total de todos los valores menores o iguales que el lmite superior
de una clase dada se llama frecuencia acumulada; por ejemplo, la frecuencia
acumulada hasta la clase 122-144 para la muestra de tamao 80 (n=80) de la
aleacin litio aluminio, de la tabla 1-4 es 3+7+10=20, lo que significa que 20
probetas resistieron 144 Psi de tensin o menos. Una tabla que presenta tales
frecuencias acumuladas se llama distribucin de frecuencias acumuladas
absoluta o tabla de frecuencias acumuladas.
tensin (Psi) numero de

menores o igual () probetas
98 3
121 10
144 20
167 45
190 65
213 74
236 78
259 80 Tabla 1-6
Un grfico que recoja las frecuencias acumuladas por debajo de cualquiera de los
formatos de clase superiores respecto de dicha frontera (lmite superior de clase) se
llama un polgono de frecuencia acumulada u ojiva; se acostumbra a iniciar la
grfica con el lmite superior de una clase que tiene frecuencia acumulada cero; si
existiera la clase que 53-75; no existen probetas con resistencias menos o iguales a 75
Psi. Por lo tanto la frecuencia acumulada es cero, para 75 Psi.
13
90
80
70
60
50
40
30
20
10
0
75 98 121 144 167 190 213 236 259
Figura 1-3
1.7.4 Distribucin De Frecuencias Acumulada Relativas Y Ojiva.

La frecuencia acumulada relativa o frecuencia acumulada en porcentajes, es la
frecuencia acumulada dividida por la frecuencia total. As por ejemplo, las
tensiones (Psi) menores o iguales que 167 Psi (para el ejemplo de las probetas)
representan el
45
100 =56.25 .
80
Si se usan frecuencias acumuladas relativas en la tabla 1-6 y en la figura 1-3, la

distribucin resultante se llama distribucin de frecuencias acumuladas relativas
y polgonos de frecuencias acumuladas relativas u ojiva de porcentajes,
respectivamente.
Tensin (Psi) Porcentaje

menores o igual () Acumulado (%)
75 0
98 3.75
121 12.5
144 25.00
167 56.25
14
190 81.25
213 92.50
236 97.50
259 100.00 Tabla 1-7
120
100
80
60
40
20
0
75 98 121 144 167 190 213 236 259
Figura 1-4
1.8 MEDIA, MEDIANA, MODA Y OTRAS MEDIDAS DE LOCALIZACIN O

LOCALIZACIN O TENDENCIA CENTRAL
La presentacin tabular de los datos y graficas de estas tablas pueden mejorar la

representacin de los datos, las descripciones numricas tienen gran valor en el
anlisis de datos estadsticos, en esta seccin se presentan varias medidas numricas
importantes para describir las caractersticas de los datos.
Se llaman medidas de localizacin o tendencias central por que el centro de un

conjunto de datos.
1.8.1 Media
15
La medida ms comn de localizacin o centro de un grupo de datos es el

promedio aritmtico o media, ya que casi siempre se considera a los datos como
una muestra, la media aritmtica se conoce como media muestral.
x 1 , x 2 , x 3,, x n
Si las observaciones de una muestra de tamao n son ,
entonces la media muestral es:
x + x + x ++ x n
X = 1 2 3
n
n
xi
X = i=1
n
EJEMPLO 2
Kgf
Encontrar la media muestral de la resistencia a la tensin (en cm 2 ) de 10
observaciones de un mortero de cemento portland.
Observaciones:
16.85, 16.40, 17.21, 16.35, 16.52, 17.04, 16.96, 17.15, 16.59, 16.57.
X =media
167.64
X =
10
Kgf
X =16.764 2
cm

El valor de la medida, X , es mas proceso que la precisin asociado con cada
observacin, por esto se acostumbra calcular la media con un digito ms que los
utilizados en cada medicin de la muestra.
Si ordenamos las medidas de menor a mayor magnitud, y los ubicamos como
puntos es un eje horizontal x calibrado, en este mismo eje determinamos el valor
de la media ( X =16.764 Kgf

cm )
2 la representacin grfica es un diagrama de
puntos como sigue:
Datos ordenados:
16.35
16.40
16
16.52
16.57
16.59
16.85
16.96
17.04
17.15
17.21

Notndose en la figura 1-4 que la media muestral X =16.764, puede considerarse
como un punto de equilibrio.
Esto significa, que si cada observacin individual representa, por ejemplo, una libra de
masa colocndolo en esos puntos del eje horizontal, un punto de apoyo localizado en
X equilibrara todo el sistema de pesos.
De otra forma la medida es una medida que represente al subconjunto o muestra

observada.
Para los datos de resistencia de la aleacin de aluminio litio de la tabla 1-2, la media
muestral es:
13013
X =
80
lb
X =162.7 2
pul
Si se examina el histograma de la figura 1-1, se observa que la media muestral 162.7 Psi
es un valor tpico de la resistencia a la tensin, ya que este se presenta en la parte
media de los datos, donde se concentran las observaciones.
Una desventaja de la media como medida de tensin central es que puede ser influida
muy frecuentemente por un solo valor extremo y dar una idea distorsionada de los
datos; para entender lo anterior, supongamos que las observaciones de muestra de
tamao 7 (n=7) son las siguientes:
1, 3, 4, 2, 7, 2450, 8
Luego la medida es:
1+3+ 4+2+7 +2450+8

X =
7
17
X =353.57
En este caso, es evidente que la media muestral no dice mucho con respecto a la
tendencia central de la mayor parte de los datos.

Cuando se agrupan la media ( X ) se coloca la mediante la siguiente frmula:
mi f i
X = i=1
n
mi=marca de clase de la clase i
f i =frecuencia de clase de laclase i
Tambin es posible pensar en el clculo de la media para todas las observaciones de una
poblacin, este promedio se conoce como media poblacional y se simboliza con la letra
griega (miu). Cuando existe un mnimo finito de observaciones (N) la media es:
N
xi
= i=1
N
En muchas aplicaciones prcticas de la estadstica a problemas de la ingeniera, no se

conoce la media y es imposible (o poco prctico) examinar a todos los miembros de
una poblacin (n ); en los conjuntos sobre inferencia estadstica se presentan
mtodos para hacer referencias sobre la medida poblacional, con base en la medida

muestral, en ellos se emplean la media muestral ( X ) como punto de prctica para
estimar .
1.8.2 Mediana
La segunda medida de tendencia central estudiada es la mediana.

La mediana es la mitad de una muestra o poblacin cuyos valores estn
ordenados en el orden de magnitud; es decir arreglar los valores del ms
pequeo al ms grande o del ms grande al ms pequeo.
18
x 1 , x 2 , x 3,, x n
Sean los valores de una muestra acumulada en orden creciente
x1 x2
de magnitud; esto es es la segunda observacin ms pequea, es la
xn
segunda observacin,, es la observacin ms grande. Entonces, la
~ n+1
mediana X se define como el elemento que este en la posicin si
2
n es impar, o el promedio entre las observaciones ubicadas en las posiciones

n n
+1
2 y 2 si n es par. En trminos matemticos seria:
Una ventaja de la mediana es que los valores extremos no tienen mucha de influencia
sobre ella.
EJEMPLO 3
Supongamos que las observaciones de una muestra son
1, 3, 4, 2, 7, 6 y 8
La media es muestral es:
1+3+ 4+2+7 +6+8

X = =4.43 n=7 ( impar )
7
La media ser
1 2 3 4 6 7 8
x1 x2 x3 x4 x5 x6 x7
19
X n +1 =X 7 +1 =X 8 = X 4
2 2 2
~
X=mediana=X 4=4.0
La media muestral es 4.43, mientras que la mediana muestral es 4.00; ambas cantidades
proporcionan una medida razonable de la tendencia central de los datos. Ahora
supngase que en los datos originales se cambia el 6 por 2450, al ordenarlos quedara
as
1 2 3 4 7 8 2450
x1 x2 x3 x4 x5 x6 x7
~
La mediana sigue igual X = 4.00, para estos datos la media es
1+2+3+ 4+7 +8+2450

X = =353.57
7
La media muestral X
=353.57 no dice mucho con respecto a la tendencia central de
~
datos, la mediana sigue siendo X =4.00, y esta es una medida de tendencia mas
significativa para la mayor parte de la observaciones.
EJEMPLO 3.
Supngase que las calificaciones de 10 alumnos son:
0 91 92 93 94 95 95 96 97 98
x1 x2 x3 x4 x5 x6 x7 x8 x9 x 10
n =10 (par)
X =X 10 =X 5 =94
2
X n =X 10 = X 6=95
+1 +1
2 2
La mediana es:
20
~ x + x 94 +95
X= 5 6 = =94.5
2 2
La media es:
0+ 91+92+93+ 94+95+ 95+96+ 97+98

X = =88.1
10
Si usted fuera profesor de esta clase que medida de tendencia central prefiriera
informar como el comportamiento general de la clase: la mediana 94.5 o la media 88.1?
1.8.3 La Moda
La moda es la observacin que se presenta con mayor frecuencia en la muestra; un
grupo de datos puede no tener ninguna moda o tener ms de una.
Esto no ocurre con la media y la mediana, medidas que para un conjunto de datos,
siempre existen y son nicas. La moda no es una medida muy utilizada.
EJEMPLO 4
Encontrar para las siguientes muestras:
Muestra # 1.
3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1
Muestra # 2.
3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1, 6, 2, 5, 6
Solucin:
Se procede a ordenar la
muestra # 1 en orden de magnitud:
1, 3, 3, 3, 3, 4, 5, 6, 6, 8, 9, 10.
^
X =3.0
El dato que ms se repite es el 3, ocurre cuatro veces, por lo tanto la moda es
21
Muestra # 2 ordenada en orden de magnitud:
1, 2, 3, 3, 3, 3, 4, 5, 5, 6, 6, 6, 6, 9, 8 10
Para esta muestra, las modas son 3 y 6, ya que ambos valores se presentan el mismo
nmero de veces, cuatro y ninguno otro lo hace con mayor frecuencia. En este caso se
dice que los datos son bimodales .
Tanto la mediana como la moda se puede calcular para datos agrupados las formulas son
las siguientes:
n
^
X =MEDIANA=LI R MEDIANA +
2 i
f
f MEDIANA(C )
Dnde:
LI R MEDIANA =lmite superior real de la clase mediana
n=tamao de clase
f i=frecuencia acumulada de las clasesinferiores a la clase mediana.
C=ancho de la clase de la mediana
1
^
X =MODA LIR MODAL= ( 1 + 2 )
C
Dnde:
LI R MODAL=Limite inferior real de laclase modal
1 =Exceso de la frecuencia modal sobre la clase inferior inmediata .
2=Exceso de la clase modal sobre la clase superior inmediata.
EJEMPLO 5.
22
Partiendo de los datos agrupados de la muestra de tamao 80 (n=8 ), de la aleacin

aluminio-litio de la tabla 1-4.
Encontrar:
a) La media para datos agrupados.

b) La mediana para datos agrupados.
c) La moda para datos agrupados.
Solucin:
Tensin Nmero de unidades Frecuencia mi

( psi ) ( probetas ) f a Acumulada
Marca de clase
76 - 98 3 3 87
99 121 7 10 110
122 144 10 20 133
145 167 25 45 156
168 190 20 65 179
191 -213 9 74 202
214 -236 4 78 225
237 -259 2 80 248
Tabla 1-8
TOTAL 80
a.
n
mi f i
^
X = i=1
n
^ 75014
X= =937.675
80
b.
23
n 80
= =40
2 2
^ ( 4020 )
X =144.5+ 23=162.90
25
c.
15
^
X =144.5+ ( 15+5 ) 23=161.75
1.8.4 Percentiles Y Cuartiles

La mediana (ya sea de una poblacin o de una muestra) divide los datos en dos partes
iguales. Tambin es posible dividir los datos en ms de dos partes. Cuando se divide de
un conjunto ordenado de datos en cuatro partes iguales, los puntos de divisin se
q1 ,
conocen como cuartiles. El primer cuartil, o cuartil inferior, es un valor que
tiene aproximadamente la cuarta parte (25%) de las observaciones por debajo de l, y el
q2
75% restante, por encima de l. El segundo cuartil, tiene aproximadamente la
mitad (50%) de las observaciones por debajo de l. El segundo cuartil es exactamente
q
igual a la mediana. El tercer cuartil, o cuartil superior, 3 tiene aproximadamente las
tres cuartas partes (75%) de las observaciones por debajo de l. Al igual que en el caso
de la mediana.
EJEMPLO 6
Partiendo de los datos agrupados de la muestra de tamao 80 (n=80), de aleacin

q1 , q3 p50
aluminio-litio de la tabla 1-4. Encontrar los cuartiles y los percentiles y
p80.
24
Tensin Nmero de unidades

(psi) (probetas)
76 98 3
99 121 7
122 144 10
145 167 25
168 190 20
191 213 9
214 236 4
237 259 2
TOTAL 80
Tabla 1-9
Solucin:
a. Se busca en que clase o categora se indica el primer cuarto de los datos, es

n
=20
decir ( 4 ) de los datos, sumando las frecuencias absolutas desde la
primera clase hasta donde sea necesario.

(3 + 7 + 10) = 20, el cuartil se encuentra en la tercera clase.
n
q =LI R +
( 4
f )
c
i 3
fq 1
Calculamos el lmite inferior real:
122121
LI R3= =121.5
2
f =3+7=10
f q =10
Por lo tanto, 1
y C = 23
Entonces:
25
80
q =121.5+
( 4
10 )
23
1
10
q1 =144.5
3
n
b. Se busca la clase donde se ubique los 4 de los datos.
3n
=3 ( 20 )=60
4
( 3+7+10+25+ 15 )=6
168167
LI R3= =167.5
2
3n
q =LI R +
( 4
f )
c
3 5
fq 3
(6045 )
q3 =167.5+ 23=184.75
20
c. para encontrar los porcentajes se dividen los datos en centsimas partes
( 100n ) , y se aplica el mismo procedimiento de los cuartiles
p50=?
( 100n )=( 100

80
)=0.80
26
50 ( 100n )=50 ( 0.80 )=40

(3+7+10+ 20)=40
50 n
100
f
p50=Li R 4 + C
f p50
4020
p50=144.5+ .23=162 g
25
145+ 144
Li R4 = =144.5
2
d.
p80=?
80 ( 100n )=80 ( 0.80)=64

80 n
f
100
p80=Li R S + C
f p80
6045
p80=167.5+ .23=189.35
20
168+167
Li R S= =167.5
2
1.9 MEDIDAS DE VARIABILIDAD
27
Se denominan medidas de tendencia central, aquellas que no solo proporcionan

generalmente una descripcin satisfactoria de un conjunto de datos. Al menos estn
interesados en los datos que desean con frecuencia tener tambin una medida de la
manera en que los valores individuales se desvan del promedio. A sta clase de
medidas se les conoce como MEDIDAS DE VARIABILIDAD la variabilidad
tambin es denominada dispersin.
1.9.1Rango
Una de las medidas ms sencillas de variabilidad es el rango de la muestra, y se define
como la diferencia entre la observacin grande y la pequea. La forma ms comn es:
R= X maxX min
Donde
X max = grande observacin
X min = pequea observacin
La facilidad de clculo del rango de una muestra es evidente, sin embargo ste ignora
toda la informacin que hay en la muestra entre la observacin ms grande y la ms
pequea. Por ejemplo, si tenemos las siguientes muestras:
MUESTRA1 1,3,5,8,9 R 1=91=8
MUESTRA 2 1,5,5,5,9 R 2=91=8
n = 5 (tamao de la muestra)
Las dos muestras tienen el mismo valor de rango, sin embargo, en la segunda muestra
solo existe variabilidad en los valores extremos, a diferencia que en la primera muestra
R1
el cambio se nota en los tres intermedios (esto no lo capta el )
Los valores extremos no son tan pequeos al aparecer en las muestras pequeas y s en
las muestras grandes, en consecuencia, muestras pequeas tienden a tener rangos
pequeos y los grandes rangos grandes.
Para muestras pequeas (n <= 10), la perdida de informacin no es tan relevante; en

control de calidad estadstica las muestras son de tamao cuatro o cinco,por lo tanto se
aconseja el rango como medida de variabilidad.
28
En general, lo que se desea es tener una medida de variabilidad que depende de todas
las observaciones y no de una pequea parte, como ocurre con el rango.
1.9.2Varianza
Las limitaciones del rango se pretenden evitar con otras medidas de
variabilidad conocidas como varianza y desviacin estndar.
La desviacin estndar es la raz cuadrada positiva de la varianza.
La varianza se puede calcular para la muestra o para toda la poblacin, cuando esta es
infinita y est formada por N variables, las frmulas adecuadas son:
n n n
( x ix )2 n x i2 ( xi ) 2
2 i=1 i=1 i =1
S= =
n1 n ( n1 )
xi
N
2
i=1

N
N x i2
i =1
N
( x i )2
2= i=1 =
N
S 2=varianza muestral de datos no agrupados
2=varianza poblacional de datos no agrupados
( mix )2
S 2= i=1 f i varianza muestral para datosagrupados
n1
29
fi
k
mi2 2
i =1

k
n mi2 f i
i=1
S2 =
( mi )2
2= i=1 f i varianza poblacinal para datos agrupados
N
fi
k
mi 2
i=1

k
N mi2 f i
i=1
2=
Las unidades de medicin de la varianza son iguales al cuadrado de las unidades con
que se mide la variable. De esta manera, si X se mide en lbs, las unidades de S2 y 2 ,
2
ser lbs la desviacin estndar tiene la ventaja de medirse en las unidades
originales de la variable de inters, X
EJEMPLO 7
Dos mquinas en una lnea de produccin producen el mismo artculo, la produccin

para cada una es de 100 unidades. Un inspector de control de calidad desea conocer la
variabilidad de cada mquina; para esto establece la diferencia en centmetros entre el
largo de la pieza producida, contra el largo de la pieza prototipo, como variable de
control.
X i=largo de la pieza prototipolargo de la pieza producida
La mquina A dio los siguientes resultados:
30
Xi # de piezas mi2 f i mi f i
1 30 30 30
2 40 160 80
3 30 270 90
Totales 100 460 200
La mquina B dio los siguientes resultados:
Xi # de piezas mi2 f i mi f i
0 20 0 0
1 10 10 10
2 30 120 60
3 30 270 90
4 10 160 40
Totales 100 560 200
Solucin:
Si encontramos la medida y la varianza de la maquina A

k
mi f i 1 ( 30 ) +2 ( 40 )+3 (3)
A= i=1 = =2.0 cm
N 100
fi
k
mi 2
i=1

k
2
N mi f i
i=1
2A=
Si encontramos la media y la varianza de la maquina B
0+10+ 60+90+ 40 200

B= = =2.0 cm
100 100
2
100 (560 )( 200)
2B= 2
=1.6 cm 2
100
31
Para las dos mquinas las piezas tienen un promedio 2.0 cm de diferencia por debajo
con respecto al patrn o prototipo, pero la mquina B exhibe una mayor variabilidad.
2B > 2A 1.6 cm2 >0.6 cm2
1.9.3Coeficiente De Variacin
En ocasiones es deseable expresar la variacin como una funcin de la media.
Para hacer esto se utiliza una medida adimensional de la variacin relativa,
denominada coeficiente de variacin muestral.
El coeficiente de variacin muestral es:
S
CV = o CV =
X u
El coeficiente de variacin es til cuando se compara la variabilidad de dos (2) o ms

conjuntos de datos que difieren de manera considerable en la magnitud de las
observaciones.
EJEMPLO 8:
Con un micrmetro, se realizan mediciones del dimetro de un tornillo, que tiene una
media 4.03 mm y una desviacin estndar de 0.012 mm; con otro micrmetro se toman
mediciones de la longitud del tornillo, la media de la longitud es de 1.76 pulgadas y una
desviacin estndar de 0.0075 pulgadas.
Los coeficientes de variacin son:
0.012 mm
CVd= =0.0030
4.03 mm
0.0075 pulg
CVi= =0.0043
1.76 pulg
CVd <CVi
0.0030<0.0043
En consecuencia, las mediciones hechas con el primer micrmetro exhiben una

variabilidad relativamente menor que las efectuadas con el otro micrmetro.
32
1.9.4 Medidas De Asimetra Y Apuntamiento

Los conceptos de asimetra (sesgo) y apuntamiento hacen referencia a la comparacin
de la obtenida (polgono de frecuencia) con los datos provenientes de la muestra (n) y
una curva terica o normal, observada en la mayora de los fenmenos naturales, en
especial cuando el nmero de observaciones es grande.
Una distribucin es simtrica, cuando la media, la mediana y la moda son iguales, es

decir, cuando su polgono de frecuencia tiene su simtrico o normal, en este caso sus
dos colas son iguales.
Media=Mediana=Moda
X =~
X= ^
X
Pero si la distribucin unidimensional tiene una cola ms larga hacia uno de los lados,
se dice que es asimtrica a deforme. Si la deformacin o alargamiento de la cola se
presenta hacia valores ms grandes de la variable, es decir, hacia la derecha se dir
Que la distribucin es asimtrica positiva, en caso contrario la asimetra ser negativa.
Simtrica
~
Asimtrica positiva Asimtricanegativa X = X= ^
X^ X~ X~
X X X ^ X
33
1.9.4.1Sesgo
Se conoce como sesgo al grado de asimetra de una distribucin, es decir cunto se
aparta de la simetra.
La asimetra os sesgo se representa por

n k
3 3
m3 ( X i X ) mi ( X i X )
As= 3
m3= i=1 m3= i=1
S n n
Momento 3 con respecto a la Momento 3 con respecto a la

media para datos no agrupados media para datos agrupados
A =0
La curva normal es el referente terico y no tiene sesgo ( s ) ; entonces el sesgo de
una distribucin puede ser:
> 0 asimtrica positiva
A s = = 0 simtrica
< 0 asimtrica negativa
1.9.4.2 Apuntamiento
Es tambin conocido como curtosis y permite establecer el grado de apuntamiento o
A p=3
achatamiento de la curva o polgono de frecuencia; la curva normal tiene ; la
frmula es:
A p=apuntamiento
n k
4 4
( X i X ) f i ( X i X )
m4= i=1 m4= i=1
n n
m4
A p=
S4
>3
A p= = 3
34
<3
Para el ejemplo de la aleacin aluminio-litio
Tension Numero Frecuencia

Psi de Absoluta mi Fi(mi -X )3 Fi(mi -X )4
probetas Acumulada
(Fi)
76 - 98 3.00 3.00 87.00 1,326,699.0 101,077,885.1
7 4
99 - 7.00 10.00 110.0 1,053,238.6 56,019,128.70
121 0 1
122 10.00 20.00 133.0 -275,094.21 8,304,406.36
144 0
145 25.00 45.00 156.0 -9,282.68 66,719.29
167 0
168 20.00 65.00 179.0 79,073.62 1,250,351.59
190 0
191 9.00 74.00 202.0 526,207.90 20,423,444.03
213 0
214 4.00 78.00 225.0 944,689.13 58,393,596.84
236 0
237 2.00 80.00 248.0 1,220,139.7 103,483,106.0
259 0 9 7
105,795.87 349,018,638.0
2
Tabla 1-8
105798.87
m 3= =1313.46 m4=349018638.02
80
m3 1313.46
S 2=1213.27 S=34.83 sesgo= 3
= =0.03
S ( 34.83 )3
m4 349018638.02
curtosis= 4
=
S ( 34.83 )4
35
El sesgo para el ejemplo de la aleacin litio-aluminio nos indica que el polgono de

frecuencias es bastante simtrico con una ligera hacia la derecha y el apuntamiento o
curtosis es casi 3. (Ver Figura 1-1)
1.9.4.3Conceptos Importantes Y Terminologa
Estadstica Distribucin de frecuencia

Estadstica descriptiva acumulada relativa
Estadstica inferencial Polgono de frecuencia
Variable Media
Variable aleatoria Mediana
Variable contina Moda
Variable discreta Varianza
Variable cuantitativa Cuartiles
Variable cualitativa Percentiles
Poblacin Muestra Coeficiente de variacin
Distribucin de frecuencia Sesgo
absoluta Curtos
Distribucin de frecuencia
acumulada absoluta
36

Probabilidad y Estadistica CAPITULO 1

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Probabilidad y Estadistica CAPITULO 1

Hochgeladen von

Copyright:

Verfügbare Formate

CAPTULO 1.

Conceptos generales de probabilidad

El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y

1.2 DIVISIN DE LA ESTADSTICA

La estadstica para su estudio se divide en dos grandes (2) rama:

1.2.1 Estadstica Descriptiva

Tiene como finalidad colocar en evidencia aspectos caractersticos (promedio,

1.2.2 Estadstica Inferencial

Busca dar explicaciones al conjunto de observaciones, prueban la significacin o

1.3 CONCEPTOS BSICOS DE LA ESTADSTICA

Daremos a conocer solamente el vocabulario estadstico bsico, los dems trminos

Es el conjunto de las caractersticas de las entidades que interesan en una

1.3.2.1 Variable cuantitativa

1.3.2.1.1 Variable Cauntitativa Continua

Una variable continua es aquella que teoricamente pueden tomar cualquier

1.3.2.1.2 Cuantitativa Discreta Variable

1.3.2.2 Variable cualitativa

1.3.3 Poblacion o Universo

Conjunto de valores de alguna variable aleatoria relacionado con un conjunto de

Una muetra es una parte de la pablacion o universo .

desanimarnos a intentar investigarla en su totalidad.

1.4 ETAPAS EN UNA INVESTIGACION ESTADISTICA

Al definir la entidad en la etapa III se debe tener en cuenta:

Seleccionar las variables a medir (cuantitativos y cualitativas) y definirlas

En la etapa Vsi la investigacion es parcial establecer el tamao de la mustra.

Esquematizacion le etapa III con sus variables

a. Si el digito que queda a la derecha de la posicion del ultimo digito que se

Esquematizando los numerales a, b, c

n digito a la derecha del digito a retener

resultados finales o intermedios resultados registrados

1.6.1 Intervalo De Clase Y Limites De Clases

El limete superior de la primera calse se calculara con la siguiente formula:

LS C1 : limete superior de la primera clase

LI C 1 : limete inferior de la primera clase

1.7 REGLAS GENERERALES PARA ELABORAR DISTRIBUCIONES DE

X max = dato mayor

X min = dato menor

III. Establecer el minimo aproximado de categoria o clase (M) que tendra la

V. construir una tabla de conteo de la forma siguiente:

el limite superior de la primera clase sera

VI. los limites inferiores y superiores de las clases se obtienen sumando C al

LI C 2=LI C 1+C , LI C3 =LI C2 +C , , LI C n=LI Cn1 +C

LS C2 =LS C1 +C , LS C 3=LS C 2+C , , LS C n=LS C n1+ C

clase conteo frecuancia absoluta

Total Tabla 1-1

105 221 183 186 121 181 180 143

218 157 101 171 165 172 158 169

Sigiendo las reglas para elaborar distribuciones de frecuancia:

Fila Mayor Menor

Posteriormente se determina el Rango

III. Establecer el numero aproximado de categorias o clases

n=80 tamao de lamuestra

IV. Encontrar el tamao de la clase

V. Emcontrar los limites inferiores y superiores de la primera clase o

LI C 1=X min =76

VI. Construir los limites inferiores y superiores de las categorias o clases

Las demas clases se construyen siguiendo la formula:

LI C i=LI C i1+C LS Ci=LS C i1+ C

VII. La tabla de conteo quedara asi:

Clases Conteo Frecuencia Absoluta

1.7.1 Distribucin De Frecuencia Absoluta, Histograma De Frecuencia

Tensin (Psi) Nmero De

El polgono de frecuencia es una lnea quebrada, se obtiene conectando los puntos

Para construir el histograma y el polgono de frecuencia de la tabla 1- 4 se procede as: