Sie sind auf Seite 1von 27

INGENIERÍA EN MECATRÓNICA

MATERIA
ESTADÍSTICA Y CONTROL DE CALIDAD

CATEDRÁTICO
M.C. MIGUEL ANGEL MELCHOR
NAVARRO

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 1


INTRODUCCIÓN
• “Algún día el conocimiento estadístico
será tan necesario para ser un buen y
eficiente ciudadano, como lo es la
aptitup de leer” (1900, H. G. Wells)

“La educación estadística debería de comenzar antes


de la preparatoria” (W. Edwards Deming)

La estadística puede entretener, aclarar,


alarmar
M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 2
DEFINICIONES DE
ESTADÍSTICA
 Es una área de la ciencia que se ocupa de la extracción de información a
partir de datos numéricos y su uso en las inferencias acerca de una
población de la cual se obtienen los datos. La estadística es capaz de
evaluar la exactitud de dichas inferencias.
 Es la ciencia que se encarga de recolectar, organizar, presentar, analizar
e interpretar datos para ayudar en una toma de decisiones más efectiva.
 Conjunto de métodos científicos ligados a la toma, organización,
recopilación, presentación y análisis de datos, tanto para la deducción de
conclusiones como para tomar decisiones razonables de acuerdo con
tales análisis.
  Arte de la decisión en presencia de incertidumbre.
  Ciencia que sirve para demostrar que dos personas han comido 1/2
pollo cada una, cuando en realidad una ha comido uno y la otra ninguno.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 3


IMPORTANCIA DE LA
APLICACIÓN DE LA
ESTADÍSTICA
• Casi diariamente utilizamos los conceptos estadísticos en todas las
facetas de nuestras vidas. Por ejemplo:
– Para comenzar el día uno abre la llave del baño para sentir la temperatura del
agua y decidir si añade más agua caliente o agua fría, o que la temperatura
es la correcta y se pone debajo de la regadera.
– La compañía Kellogs debe asegurarse de que la cantidad promedio de Raisin
Bran en el paquete de 25.5 gramos cumpla con las especificaciones de la
etiqueta. Para hacerlo seleccionan muestras periódicas del área de
producción y pesan el contenido.
– A nivel nacional, un candidato a la presidencia de los E.U. desea saber el
porcentaje de electores en el Estado de Illinois que lo apoyaran en la cercana
elección.
– La gerencia debe tomar decisiones sobre la calidad del producto. Por ejemplo,
los taladros automáticos no hacen un barreno perfecto que siempre tenga
1.30pulg de diámetro cada vez que se taladra (a causa de desgaste de la
broca, vibración de la máquina y otros factores). Hay ciertas tolerancias
permitidas pero cuando el barreno es demasiado pequeño o demasiado
grande, la producción es defectuosa y no se pueden utilizar los productos.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 4


CLASIFICACIÓN DE LA
• Estadística
ESTADÍSTICA
Descriptiva e Inductiva
Estadística Descriptiva. Presenta la información proporcionada por un
conjunto de datos u observaciones en forma conveniente, útil y
comprensible. Esto se logra:
a) Organizando los datos (tabla de distribución de frecuencias).
b) Presentando los datos en forma gráfica (histograma, polígono de frecuencias).
c) Analizando los datos (medidas de tendencia central y de dispersión).
Estadística Inductiva (Inferencia Estadística). Conjunto de métodos
utilizados para saber con cierta certeza algo de una población,
basándose en una muestra. De la misma manera se ocupa de
generalizar la información que proporciona la estadística descriptiva.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 5


CONCEPTOS DE POBLACIÓN Y
MUESTRA ALEATORIA
• Población. Conjunto completo de individuos, objetos o medidas que
poseen alguna característica común observable.
• Muestra aleatoria. Es un subconjunto de la población.
En la estadística tiene un papel destacado la noción de Muestra aleatoria.
Una muestra aleatoria de tamaño n es:
– Una colección de n variables aleatorias.
– Todas con la misma distribución.
– Todas independientes.
– Esta definición idealiza la operación de repetir n veces la observación de la
misma variable aleatoria, siendo las repeticiones independientes una de otra.
La colección de donde extraemos la muestra aleatoria, se denomina
población. Nuestra intención al tomar una muestra, es la de hacer
inferencia. Este término lo usamos en estadística para denotar al
procedimiento con el que hacemos afirmaciones acerca de valores
generales de la población mediante los números que observamos en la
muestra.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 6


¿PORQUÉ SE TOMA UNA MUESTRA
EN VEZ DE ESTUDIAR A CADA
MIEMBRO DE LA POBLACIÓN?
1. Una muestra de electores registrados es necesaria
por el alto costo que representaría comunicarse con
millones de electores antes de una elección.
2. Al someter a una prueba el contenido de humedad
en el trigo, se destruye el mismo, por lo tanto el
tomar una muestra es de suma importancia.
3. Si los catadores de vino lo probaran todo, no habría
vino disponible para su venta.
4. Etc.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 7


EJEMPLO DE UNA MUESTRA
ALEATORIA

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 8


CONCEPTO DE ESTIMADOR
ESTADÍSTICO
• A un valor calculado con los datos de una muestra lo llamamos ESTADÍSTICA.
Cuando usamos una estadística para jugar el papel de decir,
aproximadamente, el valor de un parámetro de la población, le llamamos
ESTIMADOR ó ESTIMADOR PUNTUAL (al decir ``puntual'' queremos decir que
para estimar el parámetro estamos usando un valor único).
• Algunos estimadores insesgados:
– La proporción muestral como estimador de la proporción poblacional.
– La media muestral como estimador del valor esperado poblacional.
– La varianza de la muestra como estimador de la varianza de la población.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 9


CARACTERÍSTICAS
PROBABILÍSTICAS DE UN
• Cuando se
ESTIMADOR
tiene una fórmula para estimar y se aplica a una muestra
aleatoria, el resultado es aleatorio, es decir los estimadores son variables
aleatorias. Como cualquier variable aleatoria, el estimador tiene
– distribución de probabilidad.
– valor esperado.
– desviación estándar / varianza.
Valor esperado de un estimador y sesgo
El valor esperado de un estimador nos da un valor alrededor del cual es
muy probable que se encuentre el valor del estimador. Ya que es muy
probable que el valor del estimador esté cerca de su valor esperado, una
propiedad muy deseable es que ese valor esperado del estimador
coincida con el del parámetro que se pretende estimar. Al menos,
quisiéramos que el valor esperado no difiera mucho del parámetro
estimado.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 10


CARACTERÍSTICAS...
• Por esa razón es importante la cantidad que, técnicamente
llamamos sesgo. El sesgo es la diferencia entre el valor esperado
del estimador y el parámetro que estima.
Si el sesgo es 0, se dice que el estimador es insesgado y ésta es
una característica buena para un estimador. Un estimador que es
insesgado tiene una alta probabilidad de tomar un valor cercano al
valor del parámetro.
Varianza de un estimador
 Otra propiedad importante de un estimador es su varianza (o su
raíz cuadrada, la desviación estándar).
 La importancia de la desviación estándar es que nos permite darle
un sentido numérico a la cercanía del valor del estimador a su
valor esperado.
 Entre menor sea la desviación estándar (o la varianza) de un
estimador, será más probable que su valor en una muestra
específica se encuentre más cerca del valor esperado. Cuando un
estimador tiene una varianza menor que otro decimos que el
estimador es más eficiente.
M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 11
CLASIFICACIÓN DE LAS
VARIABLES
Datos

Cualitativos o Cuantitativos o
de atributo numéricos

ejemplos:
tipo de auto que posee
color de plumas
genero Discretos Continuos

número de hijos peso de un cargamento


número de empleados millas recorridas entre cambios de aceite
número de televisores distancia entre Salamanca y Celaya

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 12


CONCEPTOS DE LAS VARIABLES
ALEATORIAS DE LA ESTADÍSTICA
• Variable aleatoria continua. Es aquella variable que
puede tomar todos los valores posibles dentro de un rango
o intervalo (finito o infinito) de números reales, cuando la
variable que se mide se expresa en estos términos decimos
que su distribución de probabilidad es una distribución
de probabilidad continua.
• Variable aleatoria discreta. Es aquella variable que sólo
puede tomar ciertos valores, como los números enteros 1,
2,…, cuando la variable que se mide se comporta de la
manera explicada decimos que su distribución de
probabilidad es una distribución de probabilidad
discreta.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 13


ABUSOS DE LA
ESTADÍTICA
• “Hay tres tipos de mentiras: las
mentiras, las malditas mentiras y la
Estadística” (Benjamin Disraeli, hace
más de un siglo)
• “Las cifras no mienten; los mentirosos
las imaginan”
Ambas declaraciones se refieren al abuso
de la Estadística en donde los datos se
presentan en tal forma que pueden
engañar a cualquiera.
M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 14
DISTRIBUCIONES DE
FRECUENCIA

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 15


PORQUÉ
USARLAS?
• Necesidad de resumir la información. Para que los datos sean
útiles deben organizarse para distinguir patrones y tendencias
y llegar así a conclusiones lógicas.
• Una forma de organizar un conjunto de datos es clasificarlos
en categorías o clases y luego contar cuántas observaciones
quedan dentro de cada categoría.
• Para el análisis e interpretación de datos es valioso conocer:
– La forma o patrón de distribución de los datos
– La posición de la distribución: alrededor de qué valor se tienden
a concentrar
– los datos
– Variabilidad: la dispersión de los datos alrededor de los valores
centrales
– Ordenamiento o arreglo de los datos en clases o
– categorías indicando para cada una de ellas, el número de
elementos que contiene o frecuencia

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 16


DISTRIBUCIONES DE
FRECUENCIA
• Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases
o categorías y determinar el número de individuos que pertenecen a cada
categoría, a lo que se le llama frecuencia de clase. A una disposición tabular
de los datos por clases, con sus correspondientes frecuencias de clase, se le
conoce como distribución de frecuencia o tabla de frecuencias.

• INTERVALOS DE CLASE Y LÍMITES DE CLASE


 El símbolo que define una clase, como el 60–62 se llama intervalo de clase. A los
números 60 y 62 se les conoce como limites de clase; el numero mas pequeño (60) es el
limite inferior de clase, mientras que el numero mas grande (62) es el limite superior de
clase. Se acostumbra usar los términos clase e intervalo de clase indistintamente,
aunque el intervalo de clase es en realidad un símbolo de la clase.
 A un intervalo de clase que, por lo menos teóricamente, no tiene límite de clase inferior
o límite de clase superior se le llama intervalo de clase abierto. Por ejemplo, en grupos
de edades de individuos, el intervalo de clase “65 años a mas” es un intervalo de clase
abierto” .

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 17


FRONTERAS DE CLASE
• Si se miden estaturas con exactitud de 1 pulg., en
teoría el intervalo de clase 60–62 incluye todas las
medidas desde 59.5000 hasta 62.5000 pulg. Estos
números, indicados brevemente por los números
exactos 59.5 y 62.5 se llaman fronteras de clase o
limites verdaderos de clase; el numero menor (59.5) es
la frontera inferior de clase y el numero mayor (62.5),
la frontera superior de clase.
• En la práctica, las fronteras de clase se obtienen
promediando los límites superior e inferior de un
intervalo de clase. Algunas veces se emplean las
fronteras para simbolizar clases. Por ejemplo, las clases
en la primera columna de la tabla se podrían indicar
mediante 59.5–62.5, 62.5–65.5, etcétera.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 18


CONTINUA…
• TAMAÑO O AMPLITUD DE UN INTERVALO DE CLASE.
• El tamaño o la amplitud de un intervalo de clase es la diferencia
entre las fronteras de clase inferior y superior y se le conoce como
amplitud, tamaño o longitud de clase. Si todos los intervalos de
una distribución de frecuencia son de la misma amplitud, a esta
amplitud común se le denota por c. En tal caso, c es igual a la
diferencia entre dos limites inferiores (o superiores) de clases
sucesivas. Por ejemplo, la amplitud del intervalo de clase es c =
62.5–59.5=65.5–62.5=3.
• MARCA DE CLASE
• La marca de clase, que es el punto medio del intervalo de clase,
se obtiene promediando los límites inferior y superior de clase. De
este modo, la marca de clase del intervalo 60–62 es (60+62)/ 2 =
61. A la marca de clase también se le denomina punto medio de
clase.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 19


REGLAS GENERALES PARA
CONSTRUIR DISTRIBUCIONES
DE FRECUENCIA.
1. Determinar el número mayor y el menor en los datos sueltos con el
fin de especificar el rango (la diferencia entre ambos).
2. Dividir el rango en un número adecuado de intervalos de clase del
mismo tamaño. Si esto no es posible, usar intervalos de clase de
distintos tamaños o intervalos de clase abiertos. Se suelen tomar
entre 5 y 20 intervalos de clase, según los datos. Los intervalos de
clase se eligen también de modo tal que las marcas de clase (o
puntos medios) coincidan con los datos realmente observados. Ello
tiende a disminuir el llamado error de agrupamiento que se
produce en análisis matemáticos posteriores. No obstante, las
fronteras de clase no debieran coincidir con los datos realmente
observados.
3. Determinar el número de observaciones que corresponden a cada
intervalo de clase; es decir, hallar las frecuencias de clase.

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 20


EJEMPLO
22 30 33 35 38 40 45 49
22 30 33 35 38 41 45 50
23 30 33 35 38 41 45 50
24 30 34 35 38 42 46 52
25 30 34 36 38 42 46 52
26 30 34 36 38 42 47 52
26 30 34 36 39 42 47 52
26 31 35 37 39 43 47 53
27 31 35 37 39 43 47 53
27 31 35 37 40 43 47 54
27 31 35 37 40 44 48 55
28 31 35 38 40 44 48 61
28 32 35 38 40 45 48 62
28 32 35 38 40 45 49 64
29 33 35 38 40 45 49 72

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 21


• Conclusiones obtenidas de estos datos:
– Visita máxima: 72
– Visita mínima: 22
– Amplitud general: 50
– Mayoría de valores está entre 30 y 50
• Una visión más clara se puede obtener
– construyendo una distribución de frecuencias.
– Requiere definir:
• Valor de inicio de la primer clase
• Amplitud o intervalo a usar
• Conociendo ambas queda definida la cantidad de
clases a construir

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 22


EL NÚMERO DE

CLASES
Depende de la cantidad de datos u observaciones y de la amplitud general
• Muchas observaciones permiten un mayor número de clases
• Pocos datos no conviene hacer muchas clases
• Buscar un balance entre necesidad de resumir la información y mantener
suficientes detalles para
• apreciar las características de los datos
• Partir de la amplitud general y probar con diferente número de clases hasta
alcanzar un número
• de clases y un intervalo adecuado (rango / # clases)
• Decidir si usar clases iguales o desiguales
• El número de clases recomendable está asociado con la cantidad de datos.

• Clases abiertas:
– Ubicadas al principio o al final de la distribución de frecuencias,
– Necesarias cuando unos pocos datos se alejan mucho de la mayoría (hacia arriba o hacia
abajo),
– Evitar construir clases intermedias vacías (para clases de igual amplitud)
• Recomendaciones:
– Las clases deben ser exhaustivas y mutuamente excluyentes
– Procurar que el número de clases oscile entre 5 y 10
– Evitar, hasta donde sea posible, clases de diferente amplitud
M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 23
COMPONENTES DE LA
DISTRIBUCIÓN DE
• FRECUENCIAS ABSOLUTAS: FRECUENCIAS
Número de elementos u observaciones pertenecientes a una misma
clase.
• FRECUENCIA RELATIVA:
Se obtiene dividiendo la frecuencia absoluta por el número de
observaciones. Denota la importancia de la clase, al expresarse
en términos porcentuales. Facilitan el análisis de los datos, en
especial para comparar distribuciones de frecuencias basadas en
diferentes número de observaciones
• FRECUENCIA ACUMULADA
Número de observaciones que son menores que el límite superior de
la clase. Se obtiene sumando las frecuencias (absolutas o
relativas) en sentido descendente
• PUNTO MEDIO:
Valor central de la clase. Promedio entre el límite inferior de entre
dos clases
Sucesivas. Es el valor representativo de la clase
M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 24
CLASIFICACIÓN VISITAS DIARIAS AL SITIO
WEB ESTUDIOS SOBRE DIVERSIDAD.
Visitas Punto PRIMER
Frecuencia CUATRIMESTRE
Acumulada 2007.
diarias medio Absoluta Relativa % Absoluta Relativa %

20 -29 25 15 12,5 15 12,5

30 -39 35 54 45,0 69 57,5

40 -49 45 37 30,8 106 88,3

50 -59 55 10 8,3 116 96,7

60 -69 65 3 2,5 119 99,2

70 -79 75 1 0,8 120 100,0

Total 120 100,0

INTERPRETACIÓN:
f3: en 37 días del primer cuatrimestre del 2007 las visitas diarias al sitio WEB estuvieron entre 40 y 49
f%3: el 30.8% de los días del primer cuatrimestre de 2007 las visitas diarias al sitio WEB oscilaron entre 40 y
49 años
F3: 106 días del primer cuatrimestre del 2007 las visitas diarias al sitio WEB fueron 49 visitas o menos
F%3: el 88.3% de los días del primer cuatrimestre del 2007 las visitas diarias al sitio WEB fueron 49 visitas o
menos
M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 25
REPRESENTACIÓN
GRÁFICA
La representación gráfica contribuye a un
mejor análisis de los datos
Facilita la comprensión del fenómeno
considerado
Pierde detalle de información pero se obtiene
otro tipo de información
Gráficos utilizados: histograma, polígono de
frecuencia y ojiva son útiles pues resaltan los
patrones de los datos y atraen la atención

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 26


HISTOGRAMA
• Gráfico de barras verticales, las barras no guardan separación entre sí
• Definidas las escalas en el eje cartesiano se dibuja un rectángulo acorde a la
frecuencia de la clase (altura)
• En clases de igual amplitud las barras son Proporcionales a la frecuencia de la
clase

M.C. MIGUEL ANGEL MELCHOR NAVARRO EYCC-ENERO-2009 27

Das könnte Ihnen auch gefallen