Sie sind auf Seite 1von 9

Tema I: Introducción a la Estadística

Conceptos Básicos de Estadísticas


Estadística para Ingenieros

TEMA I: INTRODUCCIÓN A LA ESTADÍSTICA

Qué es la Estadística:

Estadística es una ciencia que utiliza datos numéricos para obtener inferencias
basadas en el cálculo de probabilidades. Una estadística es también un conjunto de
datos obtenidos a través de un estudio estadístico. Es una rama de las matemáticas y
una herramienta que estudia usos y análisis provenientes de una muestra representativa
de datos, que busca explicar las correlaciones y dependencias de un fenómeno
físico o natural, de ocurrencia en forma aleatoria o condicional.

Tipos de estadística

Se pueden establecer dos tipos de estadística, dependiendo de si utilizan técnicas


descriptivas o inferenciales.

Estadística descriptiva

Se dedica a la descripción, visualización y resumen de datos originados a partir de los


fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Su
objetivo es organizar y describir las características sobre un conjunto de datos con el
propósito de facilitar su aplicación, generalmente con el apoyo de gráficas, tablas
o medidas numéricas.

 Ejemplos básicos de parámetros estadísticos son: la media y la desviación


estándar.
 Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre
otros.

Estadística inferencial

La estadística inferencial es el estudio que utiliza técnicas a partir de las cuales se


obtienen generalizaciones o se toman decisiones en base a una información parcial o
completa obtenida mediante técnicas descriptivas, es decir, que se dedica a la
generación de los modelos, inferencias y predicciones asociadas a los fenómenos en
cuestión teniendo en cuenta la aleatoriedad de las observaciones.

Este tipo de estadística se usa para modelar patrones en los datos y extraer
inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la
forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas
características numéricas (estimación), pronósticos de futuras observaciones,
descripciones de asociación (correlación) o modelamiento de relaciones
entre variables (análisis de regresión). Su objetivo es obtener conclusiones útiles para

1 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

lograr hacer deducciones acerca de la totalidad de todas las observaciones hechas,


basándose en la información numérica obtenida.
Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada, pero
la estadística inferencial, por su parte, se divide en estadística
paramétrica y estadística no paramétrica.

Estadística paramétrica y estadística no paramétrica

La estadística paramétrica es un conjunto de técnicas desarrolladas para niveles altos


de medición. La estadística no paramétrica es un conjunto de técnicas diseñadas para
niveles menores de medición.

Población estadística

Se utiliza este término para referirse a un conjunto de personas, entidades u objetos


sobre el que se pretende obtener cierta información para realizar algún tipo de análisis.

 Población: Es el todo o un conjunto formado por todos los valores existentes, ya


sean personas, medidas u objetos que pueden ser expresados mediante una
variable y además, tienen una característica; de que son de interés estadístico
para un estudio en específico. Al análisis completo de la población también se le
suele conocer como "censo".
 Población finita: Es aquella que expresa que es posible sobrepasarse al contar o
bien, alcanzarse; por lo tanto, es la que tiene o incluye un número limitado ya sea
de objetos, medidas o personas. Por ejemplo: el gasto en comida durante
cierto tiempo, un conjunto de calificaciones o bien, el total de alumnos que
estudian en una universidad.
 Población infinita: Es aquella que incluye a un gran número de conjunto de
observaciones o medidas que no se pueden alcanzar con el conteo. Esto quiere
decir que tiene un número ilimitado de valores, por ejemplo: la producción futura
de una máquina o el lanzamiento de dados o una moneda.
 Muestra: Es aquel subconjunto perteneciente a una población. Esto quiere decir
que se conforma por algunos datos de esta, ya sean ciertos objetos, personas, o
medidas de la población. Al estudio de este concepto se le suele conocer
como "muestreo".
 Muestra representativa: Es aquel subconjunto representativo de una población,
pero para que se consideren así se deben seguir ciertos procedimientos de
selección o bien, un método de muestreo. Se dice que la muestra adecuada es
aquella que contiene características esenciales de la población para lograr el
objetivo de hacer generalizaciones con respecto al total de los datos sin examinar
cada uno de ellos.

2 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

 Muestreo: Procedimiento de selección de las muestras.


 Parámetro: Es la medida de cierta característica numérica de una población que
generalmente se expresa mediante símbolos griegos (μ (mu) ó σ (sigma)).
 Variable: Característica que puede presentar distintas modalidades. Por ejemplo,
la variable "género" solo presenta dos modalidades (mujer y hombre), y la variable
"depresión" presenta un número infinito de modalidades, (las magnitudes de
gravedad con que puede afectar a las personas).
 Constante: Característica que presenta una sola modalidad
 Datos: Son números que representan las modalidades de las variables. Por
ejemplo, el 1 puede representar la modalidad "Mujer", el 6.3 representa una de las
magnitudes que podemos registrar en la variable "grado de conocimiento de las
técnicas estadísticas".

Probabilidad estadística

La probabilidad estadística es una forma de medición de la certidumbre que asociada


a la observación u ocurrencia de un fenómeno o al hecho de que una característica de
un objeto de estudio adopte cierto valor. Se puede simplificar dividiendo el número de
ocurrencias de un hecho entre el número total de casos posibles.

Estadística aplicada

La Estadística aplicada es la rama de la Estadística encargada de realizar inferencias


a partir de una o varias muestras de una determinada población como objeto de
estudio. La Estadística aplicada se utiliza en diversas ciencias, como la Historia, la
Economía, la Educación o la Sociología para realizar estudios y análisis estadísticos.

Función de la Estadística

Las técnicas de análisis estadístico tienen una función general en la investigación


psicológica de carácter empírico (empírico: Basado en evidencia observable), y es la
de obtener información de los datos. Más específicamente, la Estadística cumple una
función descriptiva, (permite precisar las características psicológicas de individuos y
grupos), y además, generaliza esas características a las poblaciones de interés
(Estadística Inferencial). Las técnicas estadísticas hacen posible la contrastación de
las teorías sobre el comportamiento con la evidencia empírica expresada en datos.

Computación estadística
Es una disciplina del conocimiento científico tecnológico, que se ocupa de estudiar el
impacto de la computación en la metodología estadística (Algoritmos, modelación
gráfica, métodos inferenciales intensivos en cálculo recursivo, análisis exploratorio de
datos, evaluación de software estadístico, métodos estadísticos en simulación,
métodos estadístico en procesamiento de imágenes y señales etc.). Esta área aborda

3 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

todos los aspectos teóricos y prácticos del modelamiento estadístico y al mismo


tiempo se ocupa de todos los cambios y aplicaciones, que la Ciencia de la
Computación está generando en ella.

Qué es el Azar

El azar es una combinación de circunstancias o de causas imprevisibles, complejas,


no lineales, sin plan previo y sin propósito, que supuestamente provocan que
acontezca un determinado acontecimiento que no está condicionado por la relación de
causa y efecto ni por la intervención humana o divina. Este acontecimiento puede ser
bueno y también puede ser una desgracia causada por la casualidad, la fortuna, el
acaso, la suerte. El azar es un caso fortuito, no programado, y si es negativo es un
contratiempo.

Exactitud y Precisión.

La exactitud expresa cuán cerca están las mediciones respecto al valor verdadero o
real de la magnitud que se mide. La precisión se refiere al grado con el que las
mediciones concuerdan entre sí.

Estadística y Probabilidad.

La Estadística es una ciencia cuyo método consiste en recopilar, presentar, analizar e


interpretar datos numéricos extraídos de hechos reales e inferir de ellos, conclusiones
lógicamente aceptables. Si el objetivo es el análisis de la información de una muestra
o una población, sin que ello implique alguna relación con otras muestras o
poblaciones, la estadística es descriptiva. Pero si se utiliza para inducir información
referente a otra(s) muestra(s) o población(s), la estadística es inferencial.

La Probabilidad estudia la frecuencia de un suceso determinado mediante la


realización de un experimento aleatorio, del que se conocen todos los resultados
posibles, bajo condiciones suficientemente estables.

Estadística industrial

La estadística industrial es la rama de la estadística que busca implementar los


procedimientos probabilísticos y estadísticos de análisis e interpretación de datos o
características de un conjunto de elementos al entorno industrial, a efectos de ayudar
en la toma de decisiones y en el control de los procesos industriales y
organizacionales. Pueden distinguirse tres partes:

• El estudio de las series temporales y las técnicas de previsión, y la descripción de los


pasos necesarios para el establecimiento de un sistema de previsión operativo y
duradero en una empresa;

4 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

• El análisis multivariante, necesario para la extracción de información de grandes


cantidades de datos, una de las necesidades más apremiantes;

• El control de calidad y la fiabilidad. Se pueden distinguir varios aspectos:

• Serie temporal o cronológica es una secuencia de datos, observaciones o


valores, medidos en determinados momentos del tiempo, ordenados
cronológicamente y, normalmente, espaciados entre sí de manera uniforme. El
análisis de series temporales comprende métodos que ayudan a interpretar
este tipo de datos, extrayendo información representativa, tanto referente a los
orígenes o relaciones subyacentes como a la posibilidad de extrapolar y
predecir su comportamiento futuro. De hecho, uno de los usos más habituales
de las series de datos temporales es su análisis para predicción y pronóstico.
Por ejemplo, los datos climáticos, las acciones de bolsa, o las series
pluviométricas. Resulta difícil imaginar una rama de las ciencias en la que no
aparezcan datos que puedan ser considerados como series temporales. Son
estudiadas en estadística, procesamiento de señales, econometría y muchas
otras áreas.

• Control de calidad son todos los mecanismos, acciones, herramientas que


se realizan para detectar la presencia de errores. La función del control de
calidad existe primordialmente como una organización de servicio, para
conocer las especificaciones establecidas por la ingeniería del producto y
proporcionar asistencia al departamento de fabricación, para que la producción
alcance estas especificaciones. Como tal, la función consiste en la recolección
y análisis de grandes cantidades de datos que después se presentan a
diferentes departamentos para iniciar una acción correctiva adecuada. Todo
producto que no cumpla las características mínimas para decir que es correcto,
será eliminado, sin poderse corregir los posibles defectos de fabricación que
podrían evitar esos costos añadidos y desperdicios de material. Para controlar
la calidad de un producto se realizan inspecciones o pruebas de muestreo para
verificar que las características del mismo sean óptimas. El único inconveniente
de estas pruebas es el gasto que conlleva el control de cada producto
fabricado, ya que se eliminan los defectuosos, sin posibilidad de ser
reutilizable. La función principal es asegurar que los productos o servicios
cumplan con los requisitos mínimos de calidad.

• El término fiabilidad es descrito en el diccionario de la Real Academia


Española (RAE) como "probabilidad de buen funcionamiento de algo". Por
tanto, extendiendo el significado a sistemas, se dice que la fiabilidad de un
sistema es la probabilidad de que ese sistema funcione o desarrolle una cierta
función, bajo condiciones fijadas y durante un período determinado. Por
ejemplo, condiciones de presión, temperatura, fricción, velocidad, tensión o

5 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

forma de una onda eléctrica, nivel de vibraciones. Consideramos dos aspectos:


la fiabilidad de sistemas y la fiabilidad humana. Un sistema es una colección de
componentes/subsistemas dispuestos de acuerdo a un diseño dado con el
propósito de lograr el cumplimiento de unas determinadas funciones con una
adecuación y fiabilidad aceptables. El tipo de componentes, su cantidad y el
modo en que están dispuestas tiene un efecto directo en la fiabilidad del
sistema. Se considera que el componente humano es de una complejidad
mucho mayor que cualquier otro componente y, por tanto, las técnicas
aplicables al estudio de la fiabilidad humana o, complementariamente, del error
humano son específicos e integran aspectos psicológicos y organizacionales a
las habituales técnicas matemáticas.

Escalas de Medición.

Las escalas de medición son utilizadas para diferenciar elementos en un proceso. Se


clasifican en nominal, ordinal, intervalo y de razón. En diversos estudios, la escala a
utilizar, depende de la naturaleza del elemento o del interés del investigador.

La Escala Nominal, se utiliza cuando un objeto o evento se diferencia de otro


solamente por la nominación con que se conoce. Se pueden utilizar numerales, letras
o cualquier otra nominación sin que ello represente orden o continuidad; solo se
pretende clasificar. El personal de una empresa puede ser clasificado, utilizando una
escala de letras como A-B-C.

La Escala Ordinal, se utiliza de manera nominal pero para jerarquizar datos. La


producción se puede clasificar con la escala alta, mediana y baja.

La Escala de Intervalo, esta escala posee todas las características de una escala
ordinal. Además se conoce la distancia entre dos números cualesquiera, y el valor
cero no representa ausencia de una característica. La escala utilizada en los
termómetros, es de tipo por intervalo ordinal y el valor cero representa punto de
congelación, pero por debajo de cero existen otros valores.

La Escala de Razón. Esta escala es similar a la anterior, excepto en que el cero sí


representa ausencia de una característica. La escala utilizada para el tiempo es de tipo
razón, ya que debajo de cero unidades de tiempo no hay valores.

Elaboración de Tablas de Datos.

Distribución de frecuencias

Una distribución de frecuencias es una tabla en la cual se agrupan en clases los


valores posibles para una variable y se registra el número de valores observados que
corresponde a cada clase.

6 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

Clase (xi)

La información recolectada puede ser presentada utilizando para ello, valores; es


decir clases.

Ejemplo. Supóngase que se desea elaborar una tabla con el número de horas
trabajadas por 5 empleados de una empresa manufacturera. La clase se puede
establecer con una escala nominal como Trabajador 1-2-3-4-5.

Frecuencia ( fi ).

Representa el número de veces que un dato se repite.

En el ejemplo anterior, supóngase que los empleados trabajaron 8, 11, 5, 7, 9 horas


respectivamente; esta serie representa la frecuencia de horas trabajadas.

Total de datos (n).

Es la sumatoria de todos los datos.


𝑘
𝑛=∑ 𝑓𝑖
𝑖=1

Ejemplo. De acuerdo al ejemplo anterior, éste sería = 40.

Frecuencia Relativa ( fr) y Frecuencia Relativa Porcentual ( fr%).

La frecuencia relativa representa el cociente entre cada frecuencia y total de datos. En


tanto que la porcentual, se obtiene convirtiendo la frecuencia relativa en porcentaje.

fr
fr% = x100
n

Ejemplo.1.9. De acuerdo a los ejemplos 1.6 y 1.7, se tiene que las frecuencias
relativas son: 0,2; 0,27; 0,13; 0,17; 0,23. Las frecuencias relativas porcentuales son:
20%; 27%; 13%; 17%; 23%.

Frecuencia Acumulada. ( fai ) y Frecuencia Acumulada Porcentual ( fai %).

La frecuencia acumulada representa el número de datos que se acumulan al pasar de


una clase a otra. En tanto que la porcentual, se obtiene convirtiendo la frecuencia
acumulada en porcentaje.

fai
fai % = x100
n

7 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

Ejemplo. De acuerdo al ejemplo 1.7, las frecuencias acumuladas son: 8, 19, 24, 31,
40. Las frecuencias relativas porcentuales son 20%; 47,5%; 60%; 77,5%; 100%.

Distribución de Frecuencias para Datos Agrupados en Intervalos de Clase.

Cuando se tienen datos muy numerosos es conveniente utilizar intervalos en los


cuales se agrupen clases, de tal manera de establecer una tabla más reducida. A
estos intervalos se le denominan intervalos de clase. Por razones de cálculo,
generalmente es deseable que todos los intervalos de clase, en una distribución de
frecuencia, sean de igual amplitud. Para datos distribuidos de manera irregular, como
los datos anuales de salario para diversas ocupaciones, pueden ser convenientes los
intervalos desiguales de clase; en este caso, se utilizan intervalos de clase de mayor
amplitud para los rangos de valores en que hay relativamente pocas observaciones.
Por lo general se recomienda que el número de intervalos esté entre 5 y 15. Aunque
existe una fórmula para el cálculo del número de intervalos, hay que hacer notar que
en algunos casos puede dar valores errados, esto sucede cuando el número de datos
n es muy grande; esta fórmula es:
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 = 1 + 3,3𝑙𝑜𝑔𝑛(𝑓ó𝑟𝑚𝑢𝑙𝑎 𝑑𝑒 𝑆𝑡𝑢𝑟𝑔𝑒𝑠)
El procedimiento para conformar los intervalos es el siguiente:
 Calcular la amplitud de los intervalos de frecuencia para datos no agrupados
(DNA), utilizando la fórmula:
𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 𝑒𝑛 𝑙𝑜𝑠 𝐷𝑁𝐴 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 𝑒𝑛 𝑙𝑜𝑠 𝐷𝑁𝐴
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 =
𝑁° 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑑𝑒𝑠𝑒𝑎𝑑𝑜𝑠

 El primer intervalo tiene como extremo izquierdo el menor valor de los datos
recolectados. El extremo derecho de este intervalo se obtiene, sumando al
menor valor la amplitud menos una unidad.
 El extremo izquierdo del segundo intervalo es el número entero siguiente al
extremo derecho del primer intervalo. El extremo derecho se obtiene
sumándole al izquierdo la amplitud menos una unidad. Utilizando este
mecanismo, se establecen todos los restantes intervalos.
 Puede suceder que al establecer los intervalos, el último número sea inferior o
superior al valor mayor, una manera de resolver esta dificultad, es jugar con el
número de intervalos, o si es posible, agregar un intervalo.
 Si los datos originales están en decimales es conveniente llevarlos a números
enteros; y una vez elaborada la tabla, restaurar la coma que tenían los datos
originales.

Límite Inferior (Li) y superior (Ls) de un Intervalo.


El límite inferior en un intervalo de clases de frecuencias lo representa el extremo
izquierdo de cada intervalo. En tanto que el superior lo representa el extremo derecho
de cada uno.

8 Prof. Ing. Kelvin Cárima


Tema I: Introducción a la Estadística
Conceptos Básicos de Estadísticas
Estadística para Ingenieros

Marca de Clase. (xi).


Es el punto medio de cada intervalo. Hay que hacer notar que si se toma la amplitud
como un número impar, las marcas de clase darán números similares a los usados en
los límites de los intervalos.

Límite Real Inferior (Lri). Límite Real Superior (Lrs).


El límite real inferior, en cada intervalo, se obtiene restando cinco décimas al límite
inferior de éste 𝐿𝑟𝑖 = 𝐿𝑖 − 0,5. En tanto que el superior se obtiene, sumando cinco
décimas al límite superior del intervalo 𝐿𝑟𝑠 = 𝐿𝑠 + 0,5.

9 Prof. Ing. Kelvin Cárima