Sie sind auf Seite 1von 49

Universidad Nacional de Huancavelica

Facultad de Ciencias de Ingeniería


Departamento Académico de Ciencias Básicas
Escuela Académico Profesional de Ingeniería Ambiental Sanitaria

Estatistics and
Probability

Clase 02:
Conceptos Básicos de Estadística Descriptiva
e Inferencial
Ing. Jorge Luis Huere Peña
Master in Informátics and Computer Science

e-mail : huerecom@hotmail.com
"Statistical thinking will one day be as necessary
for efficient citizenship as the ability to read and
write."

“El pensamiento estadístico algún día será tan


necesario para la ciudadanía como la capacidad
de leer y escribir...”

Herbert George Wells


100 years ago

2
Scientific Research
La investigación científica

¿Qué es la investigación científica?

Es la búsqueda sistematizada y objetiva de nuevos


conocimientos (new knowledge). Investigar es un proceso
de buscar, indagar o pesquisar.

El método científico (The scientific method),


comprende la realización de la investigación en forma
sistematizada y objetiva, organizada y coherente.
3
Phases of Scientific Research
Etapas de la investigación científica

A.Planificación: Elaboración del proyecto. Abarca


una descripción detallada y fundamentada de cada
una de las actividades a desarrollarse en la
investigación.
B. Ejecución: Es la etapa en la cual se lleva a
cabo al investigación. Recolección de datos,
análisis e interpretación.
C. Informe: Escrito donde se presentan los
hallazgos encontrados.
4
Definición de Estadística

La estadística es una ciencia que crea,


desarrolla, aplica métodos y procedimientos para
analizar información de manera confiable en
condiciones de certidumbre e incertidumbre,
brindando apoyo en la optimización de toma de
decisiones.

5
Utilidad e Importancia de la Estadística

 Se usa la descripción de datos recolectados


reduciéndolos a un pequeño número de características
que concentra la parte más importante y significativa
de la información proporcionada por los datos.

 Estudio y conocimiento de la población a través de una


muestra, lo que conlleva a hacerla factible, disminuir
costos, tiempo y espacio.

 Conocimiento de eventos probabilísticos y


pronósticos, para la ayuda en la toma de decisiones
con gran posibilidad de aciertos.
6
Statistic
Estadistica
La estadística es la ciencia que proporciona un
conjunto de métodos que se utilizan para:

RECOLECTAR COLLECT

ORGANIZAR ORGANIZE DECISION


DATA MAKING
DATOS TOMA DE
DECISIONES
ANALIZAR ANALYZE

INTERPRETAR INTERPRET
THE STATISTICAL PROCESS
A esta secuencia se llama proceso
estadistico.
7
¿Qué es la RECOLECCIÓN de datos ?

Es el registro de características
(medición, observación, conteo) a una
unidad elemental (o de análisis).

8
¿Por qué necesitamos recolectar datos?

Proporcionan la evidencia imprescindible en un


estudio de investigación.
Permiten medir el desempeño en el proceso de
producción de un bien o servicio.
Ayudan a la formulación de cursos alternativos
de acción en un proceso de toma de
decisiones.
Satisfacen nuestra curiosidad innata.
9
¿Qué es la ORGANIZACIÓN de datos ?

Es el ordenamiento para una mejor


comprensión y facilitar sus análisis.
(tablas y/o gráficos)

Los datos sin organizar se llaman datos


brutos, y son de poca utilidad.

10
Por ejemplo, los siguientes datos sobre las horas de permanencia de
material orgánico en un sistema de refrigeración no organizados

11
Ejemplo de datos organizados
Diagrama Circular
Tabla de Distribución

Edad N° Pacientes

30 - 34 6
35 - 39 12
40 - 44 8
45 - 49 2
12

10

Diagrama de 4

Barras 2

0
30-34 35-39 40-44 45-49 12
¿Qué es el ANALISIS de datos ?

Es el cálculo de MEDIDAS
REPRESENTATIVAS (o de resumen)
tales como promedios, medidas de
variabilidad y medidas de la forma de
la distribución, etc.
También se analizan datos cuando se
establecen relaciones entre ellos
(regresión y correlación).

13
14
¿Qué es la INTERPRETACIÓN de datos ?

Es darle un sentido práctico o útil a los


resultados obtenidos en el análisis.

15
Division of Statistics
División de la Estadística

DESCRIPTIVE
 ESTADISTICA DESCRIPTIVA STATISTIC

PROBABILITIES
PROBABILIDADES

 ESTADISTICA INFERENCIAL INFERENTIAL


STATISTICS

16
DESCRIPTIVE STATISTIC
ESTADISTICA DESCRIPTIVA

Es el conjunto de métodos que implican la


recolección, organización, presentación y resumir un
conjunto de datos a fin de describir en forma
apropiada las diversas características de estos. Es
bastante usado en trabajos de tipo exploratorio..

17
PROCESOS DE LA ESTADISTICA DESCRIPTIVA
MEJORAR O
RECOLECCION

Recolectar NO
datos
BUENA NO FIN DEL
RECOLECCIÓN?
PROCESO
RE-CRITICA
SI
MALO
Validación y NIVEL DE
consistencia CRITICA

BUENO

EN BASE A
CARACTERISTICAS,
TABLAS Y GRAFICOS
Procesamiento

1. Colección de datos
2. Crítica de datos
3. Procesamiento. SINTESIS
4. Análisis.
18
INFERENTIAL STATISTICS
ESTADISTICA INFERENCIAL

Es el conjunto de métodos o técnicas por


medio de las cuales se toman decisiones
sobre una población basadas en una
muestra y en el juicio de los expertos.
Debido a que esas decisiones se toman en condiciones
de incertidumbre, se requiere el uso de conceptos de
probabilidad. Es decir, un estudio estadístico se
considera “inferencial” cuando se pretende llegar a
conclusiones o generalizaciones que involucran a toda
la población en base a una información parcial
19
FLUJOGRAMA DE LA ESTADISTICA INFERENCIAL

20
Population and Sample
Población y muestra

 Población (‘population’)
Es el conjunto de personas, animales o cosas que poseen
características especiales, que pueden cuantificarse y sobre
el que estamos interesados en obtener conclusiones (hacer
inferencia).

 Normalmente es demasiado grande para poder abarcarlo.


 Debe delimitar espacio y tiempo,

 Muestra (‘sample’) es un subconjunto suyo al que tenemos


acceso y sobre el que realmente hacemos las observaciones
(mediciones)
 Debería ser “representativo”
 Esta formado por miembros “seleccionados” de la
población (individuos, unidades experimentales).
 Debe tener un tamaño adecuado
21
Population
POBLACION

Se obtienen datos
representativos
Sample
MUESTRA

Muchos datos, difíciles


de poder conseguirlos,
lleva mucho tiempo,
además que consume
mucho presupuesto

Conocemos
la población

22
23
PARAMETER
PARÁMETRO

Es una medida de resumen que nos describe una


o más características de la población. Se
simboliza por letras griegas. Sólo hay un parámetro
en cada población.
 : Media poblacional (mu)
2 : Varianza poblacional (sigma cuadrado)
 : Desviación estándar poblacional (sigma)
 : Proporción poblacional (pi)
 : Coeficiente de correlación poblacional (rho) 24
STADIGRAPH
ESTADÍGRAFO - ESTIMADOR

Es una medida de resumen que nos describe alguna


característica de interés y cuyo valor es calculado
usando sólo los valores de los elementos o unidades de
una muestra. Se simboliza por letras latinas. Existen
tantos estimadores como muestras se extraigan de una
población.
x Media muestral.
s2 Varianza muestra.
s Desviación estándar muestral.
p Proporción muestral
r Coeficiente de correlación muestral 25
26
ANALYSIS UNIT
UNIDAD DE ANÁLISIS

Es el objeto o elemento indivisible que


será estudiado en una población, sobre la
cual se obtendrán los datos de interés
para la investigación.

La unidad de análisis no es el fenómeno


investigado sino el que genera el fenómeno

27
DATA
DATO
El dato es el registro de una característica o
resultado de la recopilación de información. Es el
valor o respuesta que adquiere la variable en
cada unidad de análisis.
Los datos son la materia prima de la
estadística

Si un DATO es útil para tomar decisiones se


convierte en INFORMACIÓN.
28
Ejemplo :
Unidad de
Características Datos
medida
Edad del trabajador 27 años
Peso del material 3,750 Kg.
Tiempo permanencia 5 días
Temperatura corporal 37,5 °C
Profesión Topógrafo ---

29
¿QUÉ TIPOS DE DATOS EXISTEN?
CONSTANTE
Si el registro de la característica toma un sólo valor en
todas las unidades elementales. Son muchos datos,
pero iguales.
Ejemplo:
• Sexo de las pacientes en el Servicio de Ginecología
• Título profesional de los miembros del Colegio Médico
del Perú
Las constantes no son interés en Estadística, puesto
que ella se ocupa del estudio de la variabilidad de los
datos.
30
VARIABLE
VARIABLE

Si el registro de la característica toma diversos


valores en las unidades elementales.

Ejemplo:
Edad, sexo y peso de los pacientes de una Clínica

Una misma característica puede generar


constantes ó variables, depende del marco
muestral.

31
Por ejemplo: si representamos con X la temperatura del
Aire, veremos que en las estaciones tendremos en un día
24 observaciones horarias tomadas de una variable
continua, y cada una de ellas puede tener valores
diferentes, por eso decimos que X es una variable

32
VARIABLES TYPES
TIPOS DE VARIABLES

 Qualitative variables
Variables Cualitativas

 Quantitative variables
Variables Cuantitativas

33
VARIABLES CUALITATIVAS
NO ES POSIBLE
ORDENARLOS

NOMINAL
Variables cuyas categorías no pueden ser ordenas
sea en forma ascendente o descendente.
ORDINAL
Variables cuyas categorías pueden ser ordenas sea
en forma ascendente o descendente. SE PUEDEN
ORDENAR

VARIABLES CUANTITATIVAS

DISCRETA
PROVIENEN DE
Variables cuyas valores son de tipo numérico y
CONTADAS
entero. Generalmente provienen de conteos
CONTINUA
USO DE INSTRUMENTOS PARA Los valores son de numericos y pueden ser fraccionarios.
MEDIRLOS Provienen de mediciones con instrumentos.

34
Qualitative variables
VARIABLES CUALITATIVAS

Son atributos de una población los cuales no


pueden ser representados numéricamente.
(no se pueden hacer operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar


Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar
(Sí/No)

Ordinales: Si sus valores se pueden ordenar


Calidad de un producto, Grado de satisfacción,
Intensidad del dolor
35
Quantitative variables
VARIABLES CUANTITATIVAS

Son variables cuantitativas aquellas características de la


población que pueden representarse numéricamente.
(Las operaciones posibles son los promedios y las medidas de
dispersión, entre otras).

Discrete (Discretas) : Si toma valores enteros


Número de hijos, Número de cigarrillos, Num. de
“cumpleaños”
Continuous (Continuas) : Si entre dos valores, son posibles
infinitos valores intermedios.
Altura, Presión, Dosis de medicamento administrado, edad
36
EJEMPLO
Población Unidad de Variables Datos
análisis

Trabajadores Peso, 65 Kg
en una Género, Femenino
Cada
empresa de Edad, 26
trabajador
Lima Salario, S/. 1500
Metropolitana Religión Católica

37
DATOS

CONSTANTES VARIABLES

CUALITATIVAS CUANTITATIVAS

NOMINALES ORDINALES DISCRETAS CONTINUAS


38
¿QUÉ SE PUEDEN HACER CON LOS DATOS?
Identificar caracte- Organizarlos en tablas, gráficos y figuras
rísticas de interés
para la gestión. Calcular promedios (media, mediana,
moda y percentiles) .

Calcular su dispersión (varianza,


desviación estándar ) y forma de la curva.

Recolección de
Determinar una ecuación que represente
datos
la relación entre ellos (regresión)

Determinar el grado de asociación entre


ellos (correlación).
Utilizar datos para
Analizarlos dentro de un horizonte
mejorar la calidad
temporal (series cronológicas)
39
PROGRAMAS ESTADISTICOS
COMPUTARIZADOS

21

40
41
42
43
44
45
HOJA DE COMPROBACIÓN

1. L a estadística es una ciencia que sólo analiza datos

2. Los datos se organizan para mejorar su comprensión

3. El análisis de datos abarca el cálculo de promedio y


medidas de variabilidad

4. La interpretación de datos consiste en dar un sentido real a los


resultados obtenidos
5. Todo dato constituye información

6. Característica: 70 kgs 46
7. Una misma característica puede generar constantes o variables,
dependiendo del marco muestral de referencia

8. El color de automóvil de los participantes es una variable


cuantitativa, pues hay 13 cuyo automóvil es de color azul, 7 de
color beige y 2 rojos

9. La variable cuantitativa proviene de un conteo

10.El tiempo que demora un proceso productivo es una variable


cuantitativa continua

11.Los médicos que laboran en el Hospital Central constituyen una


población estadística
12.Habrán tantas poblaciones como características que se deseen
registrar en un marco poblacional

13.Cuanto más grande es la muestra, necesariamente será más


representativa

14.El muestreo permite disponer de los datos en menor tiempo,


reduciendo costos.

15.El parámetro representa a una población

16.Existen tanto estimadores como muestras se extraigan de una


población
17.Diferentes muestras, extraídas de una misma población,
ocasionan diferente calores del estimador

18.Los estimadores se representan por letras griegas

19.En la estadística descriptiva, el análisis se limita a un conjunto de


datos

20.Las técnicas que permiten estimar un parámetro a partir de datos


muestrales se denomina Estadística Inferencial

21.El error del muestreo consiste en la equivocación cuando


seleccionamos muestras

Das könnte Ihnen auch gefallen