Beruflich Dokumente
Kultur Dokumente
Semana I:
Estadística: ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de ellos, inferencias
basadas en el cálculo de probabilidades.
Estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada característica en
común, para poder llegar a conclusiones a partir de los datos numéricos extraídos.
Clasificación de la estadística:
Estadística descriptiva: busca obtener información sobre la población basándose en el estudio de los datos
de una muestra tomada a partir de ella.
Estadística inferencial: se preocupa por llegar a conclusiones basadas en la muestra y luego hacerlas válidas
para toda la población.
Muestra: es una representación significativa de las características de una población, a través de la que
estudiamos las características de un conjunto poblacional mucho menor que la población global.
Clasificación de la variable:
Variables cualitativas: son aquellas que no se pueden medir numéricamente ejemplo: nacionalidad, color de
la piel, sexo, etc.
Nominales: son datos que corresponden a categorías que por su naturaleza no admiten un orden. Por
ejemplo: sexo (masculino y femenino); carrera de estudio: economía, contabilidad, administración, etc.
Ordinales: son aquellos que corresponden a evaluaciones subjetivas que se pueden ordenar o jerarquizar. Por
ejemplo: en una competencia artística las posiciones de los ganadores se ordenan o jerarquizan en primer
lugar, segundo lugar, tercer lugar, cuarto lugar, etc.
Variables cuantitativas: son aquellas que tienen valor numérico como la edad, el precio de un producto,
ingresos anuales de un consumidor, etc.
Discretas: estas son aquellas que sólo pueden tomar valores enteros como 1, 2, 8, -4, etc. En este sentido, los
hermanos en una familia podrán ser: 1, 2, 3..., etc. Sin embargo, nunca podrán ser 1.5 o 2.3.
Continuas: son aquellas que pueden tomar cualquier valor real dentro de un intervalo o rango. Por ejemplo,
los litros de leche ordeñados podrán ser 1.5 o 10.3, etc.
Presentación de datos: constituye en sus diferentes modalidades uno de los aspectos de mas uso en la
estadística descriptiva, la cual puede hacerse de diversas formas:
Presentación escrita: esta forma de presentación de informaciones se usa cuando una serie de datos incluye
pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de escribir el comportamiento
de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales.
Presentación tabular: cuando los datos estadísticos se presentan a través de un conjunto de filas y de
columnas que responden a un ordenamiento lógico; es de gran importancia para el uso y el usuario ya que
constituye la forma más exacta de presentar las informaciones.
Presentación grafica: proporciona al lector o usuario mayor rapidez en la comprensión de los datos, una grafica
es una expresión artística usada para representar un conjunto de datos.
Tipos de gráfica:
De barras: es una forma de representar gráficamente un conjunto de datos o valores, y está conformado por
barras rectangulares de longitudes proporcionales a los valores representados. Los gráficos de barras son
usados para comparar dos o más valores. Las barras pueden orientarse horizontal o verticalmente.
De líneas: muestran los datos en forma de puntos y todos los puntos de la misma serie se unen mediante
una línea; de ahí su nombre. Cada valor aparece representado por un punto que es la intersección entre los
datos del eje horizontal y los del eje vertical.
Pictogramas: es un tipo de gráfico que representa mediante dibujos la característica estudiada. Éstos
representan las frecuencias relativas o absolutas de una variable cualitativa o discreta.
Las Variables.
Variables cualitativas.
Datos cualitativos: emplean etiquetas o nombres para determinar categorías o clases de elementos
semejantes.
Distribución de frecuencia (fi): es un resumen tabular de datos que muestra la frecuenta de elementos en
cada una de las diferentes clases.
fp= fr x 100
Ejemplo:
R N N N G B B B G
B B B G B G R B B
N G R B N N N R G
B= Blanco
G= Gris
N= Negro
R= Rojo
Preferencia del color de Vehículo
40.00% 37.04%
35.00%
30.00%
25.93%
25.00% 22.22%
20.00%
14.81%
15.00%
10.00%
5.00%
0.00%
B G N R
Semana III:
Distribución de frecuencia cuantitativa.
Datos cuantitativos: son los que requieren valores numéricos que indiquen cantidad para su clasificación.
Número de clase (k): es el elemento de la tabla que permite condensar en mayor grado un conjunto de datos
con el propósito de hacer un resumen de ellos, es decir, es la cantidad de filas.
K=√𝒏
Longitud de intervalo:
L=DM – dm
K
Marca de clase (xi): es un valor representativo de un intervalo de clase, cuya magnitud coincide con el punto
medio de dicho intervalo.
Xi= LI + LS
2
Frecuencia absoluta (fi): es el número de repeticiones que presenta una observación contenida en un
intervalo.
Frecuencia relativa (fr): es la proporción que presenta la clase con respecto al total. Representada en
porciones de 1.
fr=fi
n
Frecuencia absoluta acumulada (Fi): es la suma de los distintos valores de la frecuencia absoluta tomando
como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al número de datos
dados.
Frecuencia relativa acumulada (Fr): es el cociente entre la frecuencia absoluta acumulada de la clase i entre
el total de datos.
Fr= Fi
n
Ejemplo
Tabla de distribución de frecuencia cuantitativa.
El siguiente estudio tiene por objetivo comparar el precio de los servicios de comida en restaurantes
dentro de la ciudad de Santiago de los Caballeros con los de ciudades aledañas.
Para este estudio se consultaron 50 restaurantes dentro de la ciudad y 50 fuera de la ciudad, lo que arrojó
los siguientes precios.
Precios dentro de la ciudad (organizados de menor a mayor):
140 200 220 230 250 260 270 300 310 310
320 330 340 340 350 350 350 360 360 370
370 380 380 380 390 390 390 390 400 410
420 430 440 440 440 440 450 450 480 480
490 500 500 500 510 510 530 530 560 630
Precios fuera de la ciudad (organizados de menor a mayor):
230 230 240 240 250 250 260 260 260 260
270 270 280 280 290 290 300 300 300 300
300 310 310 320 320 320 330 330 340 340
360 370 370 370 380 380 380 380 380 380
390 390 410 430 440 440 480 510 510 550
Al realizar una tabla de distribución de frecuencia seguimos el siguiente procedimiento.
Determinar el número de clases que tendrá la tabla.
K= √𝑛
K = √50
K =7.07
El resultado nos indica que utilizaremos 7 clases (7 filas)
Clases
1
2
3
4
5
6
7
Total
Determinar los intervalos en los que se agruparán los datos.
Longitud de los intervalos:
Redondeando conforme a los datos originales, los cuales no tienen cifras después del punto
Utilizamos la longitud de intervalo 69
LI = Límite inferior
LS = Límite superior
Intervalos
LI LS
(el LS de la primera clase será igual al límite
140 inferior más la longitud del intervalo, y así
(el LI de la primera clase será el dato menor) sucesivamente)
140+69= 209
(el LS de la segunda clase será igual al límite
209+1 = 210 (el LI de la segunda clase será
inferior más la longitud del intervalo, y así
igual al límite superior anterior más la 1,
sucesivamente)
según sea la escala, y así sucesivamente)
210 + 69 = 279
279 + 1 = 280 280 + 69 = 349
349 + 1 = 350 350 + 69 = 419
419 + 1= 420 420 + 69 = 489
489 + 1 = 490 490 + 69 = 559
560 + 69 = 629
Verificar que el dato mayor se encuentre
559 + 1 = 560
dentro de los intervalos. Por lo que
llevaremos este valor a 630
Intervalos
LI LS
[ 140 209 ]
[ 210 279 ]
[ 280 349 ]
[ 350 419 ]
[ 420 489 ]
[ 490 559 ]
[ 560 630 ]
Marca de clase (Xi). Es un número que representa cada intervalo, este coincide con el punto medio de cada
intervalo.
Xi =
Intervalos Xi
LI LS
En este caso contaremos los datos que aparecen entre cada intervalo
Intervalos
fi
LI LS
Entre 140 y 209 tenemos dos
[ 140 209 ] datos 140 y 200, por lo que fi
para esta clase es igual a 2
Entre los límites 213 y 279
tenemos cinco datos: 220,
[ 210 279 ] 230, 250, 260 y 270. Por lo
que fi para esta clase es
igual a 5
[ 280 349 ] 7
[ 350 419 ] 16
[ 420 489 ] 10
[ 490 559 ] 8
[ 560 630 ] 2
Frecuencia relativa (fr).
La frecuencia relativa representa una proporcion en base a la unidad. Se divide cada valor de fi entre el
numero total de datos.
fr=
fi fr
2 = 0.04
5 = 0.10
7 = 0.14
16 = 0.32
10 = 0.20
8 = 0.16
2 = 0.04
50 1.00
Frecuencia absoluta acumulada (Fi)
La frecuencia absoluta acumulada es el número de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable.
fi Fi
2 (el primer valor debe ser igual al primer valor de
la frecuencia absoluta (fi))
En este caso igual a 2
5 (en las siguientes clases se suma el valor anterior
con el valor de la frecuencia absoluta de la clase)
2+5=7
7 7+7=14
16 14+16=30
10 30 + 10 = 40
8 40 + 8 = 48
2
48 + 2 = 50
50
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y
el número total de datos.
fr Fr
0.04 (el primer valor debe ser igual
al primer valor de la
frecuencia relativa (fr))
En este caso igual a 0.04
0.10 (en las siguientes clases se
suma el valor anterior con el
valor de la frecuencia
absoluta de la clase)
0.04+0.10=0.14
0.14 0.28
0.32 0.60
0.20 0.80
0.16 0.96
0.04 1
Finalmente obtenemos una tabla de la forma:
Intervalos
Clases Xi fi Fr Fi Fr fp
LI LS
1 [ 140 209 ] 174.5 2 0.04 2 0.04 4%
2 [ 210 279 ] 244.5 5 0.10 7 0.14 10%
3 [ 280 349 ] 314.5 7 0.14 14 0.28 14%
4 [ 350 419 ] 384.5 16 0.32 30 0.60 32%
5 [ 420 489 ] 454.5 10 0.20 40 0.80 20%
6 [ 490 559 ] 524.5 8 0.16 48 0.96 16%
7 [ 560 630 ] 595 2 0.04 50 1 4%
Total 50 1.00 100.00%
35%
30%
25%
20%
15%
10%
5%
0%
1 2 3 4 5 6 7
Para los precios de fuera de la ciudad utilizaremos el mismo procedimiento.
230 230 240 240 250 250 260 260 260 260
270 270 280 280 290 290 300 300 300 300
300 310 310 320 320 320 330 330 340 340
360 370 370 370 380 380 380 380 380 380
390 390 410 430 440 440 480 510 510 550
K = 6.64 ‐> 7 clases
L = 45 redondeando.
Obtenemos la siguiente tabla
Intervalos
Clases Xi fi fr Fi Fr fp
LI LS
1 230 275 252.5 12 0.24 12 0.24 24.00%
2 276 321 298.5 14 0.28 26 0.52 28.00%
3 322 367 344.5 5 0.1 31 0.62 10.00%
4 368 413 390.5 12 0.24 43 0.86 24.00%
5 414 459 436.5 3 0.06 46 0.92 6.00%
6 460 505 482.5 1 0.02 47 0.94 2.00%
7 506 551 528.5 3 0.06 50 1 6.00%
Total 50 1 100.00%
30.00%
25.00%
20.00%
15.00%
10.00%
5.00%
0.00%
1 2 3 4 5 6 7
Semana V:
_
X= 19,570 = 391.4
50
Ejemplo:
Clases Xi fi Xi * fi
1 176 2 352
2 249 5 1245
3 322 10 3220
4 395 15 5925
5 468 12 5616
6 541 5 2705
7 614 1 614
Total 50 19,677
_
X= 19,677
50
_
X= 393.54.
La mediana se define como aquel valor nominal que tiene dentro de un conjunto de datos ordenados, arriba y
debajo de él, el mismo número de datos nominales.
Datos pares: n
2
Ejemplo:
Me= 397.43
La moda se define como aquel valor nominal que tiene la frecuencia mayor, el que más se repite.
1. Determinar el intervalo de clase que contiene la moda, este será el de mayor frecuencia absoluta.
2. Interpolar la moda mediante la siguiente expresión:
Mo= Li + ( d1 ) L
d1 + d2
Ejemplo:
Mo= 404.125