Sie sind auf Seite 1von 15

Estadística I

Semana I:

 Estadística: ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de ellos, inferencias
basadas en el cálculo de probabilidades.

Estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada característica en
común, para poder llegar a conclusiones a partir de los datos numéricos extraídos.

 Clasificación de la estadística:

Estadística descriptiva: busca obtener información sobre la población basándose en el estudio de los datos
de una muestra tomada a partir de ella.

Estadística inferencial: se preocupa por llegar a conclusiones basadas en la muestra y luego hacerlas válidas
para toda la población.

 Población: es un conjunto de sujetos o individuos con determinadas características demográficas, de la


que se obtiene la muestra que se quiere extrapolar para obtener los resultados de dicho estudio.

 Muestra: es una representación significativa de las características de una población, a través de la que
estudiamos las características de un conjunto poblacional mucho menor que la población global.

 Variable: es una propiedad característica de la población en estudio, susceptible de tomar diferentes


valores, los cuales se pueden observar y medir.

 Clasificación de la variable:

Variables cualitativas: son aquellas que no se pueden medir numéricamente ejemplo: nacionalidad, color de
la piel, sexo, etc.

A su vez, las variables cualitativas pueden ser:

Nominales: son datos que corresponden a categorías que por su naturaleza no admiten un orden. Por
ejemplo: sexo (masculino y femenino); carrera de estudio: economía, contabilidad, administración, etc.

Ordinales: son aquellos que corresponden a evaluaciones subjetivas que se pueden ordenar o jerarquizar. Por
ejemplo: en una competencia artística las posiciones de los ganadores se ordenan o jerarquizan en primer
lugar, segundo lugar, tercer lugar, cuarto lugar, etc.

Variables cuantitativas: son aquellas que tienen valor numérico como la edad, el precio de un producto,
ingresos anuales de un consumidor, etc.

A su vez, las variables cuantitativas pueden ser:

Discretas: estas son aquellas que sólo pueden tomar valores enteros como 1, 2, 8, -4, etc. En este sentido, los
hermanos en una familia podrán ser: 1, 2, 3..., etc. Sin embargo, nunca podrán ser 1.5 o 2.3.

Continuas: son aquellas que pueden tomar cualquier valor real dentro de un intervalo o rango. Por ejemplo,
los litros de leche ordeñados podrán ser 1.5 o 10.3, etc.
 Presentación de datos: constituye en sus diferentes modalidades uno de los aspectos de mas uso en la
estadística descriptiva, la cual puede hacerse de diversas formas:

Presentación escrita: esta forma de presentación de informaciones se usa cuando una serie de datos incluye
pocos valores, por lo cual resulta más apropiada la palabra escrita como forma de escribir el comportamiento
de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales.

Presentación tabular: cuando los datos estadísticos se presentan a través de un conjunto de filas y de
columnas que responden a un ordenamiento lógico; es de gran importancia para el uso y el usuario ya que
constituye la forma más exacta de presentar las informaciones.

Presentación grafica: proporciona al lector o usuario mayor rapidez en la comprensión de los datos, una grafica
es una expresión artística usada para representar un conjunto de datos.

 Tipos de gráfica:

De barras: es una forma de representar gráficamente un conjunto de datos o valores, y está conformado por
barras rectangulares de longitudes proporcionales a los valores representados. Los gráficos de barras son
usados para comparar dos o más valores. Las barras pueden orientarse horizontal o verticalmente.

De líneas: muestran los datos en forma de puntos y todos los puntos de la misma serie se unen mediante
una línea; de ahí su nombre. Cada valor aparece representado por un punto que es la intersección entre los
datos del eje horizontal y los del eje vertical.

Circulares: es un recurso estadístico que se utiliza para representar porcentajes y proporciones.

Pictogramas: es un tipo de gráfico que representa mediante dibujos la característica estudiada. Éstos
representan las frecuencias relativas o absolutas de una variable cualitativa o discreta.

Las Variables.

Variables cualitativas.

Distribución de frecuencia cualitativa.

Datos cualitativos: emplean etiquetas o nombres para determinar categorías o clases de elementos
semejantes.

Distribución de frecuencia (fi): es un resumen tabular de datos que muestra la frecuenta de elementos en
cada una de las diferentes clases.

Frecuencia relativa (fr): mide la proporción de un elemento con respecto a la totalidad.

fr=fi fp= frecuenta porcentual


n

fp= fr x 100
Ejemplo:

Se cuestionaron 27 participantes sobre el color de carros preferido:

R N N N G B B B G
B B B G B G R B B
N G R B N N N R G
B= Blanco
G= Gris
N= Negro
R= Rojo

Clases  fi  fr  fp 


B  10  0.37037  37.04% 
G  6  0.222222 22.22% 
 N  7  0.259259 25.93% 
R  4  0.148148 14.81% 
Total:  27  1  100.00%

fr=fi=10=0.370 fp=fr x 100= 0.370 x 100= 37%


n 27

Preferencia del color de Vehículo
40.00% 37.04%
35.00%

30.00%
25.93%
25.00% 22.22%

20.00%
14.81%
15.00%

10.00%

5.00%

0.00%
B G  N R

Semana III:
Distribución de frecuencia cuantitativa.

Datos cuantitativos: son los que requieren valores numéricos que indiquen cantidad para su clasificación.

Número de clase (k): es el elemento de la tabla que permite condensar en mayor grado un conjunto de datos
con el propósito de hacer un resumen de ellos, es decir, es la cantidad de filas.

K=√𝒏

Longitud de intervalo:

L=DM – dm
K

DM= Dato mayor


dm= Dato menor

Nota: la longitud debe ser redondeada al impar más cercano.

Marca de clase (xi): es un valor representativo de un intervalo de clase, cuya magnitud coincide con el punto
medio de dicho intervalo.

Xi= LI + LS
2

LI= Limite inferior.


LS= Limite superior.

Frecuencia absoluta (fi): es el número de repeticiones que presenta una observación contenida en un
intervalo.

Frecuencia relativa (fr): es la proporción que presenta la clase con respecto al total. Representada en
porciones de 1.

fr=fi
n

Frecuencia absoluta acumulada (Fi): es la suma de los distintos valores de la frecuencia absoluta tomando
como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al número de datos
dados.

Frecuencia relativa acumulada (Fr): es el cociente entre la frecuencia absoluta acumulada de la clase i entre
el total de datos.

Fr= Fi
n
Ejemplo  

Tabla de distribución de frecuencia cuantitativa. 
El siguiente estudio tiene por objetivo comparar el precio de los servicios de comida en restaurantes 
dentro de la ciudad de Santiago de los Caballeros con los de ciudades aledañas. 

Para este estudio se consultaron 50 restaurantes dentro de la ciudad y 50 fuera de la ciudad, lo que arrojó 
los siguientes precios. 

Precios dentro de la ciudad (organizados de menor a mayor): 

140  200  220  230  250  260  270  300  310  310 
320  330  340  340  350  350  350  360  360  370 
370  380  380  380  390  390  390  390  400  410 
420  430  440  440  440  440  450  450  480  480 
490  500  500  500  510  510  530  530  560  630 
 

Precios fuera  de la ciudad (organizados de menor a mayor): 

230  230  240  240  250  250  260  260  260  260 
270  270  280  280  290  290  300  300  300  300 
300  310  310  320  320  320  330  330  340  340 
360  370  370  370  380  380  380  380  380  380 
390  390  410  430  440  440  480  510  510  550 
 

Al realizar una tabla de distribución de frecuencia seguimos el siguiente procedimiento.  
Determinar el número de clases que tendrá la tabla.  

K= √𝑛  

K = √50 

K =7.07 

El resultado nos indica que utilizaremos 7 clases (7 filas) 
Clases 







Total 
 

Determinar los intervalos en los que se agruparán los datos.  

Longitud de los intervalos: 

L =   =    =      = 69.31 


. .

Redondeando conforme a los datos originales, los cuales no tienen cifras después del punto  

Utilizamos la longitud de intervalo 69 

LI = Límite inferior  

LS = Límite superior  

 
Intervalos  
LI  LS 
(el LS de la primera clase será igual al límite 
140   inferior más la longitud del intervalo, y así 
(el LI de la primera clase será el dato menor)  sucesivamente) 
140+69= 209 
(el LS de la segunda  clase será igual al límite 
209+1 = 210 (el LI de la segunda  clase será 
inferior más la longitud del intervalo, y así 
igual al límite superior  anterior más la 1, 
sucesivamente) 
según sea la escala, y así sucesivamente) 
210 + 69 = 279 
279 + 1 = 280  280 + 69 = 349 
349 + 1 = 350  350 + 69 = 419 
419 + 1= 420  420 + 69 = 489 
489 + 1 = 490  490 + 69 = 559 
560 + 69 = 629 
Verificar que el dato mayor se encuentre 
559 + 1 = 560 
dentro de los intervalos. Por lo que 
llevaremos este valor a 630 
 

Intervalos  
LI  LS 
[ 140  209 ] 
[ 210  279 ] 
[ 280  349 ] 
[ 350  419 ] 
[ 420  489 ] 
[ 490  559 ] 
[ 560  630 ] 
 

 
Marca de clase (Xi). Es un número que representa cada intervalo, este coincide con el punto medio de cada 
intervalo. 

Xi =   

Intervalos   Xi 
LI  LS 

[ 140  209 ]  Xi =   = 174.50 


[ 210  279 ]  244.5 
[ 280  349 ]  314.5 
[ 350  419 ]  384.5 
[ 420  489 ]  454.5 
[ 490  559 ]  524.5 
[ 560  630 ]  595 
La frecuencia absoluta de una variable es el número de veces que aparece en la muestra dicho valor de la 
variable. Es contar la frecuencia (repeticiones) que aparece la variable. 

En este caso contaremos los datos que aparecen entre cada intervalo 

  

Intervalos  
fi 
LI  LS 
Entre 140 y 209 tenemos dos 
[ 140  209 ]  datos 140 y 200, por lo que fi 
para esta clase es igual a 2 
Entre los límites 213 y 279 
tenemos cinco datos: 220, 
[ 210  279 ]  230, 250, 260 y 270. Por lo 
que fi para esta clase es 
igual a 5 
[ 280  349 ]  7 
[ 350  419 ]  16 
[ 420  489 ]  10 
[ 490  559 ]  8 
[ 560  630 ]  2 
 

 
Frecuencia relativa (fr). 

La frecuencia relativa representa una proporcion en base a la unidad. Se divide cada valor de fi entre el 
numero total de datos.  

fr=   

fi  fr 

2   = 0.04 
5   = 0.10 
7   = 0.14 
16   = 0.32 
10   = 0.20 
8   = 0.16 
2   = 0.04 
50  1.00 
Frecuencia absoluta acumulada (Fi) 

La frecuencia absoluta acumulada es el número de veces que ha aparecido en la muestra un valor menor o 
igual que el de la variable. 

fi  Fi 

2  (el primer valor debe ser igual al primer valor de 
la frecuencia absoluta (fi)) 
En este caso igual a  2 
5  (en las siguientes clases se suma el valor anterior 
con el valor de la frecuencia absoluta de la clase) 
2+5=7 
7  7+7=14 
16  14+16=30 
10  30 + 10 = 40 
8  40 + 8 = 48 

48 + 2 = 50 

50 
 

 
Frecuencia relativa acumulada  

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y 
el número total de datos. 

fr  Fr 

0.04  (el primer valor debe ser igual 
al primer valor de la 
frecuencia relativa (fr)) 
En este caso igual a  0.04 
0.10  (en las siguientes clases se 
suma el valor anterior con el 
valor de la frecuencia 
absoluta de la clase) 
0.04+0.10=0.14 
0.14  0.28 
0.32  0.60 
0.20  0.80 
0.16  0.96 
0.04  1 
 

 
Finalmente obtenemos una tabla de la forma: 

Intervalos  
Clases   Xi  fi  Fr  Fi  Fr  fp 
LI  LS 
1  [ 140  209 ]  174.5  2  0.04  2  0.04  4% 
2  [ 210  279 ]  244.5  5  0.10  7  0.14  10% 
3  [ 280  349 ]  314.5  7  0.14  14  0.28  14% 
4  [ 350  419 ]  384.5  16  0.32  30  0.60  32% 
5  [ 420  489 ]  454.5  10  0.20  40  0.80  20% 
6  [ 490  559 ]  524.5  8  0.16  48  0.96  16% 
7  [ 560  630 ]  595  2  0.04  50  1  4% 
Total        50  1.00      100.00% 
 

35%

30%

25%

20%

15%

10%

5%

0%
1 2 3 4 5 6 7
Para los precios de  fuera de la ciudad utilizaremos el mismo procedimiento.  

230  230  240  240  250  250  260  260  260  260 
270  270  280  280  290  290  300  300  300  300 
300  310  310  320  320  320  330  330  340  340 
360  370  370  370  380  380  380  380  380  380 
390  390  410  430  440  440  480  510  510  550 
 

K = 6.64 ‐> 7 clases  

L =   =    =      = 45.26 


. .

L = 45 redondeando.  

Obtenemos la siguiente tabla  

Intervalos  
Clases   Xi  fi  fr  Fi  Fr  fp 
LI  LS 
1  230  275  252.5  12  0.24  12  0.24  24.00% 
2  276  321  298.5  14  0.28  26  0.52  28.00% 
3  322  367  344.5  5  0.1  31  0.62  10.00% 
4  368  413  390.5  12  0.24  43  0.86  24.00% 
5  414  459  436.5  3  0.06  46  0.92  6.00% 
6  460  505  482.5  1  0.02  47  0.94  2.00% 
7  506  551  528.5  3  0.06  50  1  6.00% 
Total    50  1    100.00% 
 

30.00%

25.00%

20.00%

15.00%

10.00%

5.00%

0.00%
1 2 3 4 5 6 7
 
Semana V:

Medidas de tendencia de centralización: media (aritmética y ponderada), mediana y moda.

La media aritmética es la medida de tendencia central conocida popularmente como el promedio.

Fórmula para datos sueltos:

_
X= 19,570 = 391.4
50

Nota: La suma de todos los datos entre el número total de datos.

Fórmula para datos agrupados:

Ejemplo:

Clases Xi fi Xi * fi
1 176 2 352
2 249 5 1245
3 322 10 3220
4 395 15 5925
5 468 12 5616
6 541 5 2705
7 614 1 614
Total 50 19,677

_
X= 19,677
50
_
X= 393.54.
La mediana se define como aquel valor nominal que tiene dentro de un conjunto de datos ordenados, arriba y
debajo de él, el mismo número de datos nominales.

Fórmula para datos sueltos:

Datos pares: n
2

Datos impares: n+1


2

Fórmula para datos agrupados:

1. Se debe determina el intervalo de clase que contiene la mediana.


2. Se determina mediante la siguiente fórmula:

Me= Lim + (n/2 – fac) L


f

 Lim: límite real inferior de la clase que contiene la mediana.


 n: número total de datos.
 fac: frecuencia absoluta acumulada anterior a la clase que contiene la mediana.
 f: frecuencia absoluta de la clase que contiene la mediana.
 L: longitud del intervalo.

Ejemplo:

Me= 358.5 + (25 – 17) 73


15

Me= 358.5 + (8) 73


15

Me= 358.5 + (0.533) 73

Me= 358.5 + 38.933

Me= 397.43

La moda se define como aquel valor nominal que tiene la frecuencia mayor, el que más se repite.

Un conjunto de datos puede ser:

 Unimodal (cuando tiene una sola moda).


 Bimodal (cuando tiene dos).
 Multimodal (cuando hay varias).

Nota: Para datos sueltos se busca con la vista.


Fórmula para datos agrupados:

1. Determinar el intervalo de clase que contiene la moda, este será el de mayor frecuencia absoluta.
2. Interpolar la moda mediante la siguiente expresión:

Mo= Li + ( d1 ) L
d1 + d2

 Lim: Limite inferior de la clase que contiene la moda.


 d1: diferencia entre la frecuencia absoluta de la clase que contiene la moda y la clase anterior.
 d2: diferencia entre la frecuencia absoluta de la clase que contiene la moda y la que le sigue.
 L: Longitud del intervalo.

Ejemplo:

Mo= 358.5 + ( 5 )73


5+3

Mo= 358.5 + (5) 73


8

Mo= 358.5 + (0.625) 73

Mo= 358.5 + 45.625

Mo= 404.125

Das könnte Ihnen auch gefallen