Marco Teorico y Caratula

UNIVERSIDAD NACIONAL DE INGENIERÍA
Facultad de Ingeniería Civil

Departamento Académico de Ciencias Básicas
DEPARTAMENTO ACADEMICO CIENCIAS BASICAS

ESTADISTICA Y PROBABILIDADES - MA611
CICLO 2018-I
TITULO
TEMA:
TITULO
PROFESOR : Pozo Vilchez, Manuel
ALUMNO : Chucos Garay Charles Ali 20080208G
Fecha presentación: 12 de abril del 2018

1
INDICE
1. DEFINICIONES GENERALES
1.1. DEFINICION
1.2. VARIABLES ESTADISTICAS
1.3. MEDIDAS DE POSICION CENTRAL
1.4. MEDIDAS DE POSICION NO CENTRAL
1.5. MEDIDAS DE DISPERSION
1.6. ASIMETRIA Y CURTOSIS
1.7. FRECUENCIAS
2. RESOLUCION DE PROBLEMAS
2
1. DEFINICIONES GENERALES
1.1. DEFINICION
La estadística descriptiva es la rama de la estadística que recolecta, analiza y
caracteriza un conjunto de datos (peso de la población, beneficios diarios de una
empresa, temperatura mensual, etc.) con el objetivo de describir las características y
comportamientos de este conjunto mediante medidas de resumen, tablas o gráficos.
1.2. VARIABLES ESTADISTICAS

Una variable estadística es el conjunto de valores que puede tomar cierta característica
de la población sobre la que se realiza el estudio estadístico y sobre la que es posible
su medición. Estas variables pueden ser: la edad, el peso, las notas de un examen, los
ingresos mensuales, las horas de sueño de un paciente en una semana, el precio
medio del alquiler en las viviendas de un barrio de una ciudad, etc.
Las variables estadísticas se pueden clasificar por diferentes criterios. Según su

medición existen dos tipos de variables:
 Cualitativa (o categórica): son las variables que pueden tomar como valores
cualidades o categorías.
3
Ejemplos:
Sexo (hombre, mujer)

Salud (buena, regular, mala)
 Cuantitativas (o numérica): variables que toman valores numéricos.

Ejemplos:
Número de casas (1, 2,…). Discreta.

Edad (12,5; 24,3; 35;…). Continua.
Las variables cualitativas (o variables categóricas) se pueden clasificar según sigan una
jerarquía o un orden determinado.
Las variables cuantitativas se clasifican según el número de valores que puede tomar la
variable.
4
1.3. MEDIDAS DE POSICION CENTRAL

Las variables se pueden clasificar también según si son independientes o dependientes:
 Variable independiente: Es una variable que su valor no depende de otra

variable. La variable independiente suele representarse en las gráficas en el eje
de abcisas (x).
En un diseño experimental a la variable independiente se le suele denominar

también variable de entrada, o variable manipulada.
 Variable dependiente: Es una variable cuyos valores dependen de los valores

que tome otra variable. Se representa en el eje de ordenadas y.
En una función puede haber combinación de los dos tipos. Por ejemplo, el
capital invertido por una federación de una especialidad atlética de un país ante
un campeonato deportivo (variable independiente cuantitativa) y las medallas
obtenidas (variable dependiente cualitativa).
El investigador utiliza estas variables en el estudio estadístico con el fin de con el de

encontrar alguna causalidad de ciertas variables sobre las variables objetivo del estudio.

Las medidas de tendencia central (o de centralización) son medidas que tienden a
localizar en qué punto se encuentra la parte central de un conjunto ordenado de datos
de una variable cuantitativa.
Media
Definimos media (también llamada promedio o media aritmética) de un conjunto de
datos (X1,X2,…,XN) al valor característico de una serie de datos resultado de la suma
de todas las observaciones dividido por el número total de datos.
Visto desde un punto de vista más conceptual, la media aritmética es el centro de los
datos en el sentido numérico, ya que intenta equilibrarlos por exceso y por defecto. Es
decir, si sumamos todas las diferencias de los datos a la media da cero.
5
Mediana
La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1,X2,…,XN)
que deja a izquierda y derecha la mitad de valores.
Si el conjunto de datos no está ordenado, la mediana es el valor del conjunto tal que el
50% de los elementos son menores o iguales y el otro 50% mayores o iguales.
Moda
La moda (Mo(X)) es el valor más repetido del conjunto de datos, es decir, el valor cuya
frecuencia relativa es mayor. En un conjunto puede haber más de una moda.
1.5. MEDIDAS DE POSICION NO CENTRAL
Las medidas de posición no central (o medidas de tendencia no central) permiten conocer

puntos característicos de una serie de valores, que no necesariamente tienen que ser
6
centrales. La intención de estas medidas es dividir el conjunto de observaciones en

grupos con el mismo número de valores.
Cuartiles
Los cuartiles son los tres valores que dividen una serie de datos ordenada en cuatro
porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los datos. El segundo
(Q2) deja a izquierda y derecha el 50% y coincide con la mediana. El tercero (Q3) deja a la
derecha el 25% de valores. Los tres cuantiles son:
Percentiles
El percentil es una medida de posición no central. Los percentiles Pi son los 99 puntos que
dividen una serie de datos ordenada en 100 partes iguales, es decir, que contienen el
mismo número de elementos cada una. El percentil 50 es la mediana.
Sea (X1, X2,…,XN) una muestra de N elementos. El percentil Pi es:
Donde Pi es la posición del percentil buscado en la serie ordenada de datos.

Los percentiles están pensados para conjuntos de elementos de más de cien elementos.
7

Las medidas de dispersión o medidas de variabilidad muestran la variabilidad de un
conjunto de datos, indicando la mayor o menor concentración de datos respecto a las
medias de centralización.
Rango
El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el mínimo de
un conjunto de elementos.
Fórmula del Rango

Rango intercuartílico
El rango intercuartílico (IQR) (o rango intercuartil) es una estimación estadística de la
dispersión de una distribución de datos. Consiste en la diferencia entre el tercer y el
primer cuartil. Mediante esta medida se eliminan los valores extremadamente alejados.
El rango intercuartílico es altamente recomendable cuando la medida de tendencia
central utilizada es la mediana (ya que este estadístico es insensible a posibles
irregularidades en los extremos).
Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy visual
para evaluar la dispersión de una distribución.
8
Varianza
La varianza (S2) mide la dispersión de los datos de una muestra respecto a la media,
calculando la media de los cuadrados de las distancias de todos los datos.
Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas respecto
a la media no se anulan entre si. Además, resaltan los valores alejados.
Siempre se cumple que la varianza es mayor o igual que cero (S2 ≥ 0). La varianza es
cero cuando todos los datos son el mismo (ejemplo: {1,1,1,1,1}).
Si en vez de tratarse de una muestra, la varianza se refiere a la población, el
denominador será N.
Desviación típica
La desviación típica es la medida de dispersión (S) asociada a la media. Mide el
promedio de las desviaciones de los datos respecto a la media en las mismas unidades
de los datos.
El cuadrado de la desviación típica es la Varianza.
9
Coeficiente de variación de Pearson

El coeficiente de variación de Pearson (r) mide la variación de los datos respecto a la
media, sin tener en cuenta las unidades en la que están.
El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0,

significa que existe poca variabilidad en los datos y es una muestra muy compacta. En
cambio, si tienden a 1 es una muestra muy dispersa.
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en
tanto por cien.
1.7. FRECUENCIAS
La frecuencia es una medida que sirve para comparar la aparición de un elemento Xi en
un conjunto de elementos (X1, X2,…, XN). Mediante tablas de distribuciones de
frecuencia se puede presentar organizadamente el recuento de datos.
Las frecuencias de cada elemento se pueden expresar tanto absolutas (número total de
apariciones) como relativas (proporción de apariciones).
Si los datos provienen de una variable cuantitativa o existen muchas categorías, los datos
se suelen agrupar en clases. Cada clase, que tiene un intervalo o amplitud constante,
está representado por su marca de clase, que es el punto medio de la misma.
10
Frecuencia absoluta
La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor está en el
conjunto (X1, X2,…, XN).}
La suma de las frecuencias absolutas de todos los elementos diferentes del conjunto
debe ser el número total de sujetos N. Si el conjunto tiene k números (o categorías)
diferentes, entonces:
Fórmula de la suma de las frecuencias absolutas que tiene como resultado el número
total de elementos N.
Frecuencia absoluta acumulada

La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…, XN) es la
suma de las frecuencias absolutas de los valores menores o iguales a Xi, es decir:
Frecuencia relativa
La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en el
conjunto de datos (X1, X2, …, XN). Es decir, la frecuencia relativa es la frecuencia
absoluta dividida por el número total de elementos N:
Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de las frecuencias
relativas de todos los sujetos da 1. Supongamos que en el conjunto tenemos k números
(o categorías) diferentes, entonces:
11
Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto por cien %).
Frecuencia relativa acumulada

Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como la proporción de
valores iguales o menores a Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la
frecuencia relativa acumulada es la frecuencia absoluta acumulada dividida por el número
total de sujetos N:
La frecuencia relativa acumulada de cada valor siempre es mayor que la frecuencia

relativa. De hecho, la frecuencia relativa acumulada de un elemento es la suma de las
frecuencias relativas de los elementos menores o iguales a él, es decir:
Tabla de frecuencias
La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la
distribución de los datos mediante sus frecuencias. Se utiliza para variables cuantitativas
o cualitativas ordinales.
12
La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que
se presentan numéricamente las características de la distribución de un conjunto de
datos o muestra.
Construcción de la tabla de frecuencias

 En la primera columna se ordenan de menor a mayor los diferentes valores que
tiene la variable en el conjunto de datos.
 En las siguientes columnas (segunda y tercera) se ponen las frecuencias
absolutas y las frecuencias absolutas acumuladas.
 Las columnas cuarta y quinta contienen la las frecuencias relativas y las
frecuencias relativas acumuladas.
 Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima),
representando la frecuencia relativa y la frecuencia relativa acumulada como
tanto por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias
por cien.
13

Marco Teorico y Caratula

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Marco Teorico y Caratula

Hochgeladen von

Copyright:

Verfügbare Formate

UNIVERSIDAD NACIONAL DE INGENIERÍA

Facultad de Ingeniería Civil

DEPARTAMENTO ACADEMICO CIENCIAS BASICAS

PROFESOR : Pozo Vilchez, Manuel

ALUMNO : Chucos Garay Charles Ali 20080208G

Fecha presentación: 12 de abril del 2018

1.2. VARIABLES ESTADISTICAS

Las variables estadísticas se pueden clasificar por diferentes criterios. Según su

Sexo (hombre, mujer)

 Cuantitativas (o numérica): variables que toman valores numéricos.

Número de casas (1, 2,…). Discreta.

1.3. MEDIDAS DE POSICION CENTRAL

 Variable independiente: Es una variable que su valor no depende de otra

En un diseño experimental a la variable independiente se le suele denominar

 Variable dependiente: Es una variable cuyos valores dependen de los valores

El investigador utiliza estas variables en el estudio estadístico con el fin de con el de

1.4. MEDIDAS DE DISPERSION

1.5. MEDIDAS DE POSICION NO CENTRAL

Las medidas de posición no central (o medidas de tendencia no central) permiten conocer

centrales. La intención de estas medidas es dividir el conjunto de observaciones en

Donde Pi es la posición del percentil buscado en la serie ordenada de datos.

1.6. MEDIDAS DE DISPERSION

Fórmula del Rango

El cuadrado de la desviación típica es la Varianza.

Coeficiente de variación de Pearson

El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0,

Frecuencia absoluta acumulada

Frecuencia relativa acumulada

La frecuencia relativa acumulada de cada valor siempre es mayor que la frecuencia

Construcción de la tabla de frecuencias

Das könnte Ihnen auch gefallen