Beruflich Dokumente
Kultur Dokumente
AULA: 108
PUNO-PERU
2018
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Dedicatoria:
la confianza en nosotros
Agradecimiento:
INTRODUCCION:
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son:
media, mediana y moda. Las medidas de dispersión en cambio miden el grado de
dispersión de los valores de la variable. Dicho en otros términos las medidas de
dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma,
ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos
entregando información acerca de su posición y su dispersión.
En muchas situaciones de la vida real, se presentan problemas en los cuales existe una
relación entre dos o más variables y se hace necesario encontrar la naturaleza de esta
relación.
Éste trabajo ilustra una situación real de la empresa ESTIMAR LTDA donde se tienen
los ingresos y costos obtenidos durante los últimos 18 meses y se analiza la relación
existente entre ellos.
Para esto se hizo uso de la técnica de Regresión y Correlación, la cual resulta una
herramienta muy útil a la hora de analizar el comportamiento de dos o más variables
relacionadas.
Se pretende entonces establecer mediante una regresión la relación entre dichos datos al
igual que calcular algunos pronósticos que puedan dar una idea de cómo será el
comportamiento de los ingresos y costos en los próximos meses.
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Media aritmética
representatividad en los análisis estadísticos. Se representa por la letra griega µ cuando
se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata
del promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras
que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la
misma población tienden a tener diferentes medias. La media se expresa en la misma
unidad que los datos originales: centímetros, horas, gramos, etc. . Su cálculo se
realización la suma de todos los valores de los datos, dividida entre el número de datos
que componen la muestra
Ejemplo de desviaciones:
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable
que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es
decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el
otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al promedio de los dos
valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/ 2=10
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En
un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el
punto más alto del gráfico. Una muestra puede tener más de una moda.
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación
estándar de la muestra expresada como porcentaje de la media muestral.
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Donde:
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos por
madre,
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de
clase (Yc), de tal modo que la fórmula queda:
Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo
Percentiles
Los percentiles son valores de la variable que dividen la distribución en 100 partes
iguales. De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa que
el 80% de los casos tiene edad igual o inferior a 35 años.
El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).
El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor
4. Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente
más complejo ya que se hace necesaria la aplicación de una fórmula.
Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente
superior al “j” % de los casos (jxn/100).
2. La mediana será:
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Esto significa que un 50% de las familias tiene ingreso mensual igual o inferior a
$127.270.
3. El percentil 78 será:
Por lo tanto se puede decir que 78% de las familias tienen ingreso igual o inferior a
$174.660.
MEDIDADAS DE VARIAVILIDAD
Desviación media, Dm
Se define la desviación media como la media de las diferencias en valor absoluto de los
valores de la variable a la media, es decir, si tenemos un conjunto
de n observaciones, x1, ..., xn, entonces
Si los datos están agrupados en una tabla estadística es más sencillo usar la relación
Como se observa, la desviación media guarda las mismas dimensiones que las
observaciones. La suma de valores absolutos es relativamente sencilla de calcular, pero
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
esta simplicidad tiene un inconveniente, esto hace que sea muy engorroso trabajar con
ella a la hora de hacer inferencia a la población.
pues sabemos que esa suma vale 0, ya que las desviaciones con respecto a la
media se compensan al haber términos en esa suma que son de signos distintos.
Para tener el mismo signo al sumar las desviaciones con respecto a la media
podemos realizar la suma con valores absolutos. Esto nos lleva a la Dm, pero
como hemos mencionado, tiene poco interés por las dificultades que presenta.
Vamos a definir entonces dos estadísticos que serán fundamentales en el resto del curso:
La varianza y la desviación típica.
Para datos agrupados en tablas, usando las notaciones establcidas en los capítulos
anteriores, la varianza se puede escibir como
La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones
se miden en metros, la varianza lo hace en ). Si queremos que la medida de
dispersión sea de la misma dimensionalidad que las observaciones bastará con tomar su
raíz cuadrada. Por ello se define la desviación típica, , como
Ejemplo
Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros:
3,3,4,4,5
La varianza es:
Observación
Además de las propiedades que hemos demostrado sobre la varianza (y por tanto sobre
la desviación típica), será conveniente tener siempre en mente otras que enunciamos a
continuación:
Cálculo:
CV =
REGRESIONES
La regresión es una técnica estadística utilizada para simular la relación existente entre
dos o más variables. Por lo tanto se puede emplear para construir un modelo que
permita predecir el comportamiento de una variable dada.
La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se
hace de mala forma, por lo cual es necesario realizar una selección adecuada de las
variables que van a construir las ecuaciones de la regresión, ya que tomar variables que
no tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir
ilógico.
Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden
darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática,
entre otras. Las ecuaciones de cada relación se presentan en la siguiente tabla.
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
REGRESIÓN ECUACIÓN
Lineal y = A + Bx
Logarítmica y = A + BLn(x)
Exponencial y = Ae(Bx)
Cuadrática y = A + Bx +Cx2
Perfecta |R| = 1
Por lo tanto el análisis de regresión es una herramienta estadística que permite analizar y
predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es
decir una herramienta útil para la planeación.
Después de éste tratamiento superficial acerca de regresiones, se continua con un caso
práctico relacionado con la empresa ESTIMAR LTDA.
A continuación se presentan los ingresos y costos en millones obtenidos mensualmente
durante todo el año 2002 y los seis primeros meses del 2003.
Optamos por presentar éste caso ya que resulta muy práctico a la hora de aplicar la
técnica de regresión. Además porque permite analizar como se han comportado los
ingresos y costos de la empresa a partir del año 2002 y a su vez pronosticar según la
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
tendencia arrojada, como será el comportamiento de los ingresos y costos para el resto
del año 2003 y con base en ellos inferir o tomar decisiones a corto plazo.
Distribuciones Bivariantes
Es cuando sobre una población estudiamos simultáneamente los valores de dos
variables estadísticas, el conjunto de los pares de valores correspondientes a
cada individuo se denomina distribución bivariantes.
Ejemplo 1:
Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente
tabla:
MATEMÁTICAS 2 4 5 5 6 6 7 7 8 9
LENGUA 2 2 5 6 5 7 5 8 7 10
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y
será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con
respecto a la recta.
En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya
que la recta que hemos dibujado está próxima a los puntos de la nube.
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una
variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior.
Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una
variable, la otra tiene tendencia a disminuir.
Ejemplo 2:
Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50
preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos
realizados.
Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y
negativa (la recta es decreciente).
Diagrama De Dispersión
La primera forma de describir una distribución bivariante es representar los pares de
valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos
o diagrama de dispersión.
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
Las medidas de tendencia central son el conjunto de mecanismos que se tiene para
el estudio de los métodos y procedimientos donde se dan los datostabulados que ayudan
a dar inferencias científicas partiendo de tales datos. Estos datos sirven para que todas
las ramas de la ciencia donde se necesita llegar a darconclusiones sobre situaciones; por
medio de los datos se forman grupos describiéndolos con soloun número. Para tal fin no
se utilizan los extremos sino que un valor más típico, el cual seencuentra en el centro.
Este centro sirve para poder llegar a un punto medio donde se ubicaría el promedio o
punto central de los datos descritos para poder establecer resultados como se puede ver
a lo largo dela historia como es el caso de Mendel.
http://matematicas.reduaz.mx/home/Docentes/ltrueba/diplomado/pagina15.h
tm:
UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO
recuperado
http://www.monografias.com/trabajos14/estadistica/estadistica.shtml#ixzz5FWIP
Pb7N
recuperado http://www.monografias.com/trabajos14/estadistica/estadistica.shtml
recurerado http://paginas.facmed.unam.mx/deptos/sp/wp-
content/uploads/2013/12/Quevedo-F.-
recuperado https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
recuperado https://aprendiendoadministracion.com/medidas-de-tendencia-central-
media-mediana-moda-rango-y-eje-medio/
recuperado http://www.monografias.com/trabajos109/moda-media-y-mediana/moda-
media-y-mediana.shtml#ixzz5FWuDMTHd
recurerado Medidas-de-tendencia-central-y-dispersion.-Medwave-2011-Ma-
113..pdf