Material Estudio Estadística

CONCEPTOS BÁSICOS
Autor: Orlando Acosta www.monografias.com
 Definición de estadística
"La estadística es una técnica especial apta para el estudio cuantitativo de los
fenómenos de masa o colectivo, cuya mediación requiere una masa de
observaciones de otros fenómenos más simples llamados individuales o
particulares". (Gini, 1953).
Murray R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones
válidas y tomar decisiones razonables basadas en tal análisis.
Estadística es una ciencia que proporciona un conjunto de métodos que se utilizan
para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los
datos con respecto a una característica, materia de estudio o investigación. En
primera instancia se encarga de obtener información, describirla y luego usa esta
información a fin de predecir algo respecto a la fuente de información. (Moya
Calderón, Rufino).
La estadística es el arte de aprender a partir de los datos. Está relacionada con la
recopilación de datos, su descripción subsiguiente y su análisis, lo que nos lleva a
extraer conclusiones. (M. Ross, Sheldon).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que
tiene la estadística, debido al gran campo de aplicación que posee.
 Clasificación
Podemos definir la Estadística Descriptiva como un método para describir
numéricamente conjuntos numerosos. (Vargas Sabadías, Antonio. 1995).
Por tratarse de un método de descripción numérica, la estadística descriptiva utiliza
el número como medio para describir un conjunto, que debe ser numeroso, ya que
las permanencias estadísticas no se dan en los casos raros. No es posible, por
tanto, sacar conclusiones concretas y precisas de los datos estadísticos. La
Estadística Descriptiva trata sobre el análisis y presentación de la información, luego
de su recolección, se elabora cuadros estadísticos, gráficos y algunos cálculos.
La estadística inferencial tiene como función generalizar los resultados de
la muestra para estimar las características de la población. No obstante, el conjunto
de datos muestrales puede describirse o analizarse de la misma forma que una
población. Por lo tanto, el conjunto de datos u observaciones de una muestra puede
utilizarse en un doble sentido: primero, para describir el propio conjunto de
observaciones y, segundo, para inferir o predecir lo que ocurre en la población.
(Spagni De Barletta; 2005)
En consecuencia, la fase descriptiva es común a cualquier conjunto de
observaciones o datos, ya se refieran éstos a toda la población, a una muestra o,
incluso, a una subpoblación. La Estadística Descriptiva es la parte más clásica, más
conocida y más elemental de la ciencia estadística.
 Bibliografía
 Corrado Gini, Luigi Galvani. Curso de Estadística, 1953.
 Spiegel, Murray R. Estadística. McGraw-Hill, 1991.
 M. Ross, Sheldon. Introducción a la Estadística. Editorial Reverté, S.A.
1
 Moya Calderón, Rufino. Estadística descriptiva. Conceptos y Aplicaciones. Lima-
Perú. 1991
 Pardo Merino, Antonio; Ruiz Díaz, Miguel Ángel. Spss 11 Guía Para el Análisis
de Datos. McGraw-Hill, 2002.
 www.monografias.com
 www.wikipedia.com
 www.ditutor.com
¿Qué son la Estadística Descriptiva e Inferencial?

Tatiana Mejia Jervis https://www.lifeder.com/estadistica-descriptiva-inferencial/
La estadística descriptiva e inferencial forman parte de las dos ramas

fundamentales en las que se divide la estadística, la ciencia exacta que se encarga
de extraer información de diversas variables, midiéndolas, controlándolas y
comunicándolas en caso de que haya incertidumbre.
De esta manera, la estadística tiene como objetivo cuantificar y controlar
comportamientos y eventos tanto científicos como sociales.
La estadística descriptiva se encarga de resumir la información derivada de los
datos relativos a una población o muestra. Su objetivo es sintetizar dicha
información de forma precisa, sencilla, clara y ordenada (Santillán, 2016).
Es así como la estadística descriptiva puede señalar los elementos más
representativos de un grupo de datos, conocidos como datos estadísticos. En pocas
palabras, este tipo de estadística se encarga de hacer descripciones de dichos
datos.
Por su parte, la estadística inferencial se encarga de hacer inferencias sobre los
datos recogidos. Arroja conclusiones diferentes a lo mostrado por los datos en sí.
Este tipo de estadística va más allá de la simple recopilación de información,
relacionando cada dato con fenómenos que pueden alterar su comportamiento.
La estadística inferencial llega a conclusiones relevantes sobre una población a
partir de análisis de una muestra. Por lo tanto, siempre debe calcular un margen de
error dentro de sus conclusiones.
Estadística descriptiva
Es la rama de la estadística más popular y conocida. Su principal objetivo es el de
analizar variables y posteriormente describir los resultados obtenidos de dicho
análisis.
La estadística descriptiva busca describir un grupo de datos con el objetivo de
señalar de forma precisa las características que definen a dicho grupo (Fortun,
2012).
Se puede decir que esta rama de la estadística es la responsable de ordenar,
resumir y clasificar los datos resultantes del análisis de la información derivada de
un grupo.
2
Algunos ejemplos de la estadística descriptiva pueden incluir los censos de
población de un país en un año determinado o el número de personas que fueron
recibidas en un hospital dentro de un margen de tiempo determinado.
Categorías
Existen ciertos conceptos y categorías que forman parte exclusivamente del campo
de la estadística descriptiva. Algunos se listan a continuación:
– Dispersión: es la diferencia que existe entre los valores incluidos dentro de una
misma variable. La dispersión también incluye el promedio de dichos valores.
– Promedio: es el valor que resulta de la sumatoria de todos los valores incluidos
en una misma variable y la posterior división del resultado por el número de datos
incluidos en la sumatoria. Se define como la tendencia central de una variable.
– Sesgo o curtosis: es la medida que indica qué tan inclinada es una curva. Es el
valor que indica la cantidad de elementos que se encuentran más próximos al
promedio. Existen tres tipos diferentes de sesgo (leptocúrtica, mesocúrtica y
platicúrtica), cada uno de ellos indica qué tan alta es la concentración de datos
alrededor del promedio.
– Gráficos: son la representación gráfica de los datos obtenidos del análisis.
Usualmente, son utilizados diferentes tipos de gráficos estadísticos, incluidos los de
barras, circulares, lineales, poligonales, entre otros,
– Asimetría: es el valor que muestra la manera como los valores de una misma
variable se encuentran repartidos con relación al promedio. Puede ser negativa,
simétrica o positiva (Formulas, 2017).
Estadística inferencial
Es el método de análisis utilizado para hacer inferencias sobre una población,
teniendo en cuenta los datos arrojados por la estadística descriptiva sobre un
segmento de la misma muestra. Dicho segmento debe ser elegido bajo criterios
rigurosos.
La estadística inferencial se vale del uso de herramientas especiales que le permiten
hacer afirmaciones globales sobre la población, a partir de la observación de una
muestra.
Los cálculos llevados a cabo por este tipo de estadística son aritméticos y siempre
dan cabida a un margen de error, cosa que no sucede con la estadística descriptiva,
que se encarga de analizar a la totalidad de la población.
Por tal motivo, la estadística inferencial requiere de hacer uso de modelos de
probabilidades que le permiten inferir conclusiones sobre una población amplia
basándose únicamente en lo que una parte de ella le indica (Vaivasuata, 2015).
Según la estadística descriptiva es posible obtener datos de una población general
a partir del análisis de una muestra conformada por individuos seleccionados de
forma aleatoria.
Categorías
La estadística inferencial puede ser clasificada en dos grandes categorías descritas
a continuación:
– Pruebas de hipótesis: como su nombre lo indica, consiste en poner a prueba
aquello que se concluyó sobre una población a partir de los datos arrojados por la
muestra.
– Intervalos de confianza: estos son los rangos de valores señalados dentro de la
muestra de una población para identificar una característica relevante y
3
desconocida (Minitab Inc., 2017). Por su naturaleza aleatoria, son los que permiten
reconocer un margen de error dentro de cualquier análisis estadístico inferencial.
Diferencias entre la estadística descriptiva y la inferencial
La principal diferencia entre la estadística descriptiva y la inferencial radica en que
la primera busca ordenar, resumir y clasificar los datos derivados del análisis de
variables.
Por su parte, la estadística inferencial, lleva a cabo deducciones con base a los
datos previamente obtenidos.
Por otro lado, la estadística inferencial depende del trabajo de la estadística
descriptiva para llevar a cabo sus inferencias.
De este modo, la estadística descriptiva constituye la base sobre la que
posteriormente la estadística inferencial llevará a cabo su trabajo.
También es importante señalar que la estadística descriptiva se utiliza para analizar
tanto poblaciones (grupos numerosos) como muestras (subconjuntos de las
poblaciones).
Mientras que la estadística inferencial se encarga de estudiar muestras a partir de
las cuales busca llegar a conclusiones sobre la población general.
Otra diferencia entre estos dos tipos de estadística radica en que la estadística
descriptiva únicamente se centra en la descripción de los datos obtenidos, sin
asumir que estos tengan ninguna propiedad relevante.
Ésta no va más allá de lo que los mismos datos obtenidos puedan señalar. Por su
parte, la estadística inferencial cree que todos los datos derivados de cualquier
análisis estadístico dependen de fenómenos externos y aleatorios que pueden
alterar su valor.
Rev. chil. anest. Vol. 43 Número 2 pp. 109-

111|https://doi.org/10.25237/revchilanestv43n02.06PDF|ePub|RIS
LOS DATOS
 Los datos son los valores que toma una variable
cuando es medida.
 Los datos pueden ser cualitativos y cuantitativos.
 Los cualitativos pueden corresponder a dos
categorías, llamados dicotómicos, o a más de dos
categorías.
 Los cuantitativos pueden ser continuos o
discretos.
 Las escalas de medición se definen por las operaciones matemáticas que
pueden ser usadas en su manipulación. Se distinguen escalas nominales,
categóricas, de intervalo y de razón.
En cualquier investigación, de un paciente o grupos de estos, lo que hacemos es
efectuar mediciones que ayuden a entender, evaluar y diferenciar las características
de personas u objetos o grupos de ellas. Así, se miden variables (peso, edad,
presión arterial) y los datos son los valores que toma una variable. Estas mediciones
nos permiten llegar a cierta precisión en las características de una variable de
4
acuerdo a su cantidad, grado, capacidad o cualidad. Se habla de la precisión de una
medición para referirse al grado de exactitud y usualmente esta significa el número
de decimales que se alcanza en la medición. El tipo de datos y las escalas de
medida son importantes por la precisión implícita y porque determinan qué métodos
de análisis son válidos y sensatos.
TIPOS DE DATOS
Una primera caracterización distingue entre datos cualitativos y cuantitativos, y
estos pueden ser continuos o discretos:
1. Los datos cualitativos: pueden corresponder a dos categorías, denominados
dicotómicos, (vivo/muerto, si/no) o a más de dos categorías (fumador, no
fumador, ex fumador). Los sujetos son clasificados sin un orden.
2. Los datos cuantitativos, pueden ser:
 Continuos, aquellos en los que es posible, a lo menos teóricamente, observar
un número infinito de valores regularmente espaciados entre dos puntos
cualesquiera de su intervalo de medidas. En general corresponden a
mediciones (por ejemplo, presión arterial, tiempo, peso, potasemia).
 Discretos, aquellos que sólo pueden tener un número finito de valores en su
intervalo de medidas; en general, corresponden a conteos (por ejemplo,
número de hijos, estadio de las enfermedades, género, y también edad medida
hasta el último cumpleaños o frecuencia cardiaca).
El límite muchas veces lo pone la sensibilidad o precisión de los instrumentos de
medición lo que podría provocar confusión entre lo que es continuo y lo que es
discreto. Por ejemplo, la edad es continua, pero la edad medida hasta el último
cumpleaños es discreta. En la práctica, si se puede efectuar un elevado número de
mediciones en el intervalo de medidas posible y si los intervalos entre las
mediciones son uniformes, esas medidas pueden considerarse continuas para su
análisis.
ESCALAS DE MEDICIÓN
Otra aproximación es que los datos pueden definirse también por la escala usada
para la medición de las variables, distinguiéndose cuatro de ellas: nominales,
ordinales, de intervalo y de razón. Los cuatro niveles de medida determinan qué
operaciones son posibles de usar y por consiguiente las pruebas estadísticas que
son permisibles en cada nivel. Todas las escalas tienen algunas propiedades
formales que proporcionan definiciones de las características de la escala con
mayor exactitud que las que puede asignarse en términos verbales. Estas
propiedades pueden expresarse más abstractamente especificando las
operaciones aritméticas posibles y las relaciones entre los objetos que han sido
clasificados.
1) La escala nominal. Comprende los datos nominales que no tienen un orden: los
datos dicotómicos solo pueden tomar dos valores posibles (como vivo o muerto). Es
el nivel de medición más débil. Los números u otros símbolos se usan simplemente
para clasificar un objeto, persona o característica. Ejemplos: número de ficha clínica,
de teléfono, permiso de circulación, números en las camisetas de un equipo de
fútbol. En una escala nominal, la operación consiste en dividir una clase
determinada en un conjunto de subclases mutuamente excluyentes. La única
relación envuelta es la de equivalencia, simbolizada por el signo =, o su ausencia,
por el símbolo ≠.
5
En las escalas nominales la única operación admisible es la de transformación “uno
a uno” o “simétrica”. Esto implica que los símbolos en la escala pueden ser
intercambiados siempre que esto sea hecho consistente y completamente. Las
únicas estadísticas descriptivas admisibles son aquellas que no cambiarían con una
transformación de ese tipo: el modo y las frecuencias. Bajo ciertas condiciones se
pueden probar hipótesis relacionadas con la distribución de casos en las categorías
usando un chi cuadrado o una prueba exacta de Fisher. La prueba de asociación
más común para datos nominales es el coeficiente C de contingencia.
2) Escala ordinal o de rangos. Comprende los datos ordinales con un mínimo de
tres valores posibles y con un número total limitado. Los objetos en una categoría
no sólo son diferentes de los objetos en otras categorías de esa misma escala sino
que tienen alguna relación con ellos. Relaciones típicas son: mayor, más alto, más
difícil, más enfermo, menos grave. Su significado específico depende de la
naturaleza de la relación que define esa escala. Ejemplos: escalas de clase
socioeconómica, grados de un linfoma, grados de Mallampati, clasificación ASA.
Muchas pruebas o escalas de evaluación resultan en puntajes que tienen la
fortaleza de rangos: el puntaje del Mini Mental State, la escala de Glasgow o el
puntaje APACHE son buenos ejemplos. Aun cuando estos puntajes pueden parecer
más precisos que los rangos, generalmente no cumplen con los requisitos de
escalas de mayor nivel y deben ser consideradas como ordinales.
La diferencia fundamental entre una escala nominal y la ordinal estriba en que ésta
incorpora la relación de “mayor que” (>) o “menor que” (<) a la de equivalencia (=).
Cualquier transformación que no altere el orden de las clases es permisible. La
mejor descripción de la tendencia central es la mediana ya que ésta no se ve
afectada por cambios de puntajes, en tanto no se altere el número de cuentas sobre
o bajo ella. Con la escala ordinal es posible usar todo el rango de pruebas
estadísticas conocidas como “estadísticas ordinales o de rango” o “no
paramétricas”. La única presunción de estas pruebas es que los puntajes deben ser
sacados de una distribución continua.
Las escalas visuales análogas (EVA) pertenecen estrictamente a este grupo y en
rigor debieran ser analizadas con pruebas no paramétricas. Sin embargo, algunos
autores han aducido que el error introducido por un análisis paramétrico es de
escasa magnitud y que no altera las conclusiones, por lo que bien puede
aprovecharse la mayor potencia de las pruebas paramétricas, práctica ampliamente
aceptada en la literatura anestesiológica.
3) La escala de intervalo. Comprende los datos continuos o datos discretos que
contienen un elevado número de posibles valores. Las distancias entre cualquier
par de números de la escala tienen una dimensión conocida y constante por lo que
es posible conocer con certeza la magnitud de los intervalos. Se caracteriza por
tener una unidad común de medida que asigna un número real a todos los pares de
objetos en el conjunto ordenado. Aun cuando el punto cero y la unidad de medida
son arbitrarios, la razón entre dos intervalos es independiente de esa unidad y de
ese punto.
La medición de temperatura se hace en escala de intervalo. Las escalas Fahrenheit
y Celsius tienen cada una su unidad arbitraria, los grados, y también un cero
arbitrario. Ambas escalas, sin embargo, tienen la misma cantidad y tipo de
6
información pues están linealmente relacionadas; la medida en una escala puede
transformarse a la equivalente en la otra mediante una transformación lineal.
Las operaciones y relaciones de una escala de intervalo son similares a la estructura
de la aritmética por lo que pueden utilizarse todas las operaciones. En una escala
de intervalo se puede reconocer la equivalencia (=) y el orden (>) y, además, las
razones de cada intervalo. Las pruebas paramétricas pueden y deben usarse si se
cumplen las otras presunciones puesto que las pruebas no paramétricas restan
potencia al análisis al no usar toda la información contenida en una escala de
intervalo.
4) Escala de razón. Además de todos los atributos de una escala de intervalos,
ésta tiene en su origen un cero verdadero y en ella la razón entre dos puntos de la
escala es independiente de la unidad de medida. La masa, el peso, la distancia, el
tiempo se mide en esta escala. Por ejemplo, si medimos el peso de dos objetos en
gramos o en onzas, la razón es constante, cosa que no sucede si se mide la
temperatura de un cuerpo en grados Celsius o Fahrenheit. Este tipo de escalas sólo
se obtienen cuando las siguientes cuatro relaciones son operacionalmente posibles:
equivalencia, mayor que, razón conocida entre dos intervalos y razón conocida entre
dos valores escalares cualesquiera. Los números asociados con esta escala son
verdaderos con un cero también verdadero. Cualquier prueba estadística puede ser
usada, incluyendo medidas como la media geométrica y el coeficiente de variación
que requieren de un punto cero verdadero.
El orden de las escalas indica la cantidad relativa de información que contiene cada
una de las ellas. Las mediciones de un nivel de información concreto pueden
transformarse o reescalarse a un nivel inferior, pero no es posible reescalar las
variables a un nivel superior al que se midieron realmente. Al reescalar a un nivel
inferior se pierde información, hecho que tiende a aumentar el error tipo II, de no
encontrar una diferencia cuando en realidad existe, si todo lo demás se mantiene
igual. En otras palabras, reescalar a un nivel inferior reduce la potencia estadística
por lo que debe evitarse; por ejemplo, reducir la edad a dos o más grupos,
transformando una variable continua en una categórica.
UNIDAD DE ANÁLISIS
Por ejemplo, en el indicador de analfabetismo, la unidad de análisis es la persona,

la variable o dimensión es la destreza de lectura y escritura y la medida es el
porcentaje de personas que no saben leer y escribir en la población. La unidad de
análisis (o caso) se refiere al quién o qué objeto de investigación.
Esta corresponde a la entidad mayor o representativa de lo que va a ser objeto

específico de estudio en una medición y se refiere al qué o quién es objeto de
interés en una investigación. Por ejemplo: Debe estar claramente definida en un
protocolo de investigación y el investigador debe obtener la información a partir
de la unidad que haya sido definida como tal, aun cuando, para acceder a ella,
haya debido recorrer pasos intermedios.
Las unidades de análisis pueden corresponder a las siguientes categorías o
entidades:
 Personas
7
 Grupos humanos
 Poblaciones completas
 Unidades geográficas determinadas
 Eventos o interacciones sociales (enfermedades, accidentes, casos de
infecciones intrahospitalarias, entre otras)
 Entidades intangibles, susceptibles de medir (exámenes, días camas)
El tipo de análisis al que se someterá la información es determinante para elegir
la unidad de análisis. Por ejemplo, si el objetivo es dar cuenta de la satisfacción
del usuario de un servicio médico, la unidad de análisis natural es el paciente
atendido, o la persona que se atiende en ese servicio médico.
Cuando vamos a utilizar la estadística es necesario hacer referencia al conjunto de

elementos de los que vamos a obtener los datos. Este conjunto es lo que
denominaremos población, pero teniendo en cuenta que pueden ser objetos,
tiempo, etc. y no sólo a personas, como utilizamos en el lenguaje habitual. Otra
forma de denominarlo es universo.
Es necesario que la población esté bien delimitada, y para ello hay que definirla en
el tiempo y en el espacio. Gracias a esta limitación podremos determinar si algo
forma parte o no de la población que estamos estudiando.
Población
Conjunto finito o infinito de elementos, sobre los que vamos
a realizar observaciones.
Por ejemplo: los habitantes de un lugar, las piezas obtenidas
de una máquina en un determinado tiempo, etc.
Como se puede extraer de la definición, la población como
tal es un concepto muy abstracto, esto da lugar a que sea
muy difícil o incluso imposible trabajar con ella al completo
ya que puede ser un tamaño infinito o muy caro. A efectos
prácticos, se estudia un subconjunto o muestra a partir de la cual extrapolamos los
resultados al resto de la población. En general, cuanto mayor es la muestra, mejores
son los resultados que podemos obtener. Por ejemplo: si queremos analizar la
resistencia de las piezas producidas por una máquina en un determinado periodo
de tiempo es evidente que no podemos probar todas las piezas porque las vamos
a dañar debemos seleccionar sólo una parte de ellas.
Por otro lado no podemos elegir la muestra que queramos sin más, para poder
extrapolar los resultados es necesario que cumpla unos requisitos que la conviertan
en estadísticamente significativa.
Las características que se tienen en cuenta son:

a) Tamaño: se establece mediante fórmulas en función del grado de confianza y
precisión que planteemos.
b) Forma de elección: es fundamental para que la muestra sea representativa de la
población de la cual se extrae.
Por ejemplo, si analizamos las piezas producidas por dos máquinas de forma
simultánea e igual número, debemos obtener una muestra en la que ambas estén
representadas en la misma proporción.
8
Muestra
Subconjunto finito de una población. El número de elementos
que forman la muestra se denomina tamaño muestral.
¿Qué se entiende en estadística por "variable"?
Variable: es cada una de las características que pueden

observarse de un elemento de la muestra.
Siguiendo con el ejemplo de las piezas se puede medir grosor,
peso, resistencia, etc. Además de los datos a medir es necesario
especificar, cuando sea preciso, la unidad de medida (por
ejemplo, el grosor en centímetros o en milímetros).
Las variables pueden ser clasificadas en dos grupos:
a) Cualitativas: toman
valores no numéricos.
Dentro de este grupo
diferenciamos:
Nominativas: no existe
ningún orden entre las
categorías de
variables. Por ejemplo:
el grupo sanguíneo (A,
B, AB, 0) o el color del
pelo (moreno, rubio,
pelirrojo).
Binarias: cuando toman dos valores posibles -si/no, presencia/ausencia- (por
ejemplo: casado sí o no, tener licencia de conducir sí o no).
Ordinales: existe un cierto orden entre las categorías de las variables, por
ejemplo el nivel de estudios (sin estudios, básico, secundarios, etc.) o categoría
dentro de una empresa (peón, encargado, etc.)
b) Cuantitativas: toman valores numéricos. Dentro de éstas se agrupan en:
Discretas: tomas valores aislados, normalmente números enteros, por ejemplo
número de hermanos o de hijos.
Continuas: teóricamente puede tomar cualquier valor numérico por ejemplo: el
peso de un individuo. Aunque en la práctica todas tomarían valores discretos
por la imposibilidad de tener aparatos lo suficientemente sensibles para realizar
mediciones intermedias.
Con la información entregada, identifica la población, la muestra y la variable
estadística evaluada en las siguientes situaciones:
Ejemplo 1: En una escuela se quiere saber cuál es el deporte más practicado
por los alumnos. Se realiza una encuesta a cinco alumnos de cada curso.
Población: Todos los alumnos de la escuela.
Muestra: Cinco alumnos de cada curso, elegidos por sorteo.
Variable: Cualitativa (Deporte que practica).
Ejemplo 2: Se desea conocer cuál es la estatura de los alumnos de una escuela.

Se miden 10 alumnos por curso.
9
Población: Todos los alumnos de la escuela.
Muestra: 10 alumnos por curso, elegidos al azar.
Variable: cuantitativa continua (Estatura).
Ejemplo 3: Un fabricante de tornillos desea hacer un control de calidad. Para

ello, toma 1 de cada 100 tornillos producidos y analiza:
a) Si es correcto o defectuoso,
b) Su longitud y
c) Su Población: Todos los tornillos fabricados.
Muestra: 1 de cada 100 tornillos fabricados, elegido al azar.
Variable:
a) correcto o defectuoso: cualitativa,
b) longitud: cuantitativa continua,
c) número de pasos de rosca: cuantitativa discreta.
www.estadistica.mat.uson.mx/Material/elmuestreo.pdf
MUESTREO
En ocasiones en que no es posible o conveniente realizar un
censo (analizar a todos los elementos de una población), se
selecciona una muestra, entendiendo por tal una parte
representativa de la población.
El muestreo es por lo tanto una herramienta de la investigación científica, cuya
función básica es determinar que parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población.
La muestra debe lograr una representación adecuada de la población, en la que se
reproduzca de la mejor manera los rasgos esenciales de dicha población que son
importantes para la investigación. Para que una muestra sea representativa, y por
lo tanto útil, debe de reflejar las similitudes y diferencias encontradas en la
población, es decir ejemplificar las características de ésta.
Los errores más comunes que se pueden cometer son:
1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte
de la Población, se denomina error de muestreo.
2.- Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomó la muestra. Error de Inferencia.
En la estadística se usa la palabra población para referirse no sólo a personas sino
a todos los elementos que han sido escogidos para su estudio y el término muestra
se usa para describir una porción escogida de la población.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificación de los diferentes tipos de muestreo,
aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo
probabilísticos y métodos de muestreo no probabilísticos.
I. Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se
basan en el principio de equiprobabilidad. Es decir, aquellos en
los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
10
muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo
estos métodos de muestreo probabilísticos nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos
de muestreo probabilísticos encontramos los siguientes tipos:
1.- Muestreo aleatorio simple

El procedimiento empleado es el siguiente: 1) se asigna un
número a cada individuo de la población y 2) a través de
algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u
ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el
tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande.
2.- Muestreo aleatorio sistemático:
Este procedimiento exige, como el anterior, numerar todos
los elementos de la población, pero en lugar de extraer n
números aleatorios sólo se extrae uno. Se parte de ese
número aleatorio i, que es un número elegido al azar, y los
elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k,
i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de
dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i
que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en
la población ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un
muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres
o sólo mujeres, no podría haber una representación de los dos sexos.
3. Muestreo aleatorio estratificado
Trata de obviar las dificultades que presentan los anteriores ya
que simplifican los procesos y suelen reducir el error muestral
para un tamaño dado de la muestra. Consiste en considerar
categorías típicas diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el
estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de
que todos los estratos de interés estarán representados adecuadamente en la
muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de
ellos el muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formarán parte de la muestra. En ocasiones las dificultades que
plantean son demasiado grandes, pues exige un conocimiento detallado de la
población. (Tamaño geográfico, sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se denomina
afijación, y puede ser de diferentes tipos:
11
Afijación Simple: A cada estrato le corresponde igual número de elementos
muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño)
de la población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de
modo que se considera la proporción y la desviación típica. Tiene poca aplicación
ya que no se suele conocer la desviación.
4.- Muestreo aleatorio por conglomerados:
Los métodos presentados hasta ahora están pensados para
seleccionar directamente los elementos de la población, es decir,
que las unidades muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un
grupo de elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos universitarios, una
caja de determinado producto, etc., son conglomerados naturales. En otras
ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las
urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse
de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
número de conglomerados (el necesario para alcanzar el tamaño muestral
establecido) y en investigar después todos los elementos pertenecientes a los
conglomerados elegidos.
II. Métodos de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo
probabilístico resulta excesivamente costoso y se acude a
métodos no probabilísticos, aun siendo conscientes de que no
sirven para realizar generalizaciones (estimaciones inferenciales sobre la
población), pues no se tiene certeza de que la muestra extraída sea representativa,
ya que no todos los sujetos de la población tienen la misma probabilidad de ser
elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando, en la medida de lo posible, que la muestra sea representativa.
En algunas circunstancias los métodos estadísticos y epidemiológicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilístico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la población.
Entre los métodos de muestreo no probabilísticos más utilizados en investigación
encontramos:
1.- Muestreo por cuotas:
También denominado en ocasiones "accidental". Se asienta
generalmente sobre la base de un buen conocimiento de los
estratos de la población y/o de los individuos más
"representativos" o "adecuados" para los fines de la
investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de
individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos
de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la
12
cuota se eligen los primeros que se encuentren que cumplan esas características.
Este método se utiliza mucho en las encuestas de opinión.
2.- Muestreo intencional o de conveniencia:
Este tipo de muestreo se caracteriza por un esfuerzo
deliberado de obtener muestras "representativas" mediante
la inclusión en la muestra de grupos supuestamente típicos.
Es muy frecuente su utilización en sondeos preelectorales de
zonas que en anteriores votaciones han marcado tendencias de voto.
También puede ser que el investigador seleccione directa e intencionadamente los
individuos de la población. El caso más frecuente de este procedimiento el utilizar
como muestra los individuos a los que se tiene fácil acceso (los profesores de
universidad emplean con mucha frecuencia a sus propios alumnos).
4. Muestreo bola de nieve
Se localiza a algunos individuos, los cuales conducen a
otros, y estos a otros, y así hasta conseguir una muestra
suficiente. Este tipo se emplea muy frecuentemente cuando
se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos, etc.
4.- Muestreo Discrecional

A criterio del investigador los elementos son elegidos sobre lo
que él cree que pueden aportar al estudio.
Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
RECOLECCIÓN Y PRESENTACIÓN DE DATOS

file:///C:/Users/ily16/Downloads/Unidad_II_Recoleccion_organizacion_y_pre.pdf
Recolección, organización y presentación de datos estadísticos.

Desde un primer momento que nos planteamos un problema o situación objeto de
estudio, debemos valernos de los datos que nos suministraran la información
estadística necesaria para llegar a resultados reales del contexto.
En esta unidad estaremos tratando procesos inherentes al método estadístico, los
que corresponden a la organización y análisis de datos. Es importante resaltar que
el ordenamiento es de gran utilidad para abordar para abordar un conglomerado de
datos que dificulta los procesos de análisis e interpretación.
El PROCESO DE RECOLECCIÓN de datos estadísticos puede ser realizado a
través de fuentes primarias o secundarias. En las primeras, la persona o la
institución ha recolectado directamente los datos de la población. Mientras que en
las segundas, los datos son obtenidos de publicaciones y trabajos efectuados por
otras personas o entidades que han recolectado directamente la información.
Una vez recolectada la información de las diferente fuentes, se reúnen una gran
cantidad de datos, que a su vez requieren una organización a través de las clases
o categorías que determinan de manera más resumida y organizada la frecuencia y
otros datos que permitirá llega a interpretaciones posteriores. El ordenamiento se
concreta por medio de la tabla de distribución de frecuencias en clases.
13
Para realizar del PROCESO DE ORDENAMIENTO hay que seguir los siguientes
pasos:
a. Ordenamiento: consiste en ordenar de manera ascendente o descendente los
datos numéricos recolectados de las unidades estadísticas.
b. Rol de frecuencia: una vez ordenados los datos se determina cuantas veces se
repiten los datos
c. Tabla de frecuencia: en este último paso, se realiza la tabla de discriminando las
clases, la frecuencia, las proporciones y los porcentajes de la información y a partir
de ellos se establecen las conclusiones del estudio.
Ascendente: de menor a mayor.

Descendente: de mayor a menor.
Desde un primer momento que nos planteamos un problema o situación objeto de
estudio, debemos valernos de los datos que nos suministraran la información
estadística necesaria para llegar a resultados reales del contexto.
En esta unidad estaremos tratando procesos inherentes al método estadístico, los
que corresponden a la organización y análisis de datos. Es importante resaltar que
el ordenamiento es de gran utilidad para abordar para abordar un conglomerado de
datos que dificulta los procesos de análisis e interpretación.
Una vez recolectada la información de las diferente fuentes, se reúnen una gran
cantidad de datos, que a su vez requieren una organización a través de las clases
o categorías que determinan de manera más resumida y organizada la frecuencia y
otros datos que permitirá llega a interpretaciones posteriores. El ordenamiento se
concreta por medio de la tabla de distribución de frecuencias en clases.
Una vez concluidos los procedimientos de ordenamiento y el rol de frecuencia se
procede a la elaboración de la tabla de frecuencia y para ello necesitamos saber:
PRESENTACIÓN ESTADÍSTICA
Distribución de frecuencias. (ditutor, 2010)
Una distribución de frecuencias o tabla de frecuencias es
una ordenación en forma de tabla de los datos estadísticos, asignando
a cada dato su frecuencia correspondiente
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un
determinado valor en un estudio estadístico.
La frecuencia absoluta es el número de veces que aparece un
determinado valor en un estudio estadístico
Se representa por f
La suma de las frecuencias absolutas es igual al número total de
datos, que se representa por N
Para indicar resumidamente estas sumas se utiliza la letra griega

Σ (sigma mayúscula) que se lee suma o sumatoria
14
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de
un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por n i
𝑓𝑖
𝑓𝑟 = 𝑁
La suma de las frecuencias relativas es igual a 1
Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se

obtiene multiplicando la frecuencia relativa por 100. La suma de las frecuencias
porcentuales es siempre 100%. Se calcula así:
𝑓% = 𝑓𝑟 ∙ 100
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales al valor considerado
Se representa por F a
Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia
acumulada de un determinado valor y el número total de datos. Se
puede expresar en tantos por ciento (f r a )
- Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores

que son menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia
relativa acumulada por 100. Se calcula así:
𝑓𝑟𝑎% = 𝑓𝑟𝑎 ∙ 100
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30,
29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de
menor a mayor, en la segunda hacemos el recuento y en la tercera
anotamos la frecuencia absoluta.
15
xi Recuento f fa i fr Fr% fra Fra%
27 I 1 1 0.032 3.2 0.032 3.2
28 II 2 3 0.065 6.5 0.097 9.7
29 6 9 0.194 19.4 0.290 29.1
30 7 16 0.226 22.6 0.516 51.7
31 8 24 0.258 25.8 0.774 77.5
32 III 3 27 0.097 9.7 0.871 87.2
33 III 3 30 0.097 9.7 0.968 96.9
34 I 1 31 0.032 3.2 1 100
31 1 100%
Este tipo de tablas de frecuencias se utiliza con variables
discretas
REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS

PARA DATOS AGRUPADOS EN INTERVALOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los
cálculos es necesario agruparlos, a estos grupos se los llama intervalos o clases.
Un intervalo es una serie de números incluidos entre dos extremos, así por ejemplo,
el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite
inferior, 45 el límite superior, 39,5 límite real inferior (límite inferior disminuido en 5
décimas) y 40,5 el límite real superior (límite superior aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos
agrupados en intervalos son:
1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la

diferencia entre el valor mayor y el menor de los datos más 1.
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 +1
2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y
mayor de 12, ya que un número mayor o menor de clases podría oscurecer el
comportamiento de los datos.
Para calcular el número de intervalos:
No. de clases aproximadamente igual a: Rango / Ancho de clase
3) Calcule el Ancho del Intervalo (i) o clase.- Se obtiene dividiendo el Rango para
el número de intervalos
𝑅
𝑖=
𝑛𝑖
Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano.
Esto altera el valor de rango por lo que es necesario efectuar un ajuste así:
16
𝑁𝑢𝑒𝑣𝑜 𝑅 = 𝑛𝑖 ∙ 𝑖
Por ejemplo: Si una distribución de 40 datos el valor mayor es 41 y el menor es 20
se tiene:
Calculando el Rango se obtiene:
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 + 1 = 41 − 20 = 21 + 1 = 22
Calculando el número de intervalos se obtiene:

𝑛𝑖 = 1 + 3,32 ∙ 𝑙𝑜𝑔(𝑛) = 1 + 3,32 ∙ 𝑙𝑜𝑔40 = 6,32 = 6
Calculando el ancho se obtiene:

𝑅 21
𝑖 = 𝑛𝑖 = 6 = 3,5 Redondeando se obtiene: i = 4
Calculando el nuevo rango se obtiene: 𝑁𝑢𝑒𝑣𝑜 𝑅 = 𝑛𝑖 ∙ 𝑖 = 6 ∙ 4 = 24
El exceso de 3 que se tiene en este caso se distribuye entre xmáx y xmín. Por lo
general se agrega al mayor y se quita al menor. Como por ejemplo, se podría
agregar 2 al valor mayor y quitar 1 al valor menor, obteniéndose los siguientes
nuevos valores:
𝑥𝑚á𝑥 = 41 + 2 = 43 𝑥𝑚𝑖𝑛 = 20 − 1 = 19
O también se podría agregar 1 al valor mayor y quitar 2 al valor menor, obteniéndose
los siguientes nuevos valores:
𝑥𝑚á𝑥 = 41 + 1 = 42 𝑥𝑚𝑖𝑛 = 20 − 2 = 18
4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase,
comenzando por el Xmín del rango.
5) Se realiza el Conteo de Datos que cae dentro de cada clase (frecuencia
absoluta)
6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se obtiene

sumando los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta suma
entre 2
𝐿𝑠 + 𝐿𝑖
𝑥𝑚 =
2
7) Calcule las Frecuencias
EJEMPLO ILUSTRATIVO
A 40 estudiantes se les pidió que estimen el número de horas que habrían dedicado
a estudiar la semana pasada (tanto en clase como fuera de ella), obteniéndose los
siguientes resultados:
36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45
17
Solución:
1) Calculando el Rango se obtiene:
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛 = 65 − 30 = 35
2) Calculando el número de intervalos se obtiene:
𝑛𝑖 = 1 + 3,32 ∙ 𝑙𝑜𝑔(𝑛) = 1 + 3,32 ∙ 𝑙𝑜𝑔40 = 6,32 = 6
3) Calculando el ancho se obtiene:
𝑅 35
𝑖= = = 5,83
𝑛𝑖 6
Redondeando se obtiene: i = 6, por lo que es necesario realizar un ajuste al rango.

Los cálculos realizados en Excel se muestran en la siguiente figura:
4) Calculando el nuevo rango se obtiene:

𝑁𝑢𝑒𝑣𝑜 𝑅 = 𝑛𝑖 ∙ 𝑖 = 6 ∙ 6 = 36
El exceso de 1 que se tiene en este caso se distribuye entre xmáx y xmín. En este
ejemplo, se podría agregar 1 al valor mayor y no quitar nada al valor menor, o no
agregar nada al mayor y quitar 1 al menor. Al elegir la primera opción se obtiene:
𝑥𝑚á𝑥 = 65 + 1 = 66
𝑥𝑚𝑖𝑛 = 30 − 0 = 30
5) Formando los intervalos de clase agregando i-1 (6-1=5) al límite inferior de cada
clase, comenzando por el Xmín del rango se obtiene:
30+5 = 35; 36+5 = 41; 42+5 = 47; 48+5 = 53; 54+5 = 59; 60+5 = 65
6) Realizando el conteo de datos que cae dentro de cada clase, calculando la marca
de clase y las frecuencias se obtiene:
Clases f X p.m fr fa f% fra fra%

30-35 8 (30+35)/2 = 32,5 0,2 8 20 0,2 20
36-41 6 (36+41)/2 = 38,5 0,15 14 15 0,35 35
42-47 5 (42+47)/2 = 44,5 0,125 19 12,5 0,475 47,5
48-53 7 (48+53)/2 = 50,5 0,175 26 17,5 0,65 65
54-59 11 (54+59)/2 = 56,5 0,275 37 27,5 0,925 92,5
60-65 3 (60+65)/2 = 62,5 0,075 40 7,5 1 100
Total 40 1 100
18
A continuación se presenta algunas interpretaciones de la tabla:
El valor de f = 8: Significa que 8 estudiantes dedicaron a estudiar la semana pasada

entre 30 y 35 horas.
El valor de x p.m. = 50,5: Significa que 7 estudiantes dedicaron en promedio a

estudiar la semana pasada 50,5 horas.
El valor de fr = 0,15 y f% = 15%: Significa que el 0,15 o el 15% de los estudiantes

dedicaron a estudiar la semana pasada entre 36 y 41 horas.
El valor de fa = 26: Significa que 26 estudiantes dedicaron a estudiar la semana

pasada entre 30 y 53 horas.
El valor de fra = 0,65 y fra% = 65%: Significa que el 0,65 o el 65% de los estudiantes
dedicaron a estudiar la semana pasado entre 30 y 53 horas.
Para realizar los cálculos de la frecuencia absoluta empleando Excel se procede de

la siguiente manera:
a) Digite los datos, las clases y límites superiores de las clases. Seleccione C8:C13
donde las frecuencias absolutas deben ser calculadas. Escriba la fórmula:
=FRECUENCIA(A1:H5; B8:B13)
b) Presione CTRL+SHIFT+ENTER
19
Los cálculos de la marca de clase y de las otras frecuencias empleando Excel se
muestran en la siguiente figura:
EJEMPLO ejercicio en casa. Suponga que un investigador desea determinar cómo

varia el peso de un grupo de estudiantes de primer semestre de una universidad.
Selecciona una muestra de 50 estudiantes y registra su peso en kilogramos, los
datos obtenidos fueron los siguientes: 65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 70,
68, 66, 55, 57, 60, 62, 64, 65, 64, 68, 70, 66, 56, 59, 61, 62, 63, 65, 65, 70, 67, 66,
57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62.
EJEMPLO en clase. Calificaciones obtenidas en la primera evaluación de

estadística aplicada a la educación a los estudiantes del IUV de la carrera de
Educación.
Nombre Calif. Nombre Calif. Nombre Calif. Nombre Calif.

Rosa 04 Laura 15 Emmanuel 04 Yudy 18
Yesenia 05 Mirian 18 Adriana 05 Miguel 19
María 18 José 07 Javier 05 Sofía 13
Reina 19 Daniel 06 Gregorio 14 Juan 15
Luis 12 Érica 07 Alfredo 12 David 18
Edgard 08 Luisa 18 Eduardo 14 Carlos 19
Oscar 14
20
Ordenar de manera ascendente
Realizar la tabla de distribución de frecuencias para datos agrupados.
OTRO EJEMPLO. Con el ejemplo siguiente se muestra la elaboración e

interpretación de una distribución de frecuencia de datos cualitativos. Cinco
refrescos muy conocidos son Coca cola clásica (Coke Classic), Coca cola de dieta
(Diet Coke), Dr. Pepper, Pepsi y Sprite. Suponga que los datos de la tabla siguiente
muestran los refrescos que fueron comprados en una muestra de 50 ventas de
refresco.
Coke Classic Sprite Pepsi Pepsi Coke Classic
Diet Coke Coke Classic Coke Classic Coke Classic Coke Classic
Pepsi Diet Coke Coke Classic Dr. Pepper Pepsi
Diet Coke Coke Classic Coke Classic Sprite Coke Classic
Coke Classic Diet Coke Pepsi Coke Classic Sprite
Coke Classic Coke Classic Dr. Pepper Diet Coke Dr. Pepper
Dr. Pepper Sprite Coke Classic Coke Classic Pepsi
Diet Coke Pepsi Diet Coke Coke Classic Diet Coke
Pepsi Coke Classic Pepsi Pepsi Pepsi
Sprite Pepsi Pepsi Dr. Pepper Coke Classic
Solución:
En los casos anteriores los datos han sido ordenados y organizados por sus
características cuantitativas y atendiendo a la escala de medición utilizada, en caso
de los datos cualitativos utilizamos la escala de medición nominal, en este caso se
pueden ordenar según orden alfabético ascendente. En este caso, nuestra variable
es refresco vendido, por lo que los valores son los diferentes nombres de refrescos
tal que la tabla de frecuencia quedaría:
21
Elaboración de gráficos:
Una de las ventajas más importantes de la construcción de las tablas de frecuencia
es facilitar la elaboración de los gráficos, los cuales permiten una interpretación
sencilla y rápida de la información. Dependiendo del tipo de datos y su
representación en tablas agrupadas o no se tienen las siguientes representaciones
graficas:
Histograma(htte://wikipedia.,214)
HISTOGRAMA
En estadística, un histograma es una
representación gráfica de una variable en
forma de barras, donde la superficie de cada
barra es proporcional a la frecuencia de los
valores representados, ya sea en forma
diferencial o acumulada. Sirven para obtener
una "primera vista" general, o panorama, de la
distribución de la población, o la muestra,
respecto a una característica, cuantitativa y
continua, de la misma y que es de interés para
el observador (como la longitud o la masa). De
esta manera ofrece una visión en grupo permitiendo observar una preferencia, o
tendencia, por parte de la muestra o población por ubicarse hacia una determinada
región de valores dentro del espectro de valores posibles (sean infinitos o no) que
pueda adquirir la característica. Así pues, podemos evidenciar comportamientos,
observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas
las partes que componen la población o la muestra, o, en contraposición, poder
observar el grado de variabilidad, y por ende, la dispersión de todos los valores que
toman las partes, también es posible no evidenciar ninguna tendencia y obtener que
cada miembro de la población toma por su lado y adquiere un valor de la
característica aleatoria-mente sin mostrar ninguna preferencia o tendencia, entre
otras cosas.
En el eje vertical se representan las

frecuencias, es decir, la cantidad de población
o la muestra, según sea el caso, que se ubica
en un determinado valor o sub-rango de
valores de la característica que toma la
característica de interés, evidentemente,
cuando este espectro de valores es infinito o
muy grande el mismo es reducido a sólo una
parte que muestre la tendencia o
comportamiento de la población, en otras
ocasiones este espectro es extendido para mostrar el alejamiento o ubicación de la
población o la muestra analizada respecto de un valor de interés
En general se utilizan para relacionar variables cuantitativas continuas, pero
también se lo suele usar para variables cuantitativas discretas, en cuyo caso es
común llamarlo diagrama de frecuencias y sus barras están separadas, esto es
22
porque en el "x" ya no se representa un espectro continuo de valores, sino valores
cuantitativos específicos como ocurre en un diagrama de barras cuando la
característica que se representa es cualitativa o categórica. Su utilidad se hace más
evidente cuando se cuenta con un gran número de datos cuantitativos y que se han
agrupado en intervalos de clase.
Ejemplos de su uso es cuando se representan franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores
continuos. En los casos en los que los datos son cualitativos (no-numéricos), como
sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas
que en ciencias naturales y exactas. Y permite la comparación de los resultados de
un proceso.
Tipos de histograma
 Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra
la cual es proporcional a la frecuencia simple de la categoría que representa.
 Diagramas de barras compuesta
Se usa para representar la información de una tabla de doble entrada o sea a partir
de dos variables, las cuales se representan así; la altura de la barra representa la
frecuencia simple de las modalidades o categorías de la variable y esta altura es
proporcional a la frecuencia simple de cada modalidad.
 Diagramas de barras agrupadas
Se usa para representar la información de una tabla de doble entrada o sea a partir
de dos variables, el cual es representado mediante un conjunto de barras como se
clasifican respecto a las diferentes modalidades.
 Polígono de frecuencias
Es un gráfico de líneas que de las frecuencias absolutas de los valores de una
distribución en el cual la altura del punto asociado a un valor de las variables es
proporcional a la frecuencia de dicho valor.
 Ojiva porcentual
Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango
porcentual de cada valor en una distribución de frecuencias.
En los gráficos las barras se encuentran juntas y en la tabla los números poseen en
el primer miembro un corchete y en el segundo un paréntesis, por ejemplo: [10-20)
Construcción de histograma
 Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato
menor.
 Paso 2
Obtener los números de clases, existen varios criterios para determinar el número
de clases (o barras) -por ejemplo la regla de Sturgess. Sin embargo ninguno de
ellos es exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de cómo estén los datos y cuántos sean. Un criterio usado
frecuentemente es que el número de clases debe ser aproximadamente a la raíz
23
cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número de
artículos) es mayor que cinco, por lo que se seleccionan seis clases.
 Paso 3
Establecer la longitud de clase: es igual al rango dividido por el número de clases.
 Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los
datos en relación al resultado del PASO 2 en intervalos iguales.
 Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud,
se hace un gráfico de barras, las bases de las barras son los intervalos de clases y
altura son la frecuencia de las clases. Si se unen los puntos medios de la base
superior de los rectángulos se obtiene el polígono de frecuencias.
A veces es más útil representar las frecuencias acumuladas, o representar
simultáneamente los histogramas de una variable en dos situaciones distintas.
Otra forma muy frecuente, de representar dos histogramas de la misma variable en
dos situaciones distintas.
En las variables cuantitativas o en las cualitativas ordinales se pueden representar
polígonos de frecuencia en lugar de histogramas, cuando se representa la
frecuencia acumulativa, se denomina ojiva.
Polígonos de frec uencias. Vari ables discretas
Los polígonos de frecuencias se realizan tra zando los puntos que
representan las f recuencias y uniéndolos mediante segmentos
Ejemplo
Las temperaturas en un día de otoño de una ciudad han suf rido las
sigu ientes variacio nes:
Hora Temperatura Vari abl es cont i nuas o

dat os agrupados
6 7º Los polígonos de
f recuencias se
9 12°
realizan tra zan do
12 14° los puntos f ormados
las marcas de clase y
15 11° las f recuencias , y
uniéndolos
18 12° mediante segmentos.
También se puede
21 10° construir el polígo no
24 8° de
f recuencia uniendo
los puntos medios de cada rectángulo de un histograma
24
Ejemplo: El peso de 65 personas viene dado por la siguiente tabla
ci fi Fi
[50, 60) 55 8 8
[60, 70) 65 10 18
[70, 80) 75 16 34
[80, 90) 85 14 48
[90, 100) 95 10 58
[100, 110) 110 5 63
[110, 120) 115 2 65
65
Ojiva (grafica de frecuencias acumuladas)

Es un gráfico en forma de curva que representa el crecimiento acumulado en forma
de curva, resultando de la relación entre los extremos superiores de cada clase con
las frecuencias relativas porcentuales.
PM f
Peso
55 8 70
65 18 60
50
75 34 40
85 48 30
20
95 58
10
110 63 0
55 65 75 86 95 110 115
115 65
Serie 1
Gráfica circular
Este tipo de diagrama se puede utilizar para todo tipo de variables (cualitativas,
cuantitativas) pero se usa más frecuentemente para variables cualitativas.
Los datos se representan en un círculo de modo que el ángulo de cada sector es
proporcional la frecuencia que representa.
En el caso que el grafico circular se realice de forma manual debe efectuarse una
serie de conversiones previas para adecuar el valor en el sector del círculo. Para
ello se utiliza la siguiente formula:
25
Donde N es el número total de datos y la frecuencia absoluta del valor que se desea
representar.
Para calcular el tamaño de los ángulos
360 𝑥 19 360 𝑥 13
Coca cola α= = 136.8º Pepsi cola α= = 93.6
50 50
360 𝑥 8 360 𝑥 5
Coca dieta α= = 57.6º Pepsi dieta α= = 36º
50 50
360 𝑥 5
Sprite α= = 36º
50
Ventas f f% α
Sprite 5
Coca cola 19 38 136.8º ventas
clásica Pepsi Coca
Pepsi cola 13 26 93.6º dieta 5 cola
Coca dieta 8 16 57.6º clasica
19
Pepsi dieta 5 10 36º Pepsi
Sprite 5 10 36º cola 13
N= 50 100% 360º
ANÁLISIS Y DESCRIPCIÓN ESTADÍSTICA

Universidad Nacional Autónoma de México Facultad de Estudios Superiores
Cuautitlán
www.cuautitlan.unam.mx Medidas de Tendencia Central y Medidas de
Dispersión
Medidas de tendencia central

Es decir que para que una calificación tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos criterios
estadísticos. Las medidas de tendencia central (media, mediana y moda) sirven
como puntos de referencia para interpretar las calificaciones que se obtienen en
una prueba.
Las medidas de tendencia central son valores que se ubican al centro de un
conjunto de datos ordenados según su magnitud. Generalmente se utilizan 4 de
estos valores también conocidos como estadígrafos, la media aritmética, la
mediana, la moda y al rango medio.
La medida de tendencia central en grupos de puntuaciones con valores extremos
se mide probablemente mejor por la mediana, si puntuaciones o datos son
unimodales. Como indicamos previamente, cada dato en un grupo influye en la
media.
26
La media (promedio) de un conjunto de datos se encuentra al sumar todos los
números en el conjunto de datos y luego al dividir entre el número de valores en el
conjunto. La mediana es el valor medio cuando un conjunto de datos se ordena de
menor a mayor.
Suponga que le pedimos a un grupo de estudiantes de la asignatura de estadística

que registren su peso en kilogramos. Con los datos del peso de los estudiantes
obtenemos el histograma de los pesos para el grupo de estudiantes y un histograma
para el peso de las mujeres y uno para el de los hombres.
¿Qué nos revelan

los histogramas? Un
histograma es una
gráfica muy utilizada
en estadística. Se
utiliza para datos
cuantitativos y nos
muestra la
acumulación o
tendencia de los
datos, su
variabilidad y la
forma de la
distribución.
Entonces a partir de los histogramas elaborados, observamos que:
La acumulación o tendencia del peso de los hombres se encuentra entre los 70 y

74 kg, mientras que la tendencia del peso de las mujeres es menor y se encuentra
entre los 50 a 58 Kg.
• La variabilidad de todo el grupo está en un rango comprendido entre los 42 y los

90 kg. Sí se estudia únicamente el peso de los hombres se observa que se reduce
la variabilidad y los pesos se encuentran ahora entre 54 y 90 kg. Para el grupo de
las mujeres la variabilidad se reduce aún más y sus pesos se encuentran entre 42
y 70 Kg.
La variabilidad de todo el grupo es lógico que sea la mayor debido a que el grupo
es muy heterogéneo ya que incluye los pesos de los hombres y de las mujeres. El
que el grupo de las mujeres tenga menor variabilidad que el de los hombres nos
indica que el grupo de las mujeres en cuanto a peso es más homogéneo que el
grupo de los hombres.
Con los histogramas tenemos una medida burda de la tendencia y de la variabilidad.
¿Se puede medir de una forma más precisa la acumulación o tendencia y la
variabilidad?
27
La respuesta es afirmativa. Las medidas de tendencia o acumulación se conocen
como medidas de Tendencia Central o de localización y las de variabilidad como
medidas de dispersión o de variabilidad.
¿Cuáles son las medidas de tendencia central?

Las medidas de tendencia central más utilizadas, son la media aritmética, la
mediana y la moda.
¿Qué es la media aritmética?
La media aritmética es la medida de tendencia central más utilizada y es igual a lo
que conocemos como promedio. Entonces la media es la suma de los valores de
todas las observaciones, dividida entre el número de observaciones realizadas.
Sea n el tamaño de una muestra que contiene a las observaciones x1, x2, x3,. . .,
xn, entonces la media aritmética, es:
En donde el subíndice i, indica un número de conteo para
identificar cada observación.
La media de los números x1 = 13, x2 = 15, x3 = 9, x4 = 6, x5 = 4,
x6 = 12, x7 = 11 es:
¿Por qué la media aritmética es
una medida de tendencia
central?
Una media 10, no significa que
todos los datos sean igual a 10,
es más para nuestros datos ninguno es igual a 10. Hay valores mayores y menores
de 10. Veamos la gráfica de puntos siguiente, donde en una escala apropiada en el
eje de las X, se representa cada dato mediante un punto. Si obtenemos las
distancias de cada punto con respecto a 10, observamos que la suma de las
distancias de los puntos a la derecha de 10, es igual a la suma de las distancias de
los puntos a la izquierda de 10. Entonces, en 10 se equilibra la distribución de los
datos, es decir es el punto de equilibrio o centro de gravedad de la distribución de
los datos
¿Se puede calcular la media aritmética a partir de los datos agrupados en una tabla
de frecuencias?
La respuesta es afirmativa. Si lo único que tenemos es un resumen de los datos, en
forma de tabla de frecuencias y no contamos con la información original, sí es
posible calcular la media aritmética.
Con el fin de evitar cálculos aritméticos tediosos, no hace muchos años cuando se
tenían numerosos datos, los datos originales se resumían en una tabla de
frecuencias, y después se calculaban sus medidas de tendencia central y de
variabilidad. Hoy en día con el uso de software adecuado se pueden procesar
fácilmente los datos originales, y ya no se justifica por éste motivo construir la tabla
de frecuencias.
28
Suponga que la información que tenemos es
la siguiente Tabla que muestra el tiempo que
tardaron 50 clientes en una caja bancaria y
deseamos conocer cuál es el tiempo
promedio que tardaron.
Sabemos, por ejemplo, que en la primera
clase 2 clientes tardaron en la caja entre 141
y casi 157 segundos. No sabemos con
exactitud cuánto tardó cada uno de ellos, sólo
sabemos que tardaron un tiempo
comprendido entre éstos dos límites. Para
efectuar el cálculo de la media aritmética, supondremos que un valor representativo
de la clase es su marca de clase o punto medio, xi
Entonces tenemos:
Tiempo invertido en atender No. de clientes Marca de clase

al cliente I.C. fi Xi
141 – 157 2 149
157 – 173 13 165
173 – 189 17 181
189 – 205 14 197
205 – 221 3 213
221 – 237 1 229
¿Es un cálculo exacto? No, sólo es un valor aproximado.
Es decir, suponemos que tenemos 2 clientes que tardaron 149 segundos en la caja,
13 que tardaron 165, 17 que tardaron 181 segundos, etc. Entonces la suma de todos
los datos sería igual a sumar 2 veces 149 más 13 veces 165 más 17 veces 181 más
14 veces 197 más 3 veces 213 más 1 vez 229.
Tiempo invertido en No. de clientes Marca de clase Xifi
atender al cliente fi Xi
141 – 157 2 149 298
157 – 173 13 165 2145
173 – 189 17 181 3077
189 – 205 14 197 2758
205 – 221 3 213 639
221 – 237 1 229 229
9146
La suma total es igual a: 9146
Observe que la suma total es la suma de los productos marca de clase por
frecuencia para cada clase.
La media será igual a la suma obtenida dividida entre el número de datos. Observe
que se sumaron 50 datos, y que 50 es la suma de la columna de frecuencias,
entonces:
29
El cálculo anterior lo podemos sistematizar obteniendo
una columna adicional en la Tabla de
distribución de frecuencias. La columna
expresará los productos para cada clase. La suma de
esta columna, 9146, entre el número de datos, nos da el valor de la media.
A partir de los cálculos realizados podemos escribir la expresión para la media
calculada a partir de los datos agrupados en la Tabla de distribución de frecuencias.
∑𝑛
𝑖=1 𝑋𝑖𝑓𝑖 9146
𝑋̅ = 𝑋̅ = 50 = 18292
𝑛
¿Qué es la mediana?
La mediana es el valor central que se localiza en una serie ordenada de datos. Para
obtener la mediana de los números x1 = 13, x2 = 15, x3 = 9, x4 = 6, x5 = 4, x6 = 12,
x7 = 11, primero tenemos que ordenarlos:
Entonces la mediana es 11.
Si el número de datos fuera par, tendríamos

dos valores centrales y la mediana sería la media de estos dos valores. Por ejemplo:
Tenemos dos valores centrales, 11 y

12, entonces la mediana es:
¿Qué representa la mediana?

Observe que la mediana divide la serie de datos en dos mitades y cada mitad tiene
el mismo número de datos que la otra.
Representemos los datos mediante una gráfica de

puntos. Por arriba de la mediana, 11, hay tres datos
y por abajo también, sin importar el valor de los
datos. Sólo toma en cuenta el número de datos y no
le da importancia al hecho de que los valores por arriba de 11, estén más cerca de
ella que los que están por debajo.
La mediana es el centro geométrico de la distribución de los datos.

¿Se puede calcular la mediana a partir de los datos agrupados en una tabla de
frecuencias?
30
La respuesta es afirmativa. Al igual que la media, sí es posible calcular la mediana
si sólo se cuenta con un resumen de los datos en forma de tabla de distribución de
frecuencias.
A partir de nuestro ejemplo del tiempo que tardan unos clientes en una caja
bancaria, calculemos la mediana.
Debido a que la mediana es el valor por abajo del cual se encuentran el 50% de los
datos y por arriba de él se encuentra también el 50% de los datos, entonces la
mediana se debe de encontrar en la clase en la que la frecuencia relativa acumulada
en una clase anterior sea menor de 0.5 (50%) y en ella la frecuencia relativa
acumulada sea 0.5 o más. A esta clase se le llama clase mediana.
Para nuestro ejemplo, la clase mediana es la tercera. Una clase anterior, es decir la
segunda clase, tiene una frecuencia relativa acumulada de 0.3 (menor a 0.5) y la
tercera clase tiene una frecuencia relativa acumulada igual a 0.64 (mayor de 0.5).
Tiempo No. de Marca de Frecuencia Frecuencia Frecuencia

invertido en clientes clase relativa acumulada relativa
atender al xi acumulada
cliente
141 – 157 2 149 0.04 2 0.04
157 – 173 13 165 0.26 15 0.30
173 – 189 18 181 0.34 32 0.64
189 – 205 14 197 0.28 46 0.92
205 – 221 3 213 0.06 49 0.98
221 - 237 1 229 0.02 50 1.00
Totales 50
¿Qué es la Moda?
La moda es el valor más frecuente en una serie de datos. Por ejemplo, para los
siguientes datos, la moda es 15, porque es el valor que se repite más.
¿En una serie de datos puede haber más de una moda?

Si. Sí se tiene dos o más valores con la misma frecuencia máxima, la distribución
puede ser multimodal.
La siguiente serie de datos tiene dos modas, ya que el 11 y el 15, se repiten 2 veces,
entonces se dice que la distribución de los datos es bimodal.
31
La siguiente serie de datos es trimodal, ya que el 4, el 11 y el 15 se repiten 3 veces.
¿En una serie de datos puede no existir la moda?

Sí. Si no hay un valor que se repita más veces que los otros, no existe la moda.
La siguiente serie de datos no tienen moda, porque no hay ningún dato que se repita
más que otro. Todos tienen frecuencia 1
4 7 12 15 10 6 8
La siguiente serie de datos no tiene moda porque no hay ningún dato que se repita
más que otro, todos tienen frecuencia 3.
5 5 5 6 6 6 10 10 10
Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias
con datos agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
Li Extremo inferior del intervalo

modal (intervalo que tiene mayor frecuencia
absoluta).
fi Frecuencia absoluta del intervalo modal.
fi-1 Frecuencia absoluta del intervalo anterior al modal.
fi+1 Frecuencia absoluta del intervalo posterior al modal.
t Amplitud de los intervalos.
¿En una gráfica como se distingue la moda?

Cómo es el valor que se repite con mayor frecuencia la moda será el valor más alto
o el pico de la distribución.
¿Se puede calcular la moda a partir de los datos agrupados en una tabla de
frecuencias?
Resulta suficiente definir la clase modal, es decir la clase de mayor frecuencia (el
pico de la distribución). Si se quiere establecer un valor, la moda será igual a la
marca de clase de la clase modal.
Para nuestro ejemplo, del tiempo en atender al cliente, la clase modal es la tercera.
Entonces reportamos que la clase modal es de 173 a menos de 189 segundos y la
moda es igual a 181.
¿En una serie de datos pueden ser iguales la media, la mediana y la moda?
32
Si, cuando la distribución es en forma de campana, lo que en estadística se conoce
como distribución normal, coinciden los valores de la media, mediana y la moda. En
la distribución que se muestra enseguida, la media, la mediana y la moda son
iguales y tienen un valor de 50.
Sí la distribución no es simétrica
¿Cuál es la posición de la media,
mediana y moda?
Si la distribución es simétrica
coinciden los valores de la media
y de la mediana. La moda puede o
no existir.
Para las distribuciones con sesgo a la derecha (asimetría positiva)
𝑋̅ > 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 > 𝑚𝑜𝑑𝑎
Para las distribuciones con sesgo a la izquierda (asimetría negativa)

𝑋̅ < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑚𝑜𝑑𝑎
¿Cuáles son las ventajas y las desventajas de cada una de las medidas de
tendencia central revisadas?
La media es la más usada de las medidas de tendencia central, sus principales
ventajas es que es muy fácil de calcular, para determinar su valor se toman en
cuenta todos los datos y es muy importante en inferencia estadística por las
propiedades de su distribución muestral. Su principal desventaja es que debido a
que es el punto de equilibrio de la distribución su valor se ve muy afectado por datos
extremos, por lo que si la distribución es muy sesgada no es conveniente utilizarla.
¿Cuáles son las medidas de variabilidad?

Las medidas de variabilidad son el rango o amplitud, la varianza, la desviación
estándar y el coeficiente de variación.
¿Cómo se calculan estas medidas?
33
Para ejemplificar el cálculo y reafirmar el concepto de variabilidad, supongamos que
tenemos dos muestras de tres datos cada una:
Muestra 1 Muestra 2
17 18 19 15 16 23
El resumen de los datos de cada muestra seria:
Muestra 1: n = 3; 𝑿 ̅ = 𝟏𝟖 Muestra 2: n = 3; 𝑿̅ = 𝟏𝟖
De tal forma, que si nos referimos a una muestra de tamaño 3 y media 18, no
sabemos si hablamos de la muestra 1 o de la muestra 2. Es decir, la media no es
una medida suficiente para poder distinguir una muestra de la otra. Es necesario,
entonces construir otra medida que permita diferenciarlas.
Si inspeccionamos las muestras vemos que la primera varía de 17 a 19, mientras
que la segunda de 15 a 23. Esta amplitud o rango es la primera medida de
variabilidad.
Muestra 1: Ymax – Ymin R = 19 – 17 = 2
Muestra 2: Ymax – Ymin R = 23 – 15 = 8
Sin embargo, es una medida que sólo toma en cuenta dos datos, el valor máximo y
el mínimo y por tanto se ve afectada por los valores extremos. Es una medida que
proporciona la variabilidad en forma muy burda.
Si observamos las muestras vemos que la muestra 1, tiene sus valores más
agrupados alrededor de la media, 18, mientras que los valores de la muestra 2,
están más alejados de ella. Entonces, se hace necesaria una medida que valore la
variabilidad o distancia promedio de los datos con respecto a su media.
La idea sería obtener las distancias de cada dato con respecto a su media, y a partir
de estas obtener la distancia promedio. Note que una medida construida de esta
manera, toma en cuenta todos los datos.
Muestra 1 Muestra 2
Xi ̅ )
(X - 𝑿 Xi ̅ )
(X - 𝑿
17 17 – 18 = -1 15 15 – 18 = -3
18 18 – 18 = 0 16 16 – 18 = -2
19 19 – 18 = 1 23 23 – 18 = 5
∑ d= 0 ∑d= 0
¿Por qué en ambos casos la suma de las distancias resulta igual a cero? Sabemos
que si obtenemos las distancias de cada dato con respecto a su media, la suma de
las distancias de los datos mayores a la media, es igual a la suma de las distancias
de los datos menores a ella, y si a las distancias de los datos menores a la media
les asignamos signos negativos y a las mayores signos positivos, la suma siempre
resultara cero y por esta vía resulta imposible obtener la distancia o variabilidad
promedio.
Una manera de resolver este problema es elevar al cuadrado las distancias, con lo
cual se resolvería el problema de los signos. Obtendríamos la distancia cuadrática
promedio, lo que nos daría la medida que buscamos elevada al cuadrado, la cual
se conoce como varianza y se representa con s2. Una vez calculada la varianza,
34
obtenemos su raíz cuadrada y con esto la medida buscada, que se conoce como
desviación estándar.
Muestra 1 Muestra 2
Xi ̅ )
(X - 𝑿 (X - 𝑿̅ )2 Xi ̅ )
(X - 𝑿 (X - 𝑿̅ )2
17 17 – 18 = -1 1 15 15 – 18 = -3 9
18 18 – 18 = 0 0 16 16 – 18 = -2 4
19 19 – 18 = 1 1 23 23 – 18 = 5 25
2 38
̅ )2
∑(X − 𝑿 2 ̅ )2
∑(X − 𝑿 38
S2 = = 1 𝑢𝑛𝑖𝑑𝑎𝑑 2 S2 = = 19 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 2
𝑛−1 2 𝑛−1 2
S = √1 = 1 𝑢𝑛𝑖𝑑𝑎𝑑 S = √19 = 4.36 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠
El resumen de las muestras es el siguiente:
Ahora si es posible distinguir con este resumen una muestra de la otra. Es

necesario, entonces una medida de tendencia central y una de variabilidad.
¿Qué significado tiene la varianza y la desviación estándar?
La varianza no tiene significado. Se expresa en las unidades de los datos elevadas
al cuadrado. Sí estas estudiando el número de clientes que llegan a un autolavado,
la varianza tiene como unidades clientes 2, lo cual no tiene ningún significado. La
desviación estándar tiene las mismas unidades que los datos y nos proporciona la
variabilidad promedio de los datos con respecto a su media.
La muestra 1, tiene tres datos, su promedio es 18. No significa que todos los datos
sean 18, unos serán mayores y otros serán menores. ¿Qué tanto se aleja los datos
individuales con respecto a 18? Unos se alejan más, otros se alejan menos, pero
en promedio se alejan 1 unidad, que es su desviación estándar.
La muestra 2, tiene tres datos, su promedio es 18. No significa que todos los datos
sean 18, unos serán mayores y otros serán menores. ¿Qué tanto se aleja los datos
individuales con respecto a 18? Unos se alejan más, otros se alejan menos, pero
en promedio se alejan 4.36 unidades, que es su desviación estándar.
Tal vez te preguntes por qué el denominador de 𝑆 2 es n-1, en lugar de n, si estamos
buscando una variabilidad promedio. Desde el punto de vista de la Estadística
Descriptiva es irrelevante dividir entre uno u otro. Desde el punto de vista de la
Inferencia Estadística si es importante la selección del divisor y se divide entre N si
se trata de la variabilidad de la población y entre n-1 si es la variabilidad de una
muestra.
Entonces, la varianza y la desviación estándar tienen las siguientes expresiones:
¿Qué es el coeficiente de variación?
35
El coeficiente de variación es una medida de variabilidad relativa de una serie de
datos y se obtiene dividiendo la desviación estándar de los datos entre su media.
Debido a que la desviación estándar y la media tienen las mismas unidades, el

coeficiente de variación se expresa por lo general en proporción o en porcentaje
y por lo tanto, se utiliza para comparar la variabilidad de dos o más series de datos.
¿Se pueden calcular la varianza y la desviación estándar a partir de los datos

agrupados en una tabla de frecuencias?
Si es posible calcular éstas medidas a partir de una Tabla de distribución de
frecuencias. Utilizando la Tabla de distribución de frecuencias que nos indica el
tiempo que tardaron algunos clientes en una caja bancaria, determinemos la
varianza y la desviación estándar.
Lo primero que tenemos que calcular es la media como lo hicimos anteriormente.
Tiempo invertido No. de Marca de Xifi
en atender al clientes clase
cliente fi Xi
141 – 157 2 149 298
157 – 173 13 165 2145
173 – 189 17 181 3077
189 – 205 14 197 2758
205 – 221 3 213 639
221 – 237 1 229 229
9146
Calculemos la distancia de cada dato con respecto a la

media. Recuerda que suponemos que lo valores de los
datos son las marcas de clase. Incluiremos una columna
donde se registren estas distancias
36
Añadimos una columna donde se anoten las distancias al cuadrado
Finalmente estas distancias cuadráticas corresponden a la distancia al cuadrado de

cada dato con respecto a su media, pero recuerda que suponemos que cada dato
o marca de clase se repite un número igual a su frecuencia, por lo que tenemos que
obtener en una columna los productos.
37
Entonces la varianza es:
La desviación estándar es:
El coeficiente de variación es:
La expresión para la varianza y

la desviación estándar a partir
de datos agrupados en tablas de
frecuencias viene dada por
Ya que la desviación estándar es una medida de variabilidad ¿Se puede usar para
determinar cuántos datos se encuentran en diferentes intervalos alrededor de la
media?
Si, la desviación estándar nos permite determinar, con un buen grado de precisión,
donde están localizados los valores de una distribución de frecuencias con relación
a la media.
¿Qué es Probabilidad? Fuente: https://concepto.de/probabilidad/#ixzz5dM6YSy1u
El concepto de probabilidad proviene del término latino probabilĭtas. En primera
instancia se entiende como la posibilidad que existe de que un determinado hecho
probable realmente suceda. Ese hecho puede finalmente suceder, o no suceder.
La idea de probabilidad es algo en lo que diversos pensadores han trabajado a lo
largo de la historia de la humanidad. En un principio estos términos se relacionaban
exclusivamente con los juegos de azar ya practicados hace más de cinco mil años.
El concepto ha sufrido tales cambios y ha sido objeto de interés tan particular que
hoy en día la probabilidad es considera incluso como una de las ramas de la
matemática.
En este caso se define a la probabilidad como el estudio y medición cuantitativa de
que un determinado hecho suceda o se produzca. Para ello se determinan ciertos
presupuestos del contexto, sus posibles combinaciones y además se hace uso de
la disciplina de la estadística. En este caso las probabilidades suelen ser
representados en número mayores a cero e inferiores a uno o en fracciones.
¿Qué mide, y cuáles son sus métodos?
Dentro de la teoría de la probabilidad se intenta determinar la cantidad de veces que
puede un determinado resultado acontecer, con el fin de conocer qué suceso es el
más probable. Algunos de los elementos que se tienen en cuenta son el espacio de
muestras, los sucesos, los sucesos elementales y las partes.
38
En el estudio de la probabilidad pueden ser identificados tres tipos de métodos.
 El primero es llamado el método de distribución binominal. En este caso los
es posible obtener dos resultados, los mismos son independientes y
excluyentes entre sí. Por ejemplo si se lanza una moneda puedo obtener cara
o cruz, al obtener cara no puedo obtener cruz y viceversa.
 El segundo método es llamado de multiplicación. En este caso se determina
una probabilidad de varios eventos que son independientes entre sí, es decir
que los resultados obtenidos no tendrán influencia en los demás resultados.
 El último método es el de la suma o regla de adición. En este caso la
posibilidad de que suceda un evento específico es equivalente a la sumatoria
de las probabilidades particulares. Esta regla se da bajo la condición que los
eventos sean excluyentes entre sí.
Las áreas en las que pueden ser aplicados los estudios de probabilidad son
diversas. Algunos ejemplos son gráficos o tablas relacionadas con la compra y venta
de las empresas, son también utilizadas en los censos o en diversos estudios de las
ciencias sociales y naturales. Las tablas estadísticas suelen reflejar las llamadas
frecuencias, sean las mismas acumuladas, con intervalos o de doble entrada. En
dichas tablas la información recolectada en organizada de manera clara y visible
para que sean comprensibles fácilmente.
Algunos de los grandes pensadores que se preocuparon por la probabilidad fueron
por ejemplo Galileo Galilei; a quien se le atribuyen las bases para la posterior
fundación de la estadística, Blaise Pascal; quien formuló una teoría acerca de las
propiedades de los números que es aún muy utilizada, Pierre La place; quien definió
ciertas aplicaciones prácticas a la teoría de la probabilidad, entre muchos otros
pensadores.
PROBABILIDAD
Definición de probabilidad
La probabilidad de un suceso es un número, comprendido entre 0 y 1, que indica
las posibilidades que tiene de verificarse cuando se realiza un experimento
aleatorio.
Experimentos deterministas
Son los experimentos de los que podemos predecir el resultado antes de que se
realicen.
Ejemplo:
Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que
la piedra bajará. Si la arrojamos hacia arriba, sabemos que subirá durante un
determinado intervalo de tiempo; pero después bajará.
Experimentos aleatorios
Son aquellos en los que no se puede predecir el resultado, ya que éste depende
del azar.
Ejemplos:
Si lanzamos una moneda no sabemos de antemano si saldrá cara o cruz.
Si lanzamos un dado tampoco podemos determinar el resultado que vamos a
obtener.
Teoría de probabilidades
La teoría de probabilidades se ocupa de asignar un cierto número a
cada posible resultado que pueda ocurrir en un experimento aleatorio, con el
39
fin de cuantificar dichos resultados y saber si un suceso es más probable que
otro. Con este fin, introduciremos algunas definiciones:
Suceso
Es cada uno de los resultados posibles de una experiencia aleatoria.
Ejemplos:
Al lanzar una moneda salga cara.
Al lanzar un dado se obtenga 4.
Espacio muestral
Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo
representaremos por E (o bien por la letra griega Ω).
Ejemplos:
 Espacio muestral de una moneda: E = {C, X}.
 Espacio muestral de un dado: E = {1, 2, 3, 4, 5, 6}.
Suceso aleatorio es cualquier subconjunto del espacio muestral.

Ejemplos:
Tirar un dado un suceso sería que saliera par, otro, obtener múltiplo de 3, y otro,
sacar 5.
Un ejemplo completo
Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas.
Calcular:
1. El espacio muestral.
E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}
2. El suceso A = {extraer tres bolas del mismo color}.
A = {(b,b,b); (n, n,n)}
3. El suceso B = {extraer al menos una bola blanca}.
B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}
4. El suceso C = {extraer una sola bola negra}.
C = {(b,b,n); (b,n,b); (n,b,b)}
Regla general para eventos dependientes

Autor: Mario Orlando Suárez Ibujes
https://www.monografias.com/trabajos89/regla-general-y-particular-
multiplicacion-probabilidades
Si A y B son dos eventos dependientes, es decir, si la ocurrencia de A afecta

la probabilidad de ocurrencia de B, entonces, dicha probabilidad se calcula
empleando la siguiente regla:
40
Nota:
La probabilidad del evento B, calculada bajo la suposición de que el evento A ha
ocurrido, se denomina probabilidad condicional de B, dado A, y se denota por P
(B/A).
Ejemplos ilustrativos
De una baraja estándar de 52 cartas sea A el suceso de sacar un As en la primera
extracción y B sacar un As en la segunda extracción. Calcular la probabilidad de
sacar dos Ases en dos extracciones sin devolver la carta extraída.
Solución:
A y B son sucesos dependientes porque la ocurrencia de A afecta la probabilidad
de ocurrencia de B.
La probabilidad de que la primera carta sea un As es:
41
Reemplazando los anteriores valores en la regla general de la multiplicación de
probabilidades para eventos dependientes se obtiene:
Un ejemplo más. Sea A el suceso de sacar un As de una baraja estándar de 52

cartas y B sacar un Rey de corazón rojo. Calcular la probabilidad de sacar un As y
un Rey de corazón rojo en dos extracciones sin devolver la carta extraída.
Solución:
A y B son sucesos dependientes porque la ocurrencia de A afecta la probabilidad
de ocurrencia de B.
Reemplazando los anteriores valores en la regla general de la multiplicación de

probabilidades para eventos dependientes se obtiene:
En una clase de 50 alumnos, 10 alumnos tienen como preferencia solamente la

asignatura de Matemática, 15 prefieren solamente Estadística y 5 no tienen
preferencia por ninguna de estas asignaturas. Calcular la probabilidad que de un
alumno de la clase seleccionado al azar tenga preferencia por
a) Matemática y Estadística.
b) Estadística y Matemática
Solución:
Realizando un diagrama de Venn-Euler se obtiene:
42
Simbología:
S = espacio muestral
A= Matemática
B = Estadística
a = Solamente Matemática
b = Solamente Estadística
c = Matemática y Estadística
d = Ninguna de las dos asignaturas
Datos y cálculos:
a = 10
b = 15
c = S - a - b - d = 50 - 10 - 15 - 5 = 20
d=5
S = 50
a) Matemática y Estadística.
O también, observando el diagrama de Venn-Euler se tiene directamente la

probabilidad solicitada:
43
La suposición de que el alumno seleccionado tenga preferencia por Matemática
significa que sólo consideremos el conjunto A, de los 30 elementos de A, sólo 20
tienen preferencia por Estadística. Por lo tanto la probabilidad condicional
P(B/A) = 20/30 = 2/3
O también, observando el diagrama de Venn-Euler y aplicando la fórmula de la
probabilidad condicional se tiene:
Reemplazando valores en la regla de la multiplicación para eventos dependientes

se obtiene:
b) Estadística y Matemática.
O también observando el diagrama de Venn-Euler se tiene directamente la

probabilidad solicitada:
La suposición de que el alumno seleccionado tenga preferencia por Estadística

significa que sólo consideremos el conjunto B, de los 35 elementos de B, sólo 20
tienen preferencia por Matemática. Por lo tanto la probabilidad condicional:
P(A/B) = 20/35 = 4/7
Reemplazando valores en la regla general de la multiplicación:
44
Notas:
En los eventos dependientes se cumple:
4) De una tómbola que contiene 3 bolas rojas y 5 blancas, Mathías extrae tres bolas,
sin volver a la tómbola la bola extraída, calcular la probabilidad de que las 3 bolas
extraídas sean:
a) Rojas
b) 2 rojas y una blanca
c) Una roja y 2 blancas
d) 3 blancas
Solución:
a) Rojas
En 3 sucesos la fórmula de la regla general de probabilidades es:
Reemplazando valores en la regla general de la multiplicación se obtiene:
O también, elaborando un diagrama de árbol se tiene todas las probabilidades:

45
En el diagrama de árbol, la probabilidad correspondiente a cada rama del árbol
corresponde a la probabilidad condicional de que ocurra el evento específico, dado
que han ocurrido los eventos de las ramas precedentes. Al describir un evento
mediante una trayectoria a través del diagrama de árbol, la probabilidad de que
ocurra dicho evento es igual a producto de las probabilidades de las ramas que
forman la trayectoria que representa al mencionado evento.
La solución empleando el diagrama de árbol para es multiplicando las
ramas RRR, es decir,
Regla particular o especial para eventos independientes

Si A y B son dos eventos independientes, es decir, si el conocimiento de la
incidencia de uno de ellos no tiene efecto en la probabilidad de ocurrencia del otro,
entonces, para calcular la probabilidad de dichos eventos se aplica la siguiente
regla:
46
Nota: Dos eventos A y B son independientes si la
ocurrencia de uno de ellos
no afecta la probabilidad de
ocurrencia del otro, esto es, si
Ejemplos ilustrativos
1) De una baraja estándar de 52 cartas sea A el
suceso de sacar un As en la primera extracción y
B sacar un Rey en la segunda extracción. Calcular
la probabilidad de sacar un As y un Rey en dos extracciones devolviendo la carta
extraída.
Solución:
A y B son sucesos independientes porque la ocurrencia de A afecta la probabilidad
de ocurrencia de B.
Reemplazando los anteriores valores en la regla particular de la multiplicación se

obtiene:
2) Una pareja de esposos desean tener 3 hijos. Suponiendo que las probabilidades
de tener un niño o una niña son iguales, calcular la probabilidad de éxito en
tener hombre en el primer nacimiento, mujer en el segundo nacimiento y hombre en
el tercer nacimiento.
Solución:
M = mujer
H = hombre
Elaborando un diagrama de árbol se tiene todas las probabilidades:
Entonces,
47
www.monografias.com AUTOR: MAGALLY ROSARIO DE LA CRUZ MACHUCA mrdm20@hotmail.com
ALUMNA DE LA MAESTRIA EN “SALUD PÚBLICA CON MENCIÓN EN SALUD REPRODUCTIVA”
UNIVERSIDAD NACIONAL FEDERICO VILLARREAL.
Distribución de probabilidades discretas

PROBLEMA
Hay una campaña en un centro médico del poblado de Ucayali, sobre paternidad
responsable a un grupo de mujeres. Una vez finalizada la charla se les entrega un
papelito con una única pregunta:
¿Desearía usted ser esterilizada?
1. Si 2. No
Usted es alumna de la maestría en Salud Publica con mención en Salud
Reproductiva, está interesada en investigar si las charlas tienen un efecto favorable
en el sentido de que las mujeres se decidan a ser sometidas a la esterilización.
Ante este tipo de situaciones en la cual uno se encuentra todos los días, tenemos
que acudir a las Distribuciones de Probabilidades. En nuestro ejemplo, la variable
Deseo ser esterilizada, es una variable cualitativa, discreta. Por lo tanto se requieren
de las Distribuciones de Probabilidades Discretas. Que es la que estudiaremos en
este trabajo.
VARIABLE ALEATORIA
Una variable se dice que es aleatoria, si los posibles valores que puede tomar son
determinados por el azar. En otras palabras se sabe qué valores puede tomar la
variable pero no se tiene certeza de su ocurrencia, sólo se sabe que puede ocurrir
con una cierta probabilidad. Por ejemplo, en una epidemia de cólera, se sabe que
una persona cualesquiera puede enfermar o no (eventos), pero no se sabe cuál de
los dos eventos va a ocurrir. Solamente se puede decir que existe una probabilidad
de que la persona enferme.
Las variables aleatorias se clasifican:
1. Discretas: aquellas que resultan de contar el número de casos en los que el
evento de interés ocurre, por ejemplo: número de hijos de una familia, número
de veces que llega una paciente al servicio de emergencia, etc.
2. Continuas: aquellas que resultan producto de una medición, por ejemplo: el
peso, el nivel de hemoglobina, etc.
DISTRIBUCION DE PROBABILIDADES DISCRETAS
Sigamos con nuestro ejemplo del centro médico de departamento de Ucayali.

Nuestra variable de interés seria:
Deseo ser esterilizada.
48
Supongamos que a la charla asistieron tres mujeres, entonces definimos como
variable aleatoria a:
X: Número de mujeres que desearían ser esterilizadas.
Antes de hacerles la pregunta sobre su deseo de ser esterilizadas, puede considerar
las posibles respuestas:
X = 0  Ninguna desearía ser esterilizada
X = 1  Sólo una de las mujeres desearía
X = 2  Dos mujeres desearían
X = 3  Las tres mujeres desearían
Antes de verificar las respuestas de las 3 mujeres seleccionada; no sabe cuántas
estarán de acuerdo en ser esterilizadas, pero si conociera las probabilidades de
ocurrencia de cada uno de los posibles valores de la variable podría predecir su
ocurrencia con una cierta probabilidad. El conjunto de las probabilidades de
ocurrencia de los posibles valores de la variable aleatoria se denomina distribución
de probabilidades.
En nuestro ejemplo:
X Probabilidad
0 0.125
1 0.375
2 0.375
3 0.125
A esto se le llama distribución de probabilidades discreta. Discreta porque la

variable X deseo ser esterilizada es discreta.
Nosotros estudiaremos dos tipos de distribuciones de probabilidades discretas: la

Binomial y la de Poisson, para su solución, utilizaremos las matemáticas y también
el Excel.
www.ieszaframagon.com/matematicas/estadistica/...aleatoria/tema5_2.ht...
1. DISTRIBUCIÓN DE PROBABILIDAD PARA VARIABLES ALEATORIAS
DISCRETAS.
1.1.-VARIABLES ALEATORIAS
Partimos de un determinado experimento y de su espacio muestral asociado E. Una

variable aleatoria es una aplicación, que al cualquier suceso del espacio muestral le
49
asocia un número. O sea, para hablar de variable aleatoria, nuestro experimento
tiene que ser de tal forma que cada posible suceso o resultado se pueda expresar
mediante un número.
Ejemplos de variables aleatorias:
 Puntuación obtenida al lanzar un dado. Es una variable aleatoria pues cada

posible resultado se puede expresar mediante un número.
 Edad de una persona elegida al azar.
 Altura de un árbol.
 Número de caras al lanzar tres monedas.
 Número de personas en una muestra de 50 que comen frutas habitualmente.
No son variables aleatorias:
 Sacar una prenda dentro de un cajón.

 Sacar una bola de una urna que contiene bolas blancas, negras y verdes.
 Elegir una persona al azar que le guste el teatro o no.
En los últimos ejemplos, tal como están planteados no serían variables aleatorias,
pero a veces podemos asociarles valores para que sí lo sean. Por ejemplo, si yo
digo que el suceso "le gusta el teatro" vale 1 y el suceso "no le gusta el teatro" vale
0, ya tendría definida una variable aleatoria sobre el experimento elegir una persona,
que valdría 1 si le gusta el teatro y 0 si no le gusta.
El concepto de variable aleatoria surge ante la necesidad de cuantificar los

resultados de los experimentos aleatorios para poder realizar un estudio matemático
de dichos resultados.
El concepto de variable aleatoria y variable estadística es muy similar, solo que en

variables estadísticas contamos y partimos de datos concretos, mientras que en
variables aleatorias partimos de lo que puede pasar antes de realizar el
experimento.
Así pues, con variables aleatorias, también hacemos la división en discretas y

continuas, las representamos con los mismos gráficos y podemos calcular los
mismos parámetros. La diferencia estribará en que en las variables estadísticas
miramos las frecuencias (absolutas o relativas) y en las variables aleatorias
miraremos las probabilidades de ocurrencia de cada suceso.
1.2.-VARIABLES ALEATORIAS DISCRETAS
Una variable aleatoria se dirá discreta si el conjunto de valores que toma es un

conjunto numerable, es decir, que sólo puede tomar unos valores concretos. Dicho
conjunto lo denotaremos por: {x1, x2, x3,...., si}
50
Toda variable aleatoria discreta tiene asociada una función de probabilidad, que a
cada valor, le marca la probabilidad de que la variable tome dicho valor. Esta
probabilidad viene a jugar el mismo papel que la frecuencia relativa en los temas de
estadística.
Ejemplo 1: Obtener la función de probabilidad de la variable "puntuación obtenida

al lanzar un dado".
Valores Función de Definimos la variable aleatoria X= puntuación obtenida.

de la probabilidad
variable pi = P[𝑋 = 𝑥i] Los posibles resultados son: 1, 2, 3, 4, 5 y 6 y todos
Xi esos valores tienen una probabilidad de 1 / 6.
1 1
6 Si ponemos en forma de tabla los resultados, la función
2 1 de probabilidad quedaría:
6
3 1
6
4 1
6
5 1
6
6 1
6
Ejemplo 2: Obtener la función de probabilidad de la variable "número de caras

obtenidas al lanzar tres monedas"
Antes que nada, vamos al construir el espacio muestral del experimento lanzar tres
monedas. Éste sería:
E = {(c,c,c); (c,x,c); (x,c,c); (c,c,x); (c,x,x,); (x,c,x); (x,x,c); (x,x,x)}
Si definimos X = nº de caras obtenidas, vemos que los posibles valores son: 0, 1, 2

y 3; y la función de probabilidad será:
xi 0 1 2 3 Como puedes observar en los dos

1/8 = 3/8 = 3/8 = 1/8 = ejemplos, la suma de todas las
pi probabilidades tiene que ser 1,
0.125 0.375 0.375 0.125
pues estaríamos considerando el
espacio muestral completo
Parámetros de una variable aleatoria
La ventaja de trabajar con variables aleatorias es que podemos hacer cálculos que
adquieren significado sobre el comportamiento de la variable. En una variable
aleatoria, podemos calcular todos los parámetros que habíamos visto en la
51
estadística unidimensional: media, varianza moda, mediana, percentiles,
desviaciones, etc., aunque nosotros vamos a centrarnos en las dos primeras, la
media y la varianza, (bueno o la desviación típica que era la raíz de la varianza si
recuerdas)
MEDIA: La media de una variable aleatoria se llama ESPERANZA MATEMÁTICA,

se representa por E(X) o por µ y viene a darnos el "valor esperado" de la variable
al realizar el experimento aleatorio. La fórmula para calcularla es
VARIANZA: El significado es el mismo que en la estadística. Aporta una medida

sobre la dispersión de los valores de X. Para calcularla usamos una de las dos
fórmulas, aunque es más aconsejable la segunda:
Veamos un par de ejemplos:

Valores Función de
de la probabilidad
Ejemplo: Calcula la media y la varianza de la variable del variable pi = P[𝑋 =
Ejemplo 1 Xi 𝑥i]
1 1
6
2 1
6
Lo que significa que el valor esperado en el 3 1
lanzamiento de un dado es 3,5 6
4 1
6
5 1
6
Y si queremos calcular la desviación típica, haríamos la 6 1
raíz cuadrada de ese resultado y obtendríamos, 1.708 6
xi 0 1 2 3 Ejemplo: Calcula la
esperanza y la varianza de
1/8 = 1/8 = la variable número de
pi 3/8 = 0.375 3/8 = 0.375
0.125 0.125 caras del ejemplo 2
52
E(X) =0·0,125 + 1·0,375 + 2·0,375 + 3·0,125 = 1,5.
Luego el número de caras esperado en el lanzamiento de tres monedas es una y

media.
Var (X) =(02·0,125 + 12·0,375 + 2 2·0,375 + 32·0,125 ) - 1.52 = 3 - 2.25 = 0.75

Ejercicios
1.- En la siguiente tabla se presenta la distribución del número de hijos de un grupo
de 100 parejas:
Nº de hijos 0 1 2 3 4 5 7
Nº de parejas 15 40 23 10 7 4 1
a. Obtener la función de probabilidad de la variable aleatoria nº de hijos

b. ¿Cuál es la probabilidad de una pareja elegida al azar tenga menos de dos
hijos?
c. ¿Cuál es la probabilidad de que tenga más de tres hijos?
d. Si se elige un hijo al azar, ¿cuál es la probabilidad de que no tenga
hermanos?
e. Determina el número de hijos esperado al seleccionar una familia al azar.
f. Calcula la varianza de la variable.
2.- Una variable aleatoria discreta tiene la siguiente función de probabilidad:
Xi -2 -1 0 1 2 3
pi 0.08 0.21 0.1 0.23 0.04
a. Calcula el dato que falta.

b. Halla la media y la desviación típica.
c. Calcula P[X > 1] y P[ -1.5 < X < 2]
3.- ¿Cuál es el dinero que espera ganar un jugador que lanza dos dados de quinielas
(o sea, solo con tres caras, 1, X y 2) y recibe 90 dólares si salen dos doses; 45
dólares si sale un dos y paga 81 dólares si no sale dos?
VALOR ESPERADO
Se llama también esperanza matemática. Se trata de un operador matemático que
al ser aplicado a la función probabilidad permite el cálculo de ese valor en el caso
discreto, mientras que en el caso continuo se lo aplica a la función frecuencia.
53
Esperanza matemática
En estadística la esperanza matemática (también llamada esperanza, valor

esperado, media poblacional o media) de una variable aleatoria , es el número
que formaliza la idea de valor medio de un fenómeno aleatorio.
Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la

probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho
suceso. Por lo tanto, representa la cantidad media que se "espera" como resultado
de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene
constante y el experimento se repite un elevado número de veces. Cabe decir que
el valor que toma la esperanza matemática en algunos casos puede no ser
"esperado" en el sentido más general de la palabra - el valor de la esperanza puede
ser improbable e incluso imposible.
Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es

3,5. Podemos hacer el cálculo
La esperanza matemática o valor esperado de una variable aleatoria discreta es

la suma del producto de la probabilidad de cada suceso por el valor de dicho
suceso.
Los nombres de esperanza matemática y valor esperado tienen su origen en los

juegos de azar y hacen referencia a la ganancia promedio esperada por un
jugador cuando hace un gran número de apuestas.
Si la esperanza matemática es cero, E(x) = 0, el juego es equitativo, es decir,

no existe ventaja ni para el jugador ni para la banca.
Ejemplos
1 Si una persona compra una papeleta en una rifa, en la que puede ganar de
5.000 dólares o un segundo premio de 2000 dólares con probabilidades de: 0.001
y 0.003. ¿Cuál sería el precio justo a pagar por la papeleta?
E(x) = 5000 · 0.001 + 2000 · 0.003 = 11 dólares
54
2 Un jugador lanza dos monedas. Gana 1 o 2 pesos si aparecen una o dos caras.
Por otra parte pierde 5 pesos si no aparece cara. Determinar la esperanza
matemática del juego y si éste es favorable.
E = {(c,c);(c,x);(x,c);(x,x)}
p(+1) = 2/4
p(+2) = 1/4
p(−5) = 1/4
E(x)= 1 · 2/4 + 2 · 1/4 - 5 · 1/4 = −1/4. Es desfavorable
Esperanza matemática o media Varianza
Desviación típica
Calcular la esperanza matemática, la varianza, y la desviación típica, de la distribución

de probabilidad de las puntuaciones obtenidas al lanzar un dado.
x pi x·pi x 2 · pi
6 1 6
55
DISTRIBUCION BINOMIAL
Esta distribución se basa en el proceso de Bernoulli. Se denominan procesos de

tipo Bernoulli, a todo experimento consistente en una serie de pruebas repetidas,
caracterizadas por tener resultados que se pueden clasificar en si verifican o no
cierta propiedad o atributo, siendo aleatorios e independientes.
Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben

verificar tres condiciones:
1. Resultados dicotómicos: Los resultados de cada prueba se pueden clasificar en
“éxito” si verifican cierta condición, o “fracaso” en el caso contrario.
2. Independencia de las pruebas: El resultado de una prueba cualquiera es
independiente del resultado obtenido en la prueba anterior, y no incide en el
resultado de la prueba siguiente.
3. Estabilidad de las pruebas: La probabilidad p de obtener un resultado
considerado como un éxito se mantiene constante a lo largo de toda la serie
de pruebas.
Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener
exactamente r éxitos, en una serie de n pruebas, con una probabilidad de éxito p,
se puede aplicar la fórmula de la probabilidad binomial:
n
P( x)    p x (1  p) n  x
 x
X = 0, 1, 2,……, n.
n n!
  
 x  (n  x)! x!
La media o valor esperado es  = np
La varianza 2 = np (1-p)
Supongamos que un experimento aleatorio tiene las siguientes características:
 El experimento aleatorio consiste en repetir un cierto número de veces, "n",

una determinada prueba.
 En cada prueba del experimento, sólo son posibles dos resultados: el suceso
A, que llamaremos éxito y su complementario, llamado fracaso.
 El resultado de cada prueba es independiente de los resultados obtenidos
anteriormente, es decir, el resultado obtenido en la primera prueba, no influye
para nada en el posible resultado de la segunda o la tercera.
 La probabilidad de que ocurra el éxito es siempre la misma y la expresaremos
como "p", y por tanto, la probabilidad de fracaso será q = 1 - p.
56
Todo experimento aleatorio con estas características se dice que sigue el modelo
de la distribución binomial, y a la variable X que expresa el número de éxitos
obtenidos en las n repeticiones de la prueba, se le llama variable aleatoria binomial
y se representa por B(n, p); donde "n" es el número de repeticiones de la
prueba y "p" la probabilidad de éxito.
Ejemplos de variables que siguen una distribución binomial:
 Número de caras al lanzar 7 monedas.

 Número de piezas defectuosas que fabrica una máquina.
 Número de tachuelas que al caer quedan de punta.
Veamos cómo calcular la probabilidad de los distintos valores de X con un ejemplo:

"Un examen tipo test consta de 10 preguntas, cada una de ellas con tres posibles
respuestas, de forma que sólo una de las tres es correcta. ¿Cuál es la probabilidad
de que un estudiante que contesta al azar acierte 6?"
Definimos X = "Número de aciertos en las 10 preguntas". En este caso, cada

pregunta es cada una de las pruebas que se repiten, o sea, n = 10.
De la manera que está planteado el problema sólo hay dos posibles resultados, o
acierta (éxito, pues me preguntan sobre los aciertos) o no acierta (fracaso) y la
probabilidad de acierto en cada prueba es la misma, 1 / 3.
Por tanto efectivamente X sigue una distribución binomial;

X es B (10, 1/3) y el problema me pide P [X = 6]
Para calcular esa probabilidad, observamos que X = 6 significa 6 aciertos y 4 fallos,

o sea (1 / 3) 6 · (2 / 3) 4. Además hay que tener en cuenta cómo repartir los 6 aciertos
a lo largo de las 10 preguntas; no importa el orden y no se pueden repetir las
preguntas, por tanto combinación sin repetición de 10 elementos tomados de 6 en
6.Luego la probabilidad pedida es:
General, si X sigue una distribución B(n, p), la función de probabilidad viene dada
por la fórmula:
57
Donde, n, debe ser un entero positivo y p debe pertenecer al intervalo 0 ≤ p ≤ 1,
por ser una proporción. Su media y su varianza, vendrán dadas por las siguientes
expresiones
El cálculo de la media y la varianza de una distribución binomial es inmediato si
conocemos sus parámetros n y p. Haciendo cálculos se llega a que:
Esperanza: E(X) = n*p
Varianza: Var(X) = n*p*q; donde q = 1- p, o sea, la probabilidad de fracaso.
Var(X) = n*p*(1 – p)
Veamos el siguiente ejemplo: Sea el caso de una droga X, con una dosis mortal
de 1g/100 ml para cobayos experimentales, en el 25% de los casos. Aplicando esta
dosis a cien cobayos se desea saber cuánto vale la probabilidad de que mueran
veinte de ellos.
Primero analizaremos si este caso cumple los supuestos básicos de una distribución
binomial:
 Los cobayos mueren (éxito) o sobreviven (fracaso).
 Que un cobayo muera con la dosis, no significa que lo hará el siguiente
(independencia) pues no se trata de una epidemia.
 La probabilidad de que mueran se mantiene constante a lo largo de la serie de
pruebas (p = 0,25).
Entonces, como si cumple los supuestos básicos, aplicamos la fórmula:
100  100 20
P( x  20)  
 20 
 (0.25) (1  0.25)
20
 0.04902  4.9%
 
Mucha matemática. No se preocupen, tenemos al Excel. Ingresamos la información
y listo P(x=20) = 0.0493
58
Veamos otro ejemplo:
En una farmacia se ha calculado la probabilidad de venderle a un cliente con obra
social es del 20%. Se eligen al azar 15 clientes de ese tipo que ingresan al negocio
y se desea calcular la probabilidad de concretar menos de tres ventas.
Si se cumple los supuestos básicos de la distribución binomial, entonces:
P(x<3) = P(x=0) + P(x=1) + P(x=2)
Matemáticamente esto se resuelve así:
15 
P( x  0)    (0.20) 0 (1  0.20)150  0.0352
0
15 
P( x  1)    (0.20)1 (1  0.20)151  0.1319
1
15 
P( x  2)    (0.20) 2 (1  0.20)15 2  0.2309
2
Entonces: P(x<3) = 0.0352 + 0.1319 + 0.2309 = 0.398
Ahora los hacemos con el Excel.
Matemáticamente P(x<3) = P (x≤ 2). El Excel calcula siempre o igualdad o menor
igual. Cuando queremos menor igual, en la opción de acumulado ingresamos
VERDADERO.
Entonces P(x<3) = 0.398
Gracias Excel, por facilitarme las

cosas.
Distribuciones muestrales
Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y
59
tomadas de la misma población tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadístico, como la
media muestral, calculado a partir de las medias en una muestra aleatoria, cambie
su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos
los valores posibles de un estadístico. Tales distribuciones serán muy importantes
en el estudio de la estadística inferencial, porque las inferencias sobre las
poblaciones se harán usando estadísticas muestrales.
Con el análisis de las distribuciones asociadas con los estadísticos muestrales,
podremos juzgar la confiabilidad de un estadístico muestral como un instrumento
para hacer inferencias sobre un parámetro poblacional desconocido. Como los
valores de un estadístico, tal como la media, varían de una muestra aleatoria a otra,
se le puede considerar como una variable aleatoria con su correspondiente
distribución de frecuencias. La distribución de frecuencia de un estadístico muestral
se denomina distribución muestral. En general, la distribución muestral de un
estadístico es la de todos sus valores posibles calculados a partir de muestras del
mismo tamaño.
Distribución Muestral de Medias
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una
población grande. Se calcula la media muestral x para cada muestra; la colección
de todas estas medias muestrales recibe el nombre de distribución muestral de
medias, lo que se puede ilustrar en la siguiente figura:
Muestra 1 𝑋̅1 X1
Muestra 2 𝑋̅2 X2
Muestra 3 X3
𝑋̅3
Muestra k Xk
𝑋̅k
POBLACIÓN DISTRIBUCIÓN MUESTRAL DE MEDIAS
El Teorema del Límite Central también nos indica que cuando se extraen muestras
de tamaño mayor a 30 o bien de cualquier tamaño pero provenientes de una
población normal, la distribución muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la fórmula de la distribución
normal con
𝜎
µ = 𝑋̅ y 𝑆= 𝑛
√
S es equivalente al error estándar de la media, entonces la fórmula para calcular la
probabilidad del comportamiento del estadístico, en este caso la media de la
muestra, quedaría de la siguiente manera:
𝑋̅ − µ
Z= 𝜎
√𝑛
60
𝜎
Sobre el Error Estándar 𝑆 =
√𝑛
Actividad 1. Se eligen muestras de pares de números, con reemplazo, de la
población de los valores 0, 2, 4 y 6.
Encontrar:
μ, la media poblacional.
S, la desviación estándar poblacional.
μ x, la media de la distribución muestral de medias.
S x, la desviación estándar de la distribución muestral de medias.
Además, graficar las frecuencias para la población y para la distribución muestral
de medias.
Nota: Usar muestra s ordenadas implica todas las combinaciones de valores, por
ejemplo, (4,2) y (2,4) son dos parejas diferentes.
0+2+4+6
Solución: La media poblacional es: μ = =3
4
La distribución de frecuencias de la población es una distribución uniforme.
La desviación estándar de la poblacional es:
√(0 − 3)2 + (2 − 3)2 + (4 − 3)2 + (6 − 3)2

σ= = 2.236
4
La distribución muestral de las medias es:

Muestra 𝑋̅
(0, 0) 0
(0, 2) 1
grafica de frecuendcias
(0, 4) 2 𝑋̅ f f𝑋̅ para las medias de las
(0, 6) 3 0 1 0 muestras
(2, 0) 1 1 2 2
5
(2, 2) 2 2 3 6
4
(2, 4) 3 3 4 12
4 3 12 3
(2, 6) 4
5 2 10 2
(4, 0) 2
(4, 2) 3 6 1 6 1
(4, 4) 4 16 48 0
0 1 2 3 4 5 6
(4, 6) 5
(6, 0) 3 La media de la distribución muestral de medias es:
(6, 2) 4
∑𝑓𝑥
(6, 4) 5 µx = ∑𝑓 = 48/16 = 3
(6, 6) 6
̅ −µx )2
∑f(𝑿 1(0 – 3)2 + 2(1 – 3)2 + 3(2 – 3)2 + 4(3 – 3)2 + 3(4 – 3)2 + 2(5 – 3)2 +1(6−3)2
σ=√ = √ = 1.58
∑f 16
61
PRUEBAS DE HIPÓTESIS
Autor
Mario Orlando Suárez Ibujes
http://www.monografias.com/trabajos91/prueba-hipotesis-medias-excel-y-
winstats/prueba-hipotesis-medias-excel-y-winstats.shtml#ixzz3lNkevmRy
En vez de estimar el valor de un parámetro, a veces se debe decidir si una
afirmación relativa a un parámetro es verdadera o falsa. Es decir, probar una
hipótesis relativa a un parámetro. Se realiza una prueba de hipótesis cuando se
desea probar una afirmación realizada acerca de un parámetro o parámetros de
una población.
Una hipótesis es un enunciado acerca del valor de un parámetro (media,
proporción, etc.).
Prueba de Hipótesis es un procedimiento basado en evidencia muestral
(estadístico) y en la teoría de probabilidad (distribución muestral del estadístico)
para determinar si una hipótesis es razonable y no debe rechazarse, o si es
irrazonable y debe ser rechazada.
La hipótesis de que el parámetro de la población es igual a un valor determinado se
conoce como hipótesis nula. Una hipótesis nula es siempre una de status quo o de
no diferencia.
Se simboliza comn el símbolo H0 y cuando se se desarrolla la prueba se asume que
la hipótesis nula es verdadera y este supuesto será rechazado sólo si se encuentran
suficientes evidencias en base a la información muestral.
Siempre que se especifica una hipótesis nula, también se debe especificar una
hipótesis alternativa, o una que debe ser verdadera si se encuentra que la hipótesis
nula es falsa. La hipótesis alternativa se simboliza H1. La hipótesis alternativa
representa la conclusión a la que se llegaría si hubiera suficiente evidencia de la
información de la muestra para decidir que es improbable que la hipótesis nula sea
verdadera y por tantorechazarla. Es siempre opuesta a la Hipótesis Nula.
En toda prueba de hipótesis se presentan 3 casos de zonas críticas o llamadas

también zonas de rechazo de la hipótesis nula, estos casos son los siguientes:
62
En toda prueba de hipótesis se pueden cometer 2 tipos de errores:
1) Error tipo I: se comete error tipo I, cuando se rechaza la Ho, siendo esta
realmente verdadera. A la probabilidad de cometer error tipo I, se le conoce
como nivel de significación y se le denota como α
2) Error tipo II: se comete error tipo II, cuando se rechaza la Ho, siendo esta
realmente falsa. A la probabilidad de cometer error tipo II, se le denota como
β
El complemento de la probabilidad de cometer error tipo II, se le llama
potencia de la prueba y se denota como 1 – β
Como resumen se da la siguiente tabla:
63
Se acepta H0 Se rechaza H0
H0 es verdadera Decisión correcta Error Tipo I
H0 es falsa Error Tipo II Decisión correcta
Prueba medias de una muestra

Se utiliza una prueba de una muestra para probar una afirmación con respecto a
una media de una población única.
Nota: Se considera práctico utilizar la distribución t solamente cuando se requiera

que el tamaño de la muestra sea menor de 30, ya que para muestras más
grandes los valores t y z son aproximadamente iguales, y es posible emplear la
distribución normal en lugar de la distribución t.
64
Ejemplos ilustrativos:
1) La duración media de una muestra de 300 focos producidos por una compañía
resulta ser de 1620 horas.
65
Como se tiene como dato el tamaño de la población se tiene que verificar si cumple
con la condición para utilizar el factor finito de corrección.
66
Los cálculos en Excel se muestran en la siguiente imagen:
67
El gráfico elaborado con Winstats y Paint se muestra en la siguiente imagen:
2) La duración media de lámparas producidas por una compañía han sido en el

pasado de 1120 horas. Una muestra de 8 lámparas de la producción actual dio una
duración media de 1070 horas con una desviación típica de 125 horas.
68
Los cálculos en Excel se muestran en la siguiente imagen:
69
Prueba medias de dos muestras

Las pruebas de dos muestras se utilizan para decidir si las medias de dos
poblaciones son iguales. Se requieren dos muestras independientes, una de cada
una de las dos poblaciones. Considérese, por ejemplo, una compañía investigadora
que experimentan con dos diferentes mezclas de pintura, para ver si se puede
modificar el tiempo de secado de una pintura para uso doméstico. Cada mezcla es
probada un determinado número de veces, y comparados posteriormente los
tiempos medios de secado de las dos muestras. Una parece ser superior, ya que
su tiempo medio de secado (muestra) es 30 minutos menor que el de la otra
muestra.
Pero, ¿son realmente diferentes los tiempos medios de secado de las dos pinturas,
o esta diferencia muestral es nada más la variación aleatoria que se espera, aun
cuando las dos fórmulas presentan idénticos tiempos medios de secado? Una vez
más, las diferencias casuales se deben distinguir de las diferencias reales.
Con frecuencia se utilizan pruebas de dos muestras para comparar
dos métodos de enseñanza, dos marcas, dos ciudades, dos distritos escolares y
otras cosas semejantes.
La hipótesis nula puede establecer que las dos poblaciones tienen medias iguales:
70
Para tamaños más pequeños de muestra, Z estará distribuida normalmente sólo si
las dos poblaciones que se muestrean también lo están.
71
Ejemplo ilustrativo
La media de las calificaciones de dos muestras de 15 estudiantes de primer
semestre en la asignatura de Estadística de la universidad UTN resulta ser de 7 y
8,5. Se sabe que la desviación típica de las calificaciones en esta asignatura fue en
el pasado de 1,5.
72
Los cálculos en Excel se muestran en la siguiente figura:
Bibliografía
SUÁREZ, Mario, (2012), Interaprendizaje de Probabilidades y Estadística
Inferencial con Excel, Winstats y Graph, Primera Edición. Imprenta M & V,
Ibarra, Ecuador.
73
ANÁLISIS DE CORRELACION: Es el grupo de técnicas estadísticas empleado
para medir la intensidad de la relación (correlación) entre dos variables.
El principal objetivo del análisis de correlación es determinar qué tan intensa
es la relación entre dos variables. Una medida de esta relación es el coeficiente de
correlación ( r ) el cual puede tomar valores en una escala desde –1 hasta +1
inclusive como se indica enseguida.
-1.00 -0.50 0 +0.50 +1.00
Correlación negativa (C.N.) correlación positiva (C.P.)
COEFICIENTE DE CORRELACION ( r ): Originado por el investigador Karl

Pearson aproximadamente en el año 1900, el coeficiente de correlación describe la
intensidad de la relación entre dos conjuntos de variables, por lo cual también se le
conoce como r de Pearson.
Si r toma los valores de –1 o de +1 indica correlación perfecta como se indica
en los siguientes diagramas de dispersión.
(Gráfica que indica la relación entre las dos variables).
y y
r = -1 x x
Correlación Negativa Perfecta Correlación Positiva Perfecta

Si r = 0 indica que no existe ninguna correlación entre las dos variables.
El coeficiente de correlación se calcula mediante la siguiente fórmula:
n( xy)  ( x)( y)

r
[n( x²)  ( x)²][n( y ²)  ( y)²]
Donde:
n  es el número de pares de observaciones (x, y)
x  valores de la variable independiente x.
y  valores de la variable dependiente y.
74
EJEMPLO:
El director de personal de una empresa debe entrevistar y seleccionar nuevo
personal para el área de ventas. Ha diseñado una prueba que ayude a seleccionar
los mejores aspirantes. Con la finalidad de verificar la validez de su prueba, como
instrumento de predicción de las ventas semanales, eligió al azar cinco vendedores
experimentados y aplicó la prueba a cada uno (esta muestra es pequeña para fines
didácticos, en la práctica debe tomarse una muestra mucho mayor).
Los resultados obtenidos se muestran en la tabla siguiente:
VENDEDOR PUNTUACIÓN DE PRUEBA VENTAS SEMANALES

SR. MARTÍN 4 $ 5,000
SR. JOSE 7 12,000
SRA. MARIA 3 4,000
SR. JUAN 6 8,000
SRA. SILVIA 10 11,000
Se piensan entonces que las ventas semanales dependen de la puntuación de
prueba por lo cual se toman las ventas como variable dependiente ( y ) y la
puntuación de prueba como variable independiente ( x ).
El diagrama de dispersión de los datos anteriores se muestra a continuación:
Y
Ventas 14
Semanales 12
10
8
6
4
2
1 2 3 4 5 6 7 8 9 10 11 x
Puntuación de prueba
Utilizando los datos originales se construye lo siguiente:

Puntuación de Ventas
Prueba ( X ) Semanales ( Y ) X² XY Y²
4 5 16 20 25
7 12 49 84 144
3 4 9 12 16
6 8 36 48 64
10 11 100 110 121
X = 30 Y = 40 X² = 210 XY = 274 Y² = 370
El coeficiente de correlación es 0.88 calculado por:
75
n( xy)  ( x)( y)
.r 
[n( x²)  ( x)²][n( y ²)  ( y)²]
5(274) − (30)(40) 170

𝑟= = = 0.88
√⟦5(210) − (30)2 )⟭⟦(5(370) − 402 )⟭ √(150)(250)
Lo cual indica una relación muy intensa.

Coeficiente de determinación: Es la proporción de la variación total en la variable
dependiente (y) que se explica por, o se debe a, la variación total en la variable
dependiente (x).
COEFICIENTE DE DETERMINACIÓN = (COEFICIENTE DE CORRELACIÓN)² =

r²
Para el ejemplo anterior el coeficiente de correlación es = ( 0.88 )² = 0.77 e indica

que el 77% de la variación total en las ventas semanales se explica por, o se debe
a, la variación en las puntuaciones de prueba.
Coeficiente de no-determinación: Es el complemento del coeficiente de
determinación.
Para el ejemplo el coeficiente de no-determinación = 1 - r² = 1 - 0.77 = 0.23. Esto
significa que 23% de la variación total en las ventas semanales no se debe a la
variación en las puntuaciones de prueba.
Un coeficiente de correlación de 0.80 da un coeficiente de determinación de 0.64.
Algunos estadígrafos preferirían utilizar la medida más conservadora (0.64),
considerando que el coeficiente de correlación de 0.80 puede exagerar la relación
entre los dos conjuntos de variables.
ANALISIS DE REGRERSION LINEAL (SIMPLE)
Se define a la regresión lineal como una relación fundamental entre dos o
más variables correlacionadas y se usa para pronosticar una variable con base en
la otra. Por lo general la relación se obtiene de dos datos observados. En la
regresión lineal la relación entre variables forma una línea directa.
La línea de regresión lineal es de la forma y’ = a + bx, donde y’ es la variable
dependiente que queremos resolver; a es la intersección de y’; b es la dependiente
y x es la variable independiente (en el análisis de series de tiempo, x representa
unidades de tiempo).
La regresión lineal es útil para pronósticos a largo plazo de sucesos
importantes y para la planificación agregada. Por ejemplo, sería muy útil para
76
pronosticar la demanda de familias de productos. Aunque es probable que durante
un periodo varié bastante la demanda para un producto específico de la familia, la
demanda para toda la familia es sorpresivamente regular.
La restricción principal para usar los pronósticos de regresión lineal es que,
supuestamente, los datos pasados y las proyecciones caen sobre una línea recta.
Aunque esto limita su aplicación, algunas veces, si usamos un periodo más breve
puede usarse el análisis de regresión lineal. Por ejemplo, si existe una tendencia
de crecimiento y usamos un período de diez o veinte años la tendencia se pierde
entre todos los datos y será baja la proyección para el año siguiente. Sin embargo,
si sólo usamos los últimos años, el pronóstico será más preciso. Es una parte del
procedimiento de regresión lineal se estima lo adecuado del ajuste en la línea con
los datos.
La regresión lineal se usa tanto para pronósticos de series de tiempo como
para pronósticos de relaciones causales cuando la variable dependiente (por lo
general el eje vertical de un gráfico) cambia como resultado del tiempo (el eje
horizontal en el gráfico), se trata de un análisis de series de tiempo. Si una variable
cambia debido al cambio de otra variable, estamos ante una relación causal (como
el incremento en el número de muertes por cáncer en el pulmón con respecto a las
personas que fuman).
METODO DE MINIMOS CUADRADOS

El método de mínimos cuadrados trata de ajustar a la línea a los datos que
minimicen la suma de los cuadrados de la distancia vertical entre cada punto de
datos y su punto correspondiente a la línea.
La ecuación de mínimos cuadrados para la regresión lineal es la que se indica a
continuación:
y’ = a + bx
Donde:
y’ → variable dependiente calculada por la ecuación, indica el pronóstico para el
período x.
x → periodo de tiempo.
a →es el valor de y’ cuando x es = 0.
b → es la pendiente de la línea.
 y  b x n xy   x y
a b
n n x²   x ²
y → Representa el valor de la variable correspondiente del periodo x.
77
EJEMPLO 1.
Pronostique las ventas para los periodos 13, 14 y 15 si las ventas de los 12 periodos
anteriores son los que se indican a continuación.
Periodo (x) Ventas (y) (xy) (x²) Y’
1 600 600 1 801.3
2 1550 3100 4 1160.9
3 1500 4500 9 1520.5
4 1500 6000 16 18880.1
5 2400 12000 25 2239.7
6 3100 18600 36 2599.4
7 2600 18200 49 2959.0
8 2900 23200 64 3318.6
9 3800 34200 81 3678.2
10 4500 45000 100 4037.8
11 4000 44000 121 4397.4
12 4900 58800 144 4757.1
∑x = 78 ∑y = 33,350 ∑ = 268,200 ∑= 650
Calculando la pendiente:
12(268,200)  78(33,350) 3218,400  2601300 617,100
b    359.6153
12(650)  (78)² 7800  6084 1716
Por lo tanto el valor de a será:

33,350  359.6153(78)
a  441.66
12
El pronóstico para el periodo 13 será:
y’13 = a +bx = 441.66 + 359.6153 (13) = 5,116
y para el periodo 14 y 15:

Ventas
y’14 = 441.66 + 359.6153 (14) = 5,476 6000
5000
y’15 = 441.66 + 359.6153 (15) = 5,836 4000
3000
2000
1000
0
0 5 10 15
78
El error estándar de estimación, o sea, la calidad de ajuste de la línea a los datos
anteriores es:
n
y i  y 'i ²
Sy '  i 1
 363.9
n2
Una ecuación más fácil de calcular para el error estándar es:
Sy ' 
 y ²  a y  b xy
n2
EJEMPLO 2.
Volviendo a las puntuaciones de prueba y las ventas semanales de los cinco
vendedores, las sumas y otros datos básicos para despejar o evaluar a y b aparecen
en la tabla siguiente:
Ventas
Puntuación semanales
de prueba. (niveles de
dólares)
Vendedor X Y X² XY Y²
Sr. Amber 4 5 16 20 25
Sr. Archer 7 12 49 84 144
Sra. Smith 3 4 9 12 16
Sr. Malcolm 6 8 36 48 64
Sra. 10 11 100 110 121
Goodwin
Total 30 40 210 274 370
¿Cuál es la ecuación de regresión?

SOLUCION: Las sumas de la tabla anterior se utilizan para ilustrar los cálculos para
a y b en la ecuación de regresión:
n xy   x y 5274  (30)( 40)

b
n x²   x ²
= = 1.133
5(210)  (30)²
a = Y – bx = (40/5) – 1.133(30/5) = 8 – 6.798 = 1.202

Y’ = 1.202 + 1.133 (EN MILES DE DÓLARES).
79
Por tanto, la ecuación de regresión es y’ = 1.202 + 1.133x (en miles de dólares).
Las ventas pronosticas para un candidato a un puesto en ventas, que calificó 6 en
la puerta del director de personal es $8000, que se obtiene por y’ = a + bx = 1.202
+ 1.133(6) = 1.202 + 6.798 = 8.000 (en miles de dólares).
EJERCICIO:
Datos: Calcular el pronóstico para los meses de enero, febrero y marzo del año
siguiente.
E F M A M J J A S O N D E F M A M J J A S O N D EF M
6 5 6 8 8 6 7 7 6 7 7 6 7 8 9 7 7 7 6 8 8 8 9 10
8 5 3 2 7 3 7 8 2 8 4 2 4 0 6 4 1 1 6 6 5 9 1 3
80

Material Estudio Estadística

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Material Estudio Estadística

Hochgeladen von

Copyright:

Verfügbare Formate

CONCEPTOS BÁSICOS

Autor: Orlando Acosta www.monografias.com

¿Qué son la Estadística Descriptiva e Inferencial?

La estadística descriptiva e inferencial forman parte de las dos ramas

Rev. chil. anest. Vol. 43 Número 2 pp. 109-

Por ejemplo, en el indicador de analfabetismo, la unidad de análisis es la persona,

Esta corresponde a la entidad mayor o representativa de lo que va a ser objeto

Cuando vamos a utilizar la estadística es necesario hacer referencia al conjunto de

Las características que se tienen en cuenta son:

Variable: es cada una de las características que pueden

Ejemplo 2: Se desea conocer cuál es la estatura de los alumnos de una escuela.

Ejemplo 3: Un fabricante de tornillos desea hacer un control de calidad. Para

1.- Muestreo aleatorio simple

4.- Muestreo Discrecional

Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico

RECOLECCIÓN Y PRESENTACIÓN DE DATOS

Recolección, organización y presentación de datos estadísticos.

Ascendente: de menor a mayor.

Para indicar resumidamente estas sumas se utiliza la letra griega

Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se

Frecuencia relativa acumulada

- Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores

𝑓𝑟𝑎% = 𝑓𝑟𝑎 ∙ 100

27 I 1 1 0.032 3.2 0.032 3.2

28 II 2 3 0.065 6.5 0.097 9.7

29 6 9 0.194 19.4 0.290 29.1

30 7 16 0.226 22.6 0.516 51.7

31 8 24 0.258 25.8 0.774 77.5

32 III 3 27 0.097 9.7 0.871 87.2

33 III 3 30 0.097 9.7 0.968 96.9

34 I 1 31 0.032 3.2 1 100

REGLAS GENERALES PARA FORMAS DISTRIBUCIONES DE FRECUENCIAS

1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la

Calculando el número de intervalos se obtiene:

Calculando el ancho se obtiene:

Calculando el nuevo rango se obtiene: 𝑁𝑢𝑒𝑣𝑜 𝑅 = 𝑛𝑖 ∙ 𝑖 = 6 ∙ 4 = 24

6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se obtiene

Redondeando se obtiene: i = 6, por lo que es necesario realizar un ajuste al rango.

4) Calculando el nuevo rango se obtiene:

Clases f X p.m fr fa f% fra fra%

El valor de f = 8: Significa que 8 estudiantes dedicaron a estudiar la semana pasada

El valor de x p.m. = 50,5: Significa que 7 estudiantes dedicaron en promedio a

El valor de fr = 0,15 y f% = 15%: Significa que el 0,15 o el 15% de los estudiantes

El valor de fa = 26: Significa que 26 estudiantes dedicaron a estudiar la semana

Para realizar los cálculos de la frecuencia absoluta empleando Excel se procede de

EJEMPLO ejercicio en casa. Suponga que un investigador desea determinar cómo

EJEMPLO en clase. Calificaciones obtenidas en la primera evaluación de

Nombre Calif. Nombre Calif. Nombre Calif. Nombre Calif.

OTRO EJEMPLO. Con el ejemplo siguiente se muestra la elaboración e

En el eje vertical se representan las

Hora Temperatura Vari abl es cont i nuas o

[100, 110) 110 5 63

[110, 120) 115 2 65

Ojiva (grafica de frecuencias acumuladas)

ANÁLISIS Y DESCRIPCIÓN ESTADÍSTICA

Medidas de tendencia central

Suponga que le pedimos a un grupo de estudiantes de la asignatura de estadística

¿Qué nos revelan

Entonces a partir de los histogramas elaborados, observamos que:

La acumulación o tendencia del peso de los hombres se encuentra entre los 70 y

• La variabilidad de todo el grupo está en un rango comprendido entre los 42 y los

¿Cuáles son las medidas de tendencia central?

Tiempo invertido en atender No. de clientes Marca de clase

Si el número de datos fuera par, tendríamos