Beruflich Dokumente
Kultur Dokumente
Es el ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de
clases. Es un agrupamiento de datos en clases acompañada de sus frecuencias: frecuencias
absolutas, frecuencias relativa o frecuencia porcentuales. En caso de que las variables estén al
menos en escala ordinal aparecen opcionalmente las frecuencias acumuladas absolutas, y
frecuencias acumuladas porcentuales. Las distribuciones de frecuencias varían en dependencia
si corresponden a una variable discreta o a una variable continua.
Variables Discretas: Las variables discretas pueden asumir solo ciertos valores,
y hay usualmente huecos entre los valores (número de cuartos en una casa, número de carros en
el estacionamiento del claustro, número de estudiantes en la clase de estadísticas). Note que
cada una de estas variables puede valer un número entero (p.ej. 1, 2, 3, etc.) pero no puede
valer números fraccionarios (p.ej. 1.5). Típicamente, las variables discretas resultan de un
conteo.
Variables continuas: Las variables continuas pueden asumir todos los valores
dentro de un rango específico (p.ej. presión del aire en una llanta, el tiempo que se toma en
viajar de Chihuahua a Juárez, el peso de los jugadores de fútbol americano de las águilas de la
U.A.CH., etc). Típicamente, las variables continuas resultan de medir algo, y lógicamente
dependen de la exactitud del instrumento de medición.
Población y muestra
El concepto de población en estadística va más allá de lo que comúnmente se conoce
como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que
presentan características comunes. “Una población es un conjunto de todos los elementos que
estamos estudiando, acerca de los cuales intentamos sacar conclusiones”. Levin & Rubin
(1996). “Una población es un conjunto de elementos que presentan una característica común”.
Cadenas (1974).
Ejemplo: Los miembros del Colegio de Ingenieros del Estado Cojedes. El tamaño que
tiene una población es un factor de suma importancia en el proceso de investigación estadística,
y este tamaño vienen dado por el número de elementos que constituyen la población, según el
número de elementos la población puede ser finita o infinita. Cuando el número de elementos
que integra la población es muy grande, se puede considerar a esta como una población infinita,
por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que
está formada por un limitado número de elementos, por ejemplo; el número de estudiante del
Núcleo San Carlos de la Universidad Nacional Experimental Simón Rodríguez. Cuando la
población es muy grande, es obvio que la observación de todos los elementos se dificulte en
cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente
se utiliza una muestra estadística. Es a menudo imposible o poco práctico observar la totalidad
de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero
llamado población o universo, se examina una pequeña parte del grupo llamada muestra.
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la
población porque el manejo de un menor número de datos provoca también menos errores en
su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos
realmente estudiados.
Histograma de Frecuencias
En muchos casos, si los datos han sido tomados de forma correcta, las conclusiones que se
pueden obtener a partir de los mismos son inmediatas. Si no es así, raramente se precisan
análisis estadísticos complicados, suele bastar con una adecuada representación gráfica.
Clases Marcas
[31.7,32.6) 32.15 1 0.02 1 0.02
[32.6,33.5) 33.05 5 0.10 6 0.12
[33.5,34.4) 33.95 10 0.21 16 0.33
[34.4,35.3) 34.85 15 0.31 31 0.64
[35.3,36.2) 35.75 7 0.15 38 0.79
[36.2,37.1) 36.65 6 0.13 44 0.92
[37.1,38.0) 37.55 4 0.08 48 1.00
Por último tenemos los histogramas 5 y 6, en los cuales aparecen datos que no
siguen el patrón de comportamiento general (anomalías, errores, etc...). Su
variabilidad puede atribuirse a alguna causa asignable que deberá ser identificada y
eliminada.
Polígonos de frecuencia:
Teoremas de probabilidad:
1.P(a + b) ═P(a)+P(b).
2. P(a x b) ═P(a) x P(b).
3. P(a ó b) ═P(a) + P(b).
4. P(a y b) ═P(a) x P(b).
5. P(a / b) ═P(a) x P(b)/P(b).
6.P(a unid b) ═P(a) + P(b) - P(a unid b). unid: unido
7. Probabilidad condicional: con reemplazo y sin reemplazo
Uno de los inconvenientes del uso de las probabilidades es su limitada aplicaron ya que
existen eventos en que las posibilidades no pueden ser consideradas como igualmente
probables. Por ejemplo: lloverá mañana, número de muertes/semana, quien ganara las
elecciones, etc. Con los teoremas de la adición y de la multiplicación se calculan
probabilidades pero con la permutación y la combinación se simplifican los calculas
especialmente cuando se tiene alta numeración.
Experimentos aleatorios: son aquellos que se pueden dar resultados deferentes aunque se
hayan realizados en iguales condiciones. Ejemplo: lanzar dados, monedas.
Ejemplo:
Variables aleatorias continuas
Se han registrado los tiempos que le tomó a una empresa de mensajería entregar 190
paquetes con destinatarios diferentes dentro de una misma ciudad. Los datos se han agrupado
en una distribución de frecuencias considerando intervalos de cinco días como sigue:
Tiempo No. de
de paquet
entrega es
(días)
[0,5) 115
[5,10) 31
[10,15) 17
[15,20) 12
[20,25) 10
[25,30) 5
Supongamos que un posible cliente, conociendo esta información, quisiera saber qué
probabilidad tiene de que su paquete sea entregado en dos días. El problema es que al manejar
intervalos de cinco días estamos suponiendo que dentro de cada intervalo los datos se
distribuyen uniformemente, cosa que no es real.
Otra posible solución es reducir la amplitud de los intervalos, de tal suerte que
podríamos tomar una amplitud de tres días por intervalo y hacer la siguiente distribución de
frecuencias:
Ahora, veamos. Lo que le interesa al futuro cliente es la probabilidad de que se haga una
entrega en un cierto tiempo, por lo que habría que considerar las frecuencias relativas y, como
antes, reducir la amplitud de los intervalos. Con esto se obtendrían las siguientes distribuciones
de frecuencias:
Intervalos de un día
Intervalo frec. frec. Intervalo frec. frec. Intervalo frec. frec.
rel. rel. rel.
[0,1) 51 0.268 [10,11) 4 0.021 [20,21) 2 0.011
[1,2) 25 0.132 [11,12) 4 0.021 [21,22) 2 0.011
[2,3) 17 0.089 [12,13) 3 0.016 [22,23) 2 0.011
[3,4) 12 0.063 [13,14) 3 0.016 [23,24) 2 0.011
[4,5) 10 0.053 [14,15) 3 0.016 [24,25) 2 0.011
[5,6) 8 0.042 [15,16) 3 0.016 [25,26) 1 0.005
[6,7) 7 0.037 [16,17) 3 0.016 [26,27) 1 0.005
[7,8) 6 0.032 [17,18) 2 0.011 [27,28) 1 0.005
[8,9) 5 0.026 [18,19) 2 0.011 [28,29) 1 0.005
[9,10) 5 0.026 [19,20) 2 0.011 [29,30) 1 0.005
Y podríamos graficar tal información en histogramas para poder ver cómo se aproximan,
si es que ocurre, los valores a una curva continua:
donde las barras rosas (y la línea roja) corresponden a los intervalos de cinco días; las barras y
línea azules, a los intervalos de tres días; las barras y línea amarillas, a los intervalos de dos
días; y las barras y líneas verdes, a los intervalos de un día.
Ejemplo:
El ingreso mensual que una corporación grande ofrece a los graduados en MBA tiene
una distribución normal con media de $2000 y desviación estándar de $200.
Un valor z igual a 1 indica que el valor de $2200 es mayor que la desviación estándar de
la media de $2000, así como el valor z igual a -1.5 indica que el valor de $1700 es menor que la
desviación estándar de la media de $2000.
Distribucion Binomial
En estadística, la distribución binomial es una distribución de probabilidad discreta del
número de éxitos en una secuencia de n experimentos independientes, cada uno de los cuales
tiene probabilidad θ de ocurrir. Su función de masa de probabilidad está dada por:
Ejemplo:
La distribución binomial se usa para encontrar la probabilidad de sacar 5 caras y 7
cruces en 12 lanzamientos de una moneda. Por lo tanto debemos definir la variable "X:
probabilidad de sacar cara en un lanzamiento de moneda". En este caso se tiene que
y resulta:
Distribucion de Poisson
Es una distribución de probabilidad discreta. Expresa la probabilidad de un número de
eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media conocida, y
son independientes del tiempo desde el último evento.
P(x) = l x * e-l / x!
l x = Lambda (número medio de ocurrencias por intervalo de tiempo) elevada a la potencia x).
e-l = e= 2.71828 elevado a la potencia de lambda negativa.
x! = x factorial.
Ejemplo:
P(0) = 0.00674
P(1) = 0.03370
P(2) = 0.08425
P(3) = 0.14042
n=>20
p=<0.05
La Distribución chi-cuadrado no tiene sentido para valores negativos de x, como se puede ver
en la figura.
donde:
Esta integral no tiene una solución conocida, y solo se conocen métodos numéricos para
calcular sus valores, hay distintos tipos de tablas y algoritmos para ordenador con los que se
pueden calcular sus soluciones.
Distribución Weibull
La distribución Weibull fue establecida por el físico suizo del mismo nombre, quien
demostró, con base en una evidencia empírica, que el esfuerzo al que se someten los materiales
puede modelarse de manera adecuada mediante el empleo de esta distribución. En los últimos
25 años esta distribución se empleó como modelo para situaciones tiempo-falla y con el
objetivo de lograr una amplia variedad de componentes mecánicos y eléctricos.
Se dice que una variable aleatoria continua X sigue una distribución de Weibull de
parámetros α y θ ambos mayores que 0 si su función de densidad está definida como:
Esperanza y varianza:
Aplicaciones
Ejemplo:
Sea X la variable aleatoria que representa el tiempo que transcurre hasta que se presenta
la primera avería. Por hipótesis, la función de densidad de probabilidad de X es: