Sie sind auf Seite 1von 12

Las estadsticas son nmeros que resumen los hechos y cifras en bruto de una manera significativa.

Se presentan las ideas clave que pueden no ser inmediatamente evidentes con slo mirar los datos en bruto, y por los datos, nos referimos a hechos o personajes de los que podemos sacar conclusiones. Por ejemplo, usted no tiene que vadear a travs de un montn de resultados de ftbol cuando lo nico que quiero saber es la posicin de la liga de su equipo favorito. Necesita una estadstica de forma rpida le dar la informacin que necesita. Si realmente entiende las estadsticas, usted ser capaz de tomar decisiones objetivas, y transmitir el mensaje que desee en la forma ms eficaz posible. Se esta mejor equipado para saber cuando las estadsticas son inexactas o engaosas. En otras palabras, el estudio de las estadsticas es una buena manera de asegurarse de que no lo estn engaando. Tipos Estadstica descriptiva. Se estudia el total de una poblacin, por lo que se basa en el censo. Estadstica inferencial. Se estudia una parte de la poblacin y en base a esta estima conclusiones sobre el total de una poblacin, por lo que se base es el muestreo. Variable. Es una caracterstica, cualidad, rasgo, atributo o propiedad del sujeto o unidad de observacin. Son atributos o caractersticas de los eventos, y que por lo tanto pueden tomar diversos valores. Las variables pueden ser definidas: La definicin conceptual es de ndole terica. La definicin operacional nos da las bases de medicin y la definicin de los indicadores. La operacionalizacin no es ms definir la expresin medible de las mismas. Clasificacin: Los datos categricos o cualitativos. Los datos se dividen en categoras que describen cualidades o caractersticas. Por esta razn, es tambin llamada de datos cualitativos. Un ejemplo de los datos cualitativos es gnero de los juegos, cada gnero constituye una categora aparte. La clave es recordar con datos cualitativos es que los valores de datos no pueden ser interpretados como nmeros. Los datos numricos o cuantitativos. Los datos numricos, por otra parte, se ocupa de los nmeros. Se trata de datos donde los valores tienen un significado como nmeros, y que involucra mediciones o conteos. Los datos numricos tambin se conocen como datos cuantitativos, ya que describe las cantidades. Discreta. Es aquella que aumenta o disminuye de unidad en unidad, sin incluir fracciones.

Continua. Es aquella que aumenta o disminuye de unidad en unidad, incluyendo fracciones.

Escala de medicin: Nominal, ordinal, intervalo y de razn. Escala nominal. Las categoras NO guardan un orden ascendente o descendente progresivo; slo indican diferencias entre s, pero de ninguna manera una es mejor o mayor que otra. Escala ordinal. Las categoras guardan un orden ascendente o descendente progresivo, es decir mantienen una disposicin jerrquica entre s. Escala de intervalo. Las categoras guardan un orden ascendente o descendente progresivo, es decir, mantienen una disposicin jerrquica, pero al mismo tiempo indican la distancia entre s, como en el ejemplo del peso al nacer: <1,000 gramos; 1,000-1,499; 1,500-1,599 gramos. Adems en las variables medidas en escala de intervalo, el cero NO significa la ausencia de. Escala de razn. Las categoras guardan un orden ascendente y descendente progresivo, es decir mantienen una disposicin jerrquica entre s. Adems estas categoras indican la distancia entre s. El cero SI significa ausencia de.

Medicin. Consiste en asignar un nmero o alguna calificacin a alguna propiedad o atributo especfico de un individuo, una poblacin o un evento usando ciertas reglas. Mutuamente excluyente. Significa que un sujeto no puede pertenecer a la vez a varias categoras de la misma variable. Colectivamente exhaustiva. Significa que las categoras conforman la totalidad de los aspectos del evento. Se clasifican en: Dicotmicas (dos categoras) Politmicas (ms de dos categoras) Los grficos de barra permiten una mejor exactitud. Una mejor manera de mostrar este tipo de datos es con un diagrama de barras. Al igual que los grficos circulares, grficos de barras le permiten comparar los tamaos relativos, pero la ventaja de utilizar un grfico de barras es que permiten un mayor grado de precisin. Son ideales en situaciones en las categoras son ms o menos del mismo tamao, como se puede ver con mucha ms precisin a qu categora tiene la frecuencia ms alta. Es ms fcil para usted ver las pequeas diferencias.

En un grfico de barras, cada barra representa una categora determinada, y la longitud de la barra indica el valor. Cuanto ms larga sea la barra, mayor ser el valor. Todos los bares tienen el mismo ancho, lo que hace que sea ms fcil compararlos. Los grficos de barras se pueden sacar ya sea vertical u horizontalmente. El grfico de sectores. Trabajan dividiendo los datos en distintos grupos o categoras. El tamao de cada sector es proporcional a cuntos hay en cada grupo en comparacin con los dems. Cuanto mayor sea la porcin, mayor ser la popularidad relativa de ese grupo. Histogramas son como diagramas de barras, pero con dos diferencias fundamentales. La primera es que el rea de cada barra es proporcional a la frecuencia, y la segunda es que no hay espacios entre las barras en el grfico. He aqu un ejemplo de un histograma que muestra el nmero promedio de los juegos comprados por mes por los hogares en Statsville:

La empresa necesita algn tipo de tabla que le mostrar la frecuencia total por debajo de un valor particular: la frecuencia acumulada. Por frecuencia acumulada bsicamente nos referimos a un total acumulado (de frecuencias). Distribucin de frecuencias Tabla utilizada para presentar datos clasificados sobre variables. Nmero de clases. Muchas veces es necesario encontrar el nmero de clases que es estadsticamente ptimo para realizar un histograma. Herbert Sturger en 1926, desarrollo un mtodo basado en el N de las muestras para encontrar este nmero de clases y su amplitud de rango. K = 1 + 3.3 LOG N Intervalo o amplitud de clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase.

Intervalo de clase. Recorrido de la variable dentro de una clase.

Marca de Clase. Es el punto medio del intervalo de clase.

Frecuencia relativa. Es el cociente entre la frecuencia absoluta de un determinado valor y un nmero total de datos.

Frecuencia describe cuantos elementos hay en un grupo particular. Es como una cuenta de cuantos hay. Valor atpico. Un valor extremo de alta o baja que se destaca del resto de los datos.

Puedes ver cmo los valores extremos se han retirado a la media mayor? Este efecto es causado por los valores atpicos en los datos. Cuando esto sucede, decimos que la informacin est sesgada. Datos sesgados. Cuando los valores atpicos empujan los datos a la derecha o a la izquierda.

Sesgada a la derecha

Sesgada a la izquierda

Datos simtricos Curtosis. Sirve para destacar tendencias. Medidas de Tendencia Central. Los valores obtenidos o calculados tienden a situarse al centro de los valores de la variable. Nota: la mediana y la moda lo son cuando el comportamiento es simtrico. Media aritmtica. Comnmente conocida como media o promedio.

Media ponderada. Se utiliza cuando existe importancia relativa de cierta variable.

Media geomtrica. Se puede utilizar para determinar variaciones de precios o para pronosticar tasa de crecimiento.

Media armnica. Debe utilizarse cuando se habla de productividad, metas, distancias, rendimiento.

Mediana. Si la media se convierte en engaosa debido a los datos sesgados y los valores extremos, entonces necesitamos de alguna u otra manera decir cual es el valor tpico. Podemos hacer esto, literalmente, tomando el valor medio. Se trata de un tipo diferente de promedio, y se llama mediana. Es decir que es el valor que alcanza el 50% de los casos y es superado por el otro 50% (valor mediano).

La mediana siempre esta en medio, es el valor medio. Pero Qu pasa si hay un nmero para de personas en la clase?

Si tienes un conjunto de nmeros pares solo se toma el valor promedio de los dos valores medio y esa ser la mediana. Moda. Adems de la media y la mediana, hay un tercer tipo de promedio llamado moda. La moda de un conjunto de datos es el valor ms popular, el valor con mayor frecuencia. A diferencia de la media y la mediana, la moda absolutamente tiene que ser un valor en el conjunto de datos, y es el valor ms frecuente.

A veces, los datos pueden tener ms de una modalidad. Si hay ms de un valor con la frecuencia ms alta, entonces cada uno de estos valores es una moda. Si un conjunto de datos tiene dos modas, entonces llamamos a los datos bimodales. Medidas de tendencia no central Las medidas de posicin no central permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Cuartiles. Valores que alcanzan el 25% de los casos y es superado por el 75% (25% y 75% dependen del cuartil). Deciles. Valores que alcanzan el 1% de los casos y es superado por el 99% (1% y 99% dependen del cuartil).

Percentiles. Valores que alcanzan el 10% de los casos y es superado por el 90% (10% y 90% dependen del cuartil).

Rango intercuartilico. Una "serie mini" que es menos sensible a los valores atpicos. Lo bueno del rango intercuartilico es que es mucho menos sensible a los valores extremos de la gama. Los cuartiles superior e inferior se

colocan de modo que el cuartil ms bajo tiene un 25% de los datos por debajo de ella, y el cuartil superior tiene un 25% de los datos por encima de ella. Esto significa que el rango intercuartilico slo utiliza el 50% central de los datos, por lo que los valores extremos se desprecian. Medidas de dispersin. Es el grado en el que los valores se sitan alrededor de una medida de tendencia central. Es importante mencionar que concentracin y dispersin son aspectos del mismo fenmeno. Sus resultados nos ayudan a poder confiar o no, en las medidas de tendencia central. A mayor dispersin menor confiabilidad de la medida de tendencia central. Tipos 1. Absolutas (de distancia). Son las que estn expresadas en la misma unidad de la variable. Rango, recorrido, oscilacin o campo de variacin. Se dice que es desde donde empiezan los datos hasta donde terminan. Debido a que el recorrido no toma todos lo valores sino solo los extremos; deben usarse otras medidas. R = DMayor Dmenor + 1 Desviacin media o desviacin absoluta media. Es la media aritmtica de las diferencias tomadas en su valor absoluto de cada uno de los valores con respecto a su media aritmtica.

Varianza. La variabilidad es mucho ms que difundir. Nosotros no slo queremos medir la propagacin de cada conjunto de resultados, queremos de alguna manera utilizar esto para ver qu tan confiable es el jugador. En otras palabras, queremos ser capaces de medir la variabilidad de las puntuaciones de los jugadores. Una forma de lograr esto es mirar a lo lejos cada valor de la media. Si podemos llegar a algn tipo de media distancia con la media de los valores, tenemos una manera de medir la variacin y la difusin. Podemos calcular la variacin con la varianza.

Desviacin estndar es una medida ms intuitiva. Lo que realmente queremos es un nmero que da la difusin en trminos de la distancia de la media, no la distancia al cuadrado. Soy la desviacin estndar. Si es necesario medir las distancias a la media, dame una llamada. Entonces la desviacin estndar es la propagacin de la media. Esta siempre debe ser mayor a o igual a cero.

2. Relativas. Son las que esta expresadas nicamente en porcentajes. Coeficiente de variacin. Es el % de dispersin de los valores con respecto de su media.

Das könnte Ihnen auch gefallen