Sie sind auf Seite 1von 23

DEFINICIÓN DE ESTADÍSTICA

La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir

una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos.

Por ejemplo, la estadística interviene cuando se quiere conocer el estado sanitario de un país,

a través de ciertos parámetros como la tasa de morbilidad o mortalidad de la población.

En este caso la estadística describe la muestra en términos de datos organizados y resumidos,

y luego infiere conclusiones respecto de la población. Aplicada a la investigación científica,

también infiere cuando provee los medios matemáticos para establecer si una hipótesis debe

o no ser rechazada. La estadística puede aplicarse a cualquier ámbito de la realidad, y por

ello es utilizada en física, química, biología, medicina, astronomía, psicología, sociología,

lingüística, demografía, etc.

Conceptos básicos estadísticos

La estadística es la ciencia que se ocupa de la recogida y obtención de datos y de su posterior

tratamiento para poder expresarlos numéricamente y así poder extraer conclusiones.

Los primeros estudios estadísticos eran demográficos así que se ha conservado gran parte del

vocabulario.

POBLACIÓN

En estadística una población es un conjunto de objetos, individuos, elementos o eventos con

determinadas características. A menudo se obtiene una muestra de dicha población, es decir,

un subconjunto representativo. Luego de realizar un análisis estadístico a la muestra, los

resultados se extrapolan al resto de la población (inferencia estadística). La estadística es


comúnmente considerada como una colección de hechos numéricos expresados en términos

de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos. Kendall

y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como

un valor resumido, calculado, como base en una muestra de observaciones que generalmente,

aunque no por necesidad, se considera como una estimación de parámetro de determinada

población; es decir, una función de valores de muestra.

1- Población finita

Se refiere a grupos de individuos en una cantidad claramente definida, como los habitantes

de una ciudad, los globos en una piscina, las cajas en un almacén, entre otros. Se pueden

contar y agrupar.

Algunos ejemplos de este tipo de población serían:

 Cantidad de alumnos en una universidad.

 Número de autos vendidos durante 2017.

 Terremotos de magnitud superior a los 4° en la escala de Ritcher ocurridos en una

ciudad.

2- Población infinita

Se trata de poblaciones inconmensurables. No obstante, es una noción meramente

conceptual, dado que toda población está compuesta por objetos o individuos en cantidades

finitas.
Entre los casos de población infinita se podrían mencionar como ejemplos:

 Los granos de arena en una playa

 La cantidad de olas que rompen contra un arrecife en un día.

 Las gotas de agua que caen durante una lluvia.

3- Población real

Es el grupo de elementos concretos, como, por ejemplo: el número de personas en edad

productiva en América Latina.

Otros ejemplos podrían ser:

 La cantidad de usuarios de una aplicación móvil determinada.

 El número de protestas civiles en una ciudad durante un mes.

 Los capítulos de una serie televisiva.

Como puede verse estos ejemplos son, al mismo tiempo, los de una población real y

finita.

4- Población hipotética

Es un concepto que aplica cuando se está trabajando con situaciones posibles hipotéticas. Por

ejemplo, cuántas personas podrían sobrevivir a una catástrofe.


Está relacionada con la población de observaciones hipotéticas que ocurre cuando se está

trabajando con muestras de observaciones referidas a conceptos psicológicos como ansiedad,

miedo.. En este caso, la población de observaciones es hipotética, potencial.

Ejemplo de esto sería:

 El nivel de ansiedad que tendrían los drogadictos que sigan, voluntariamente, un

tratamiento específico.

 El nivel de miedo que pueden sentir las personas al pasar por una experiencia

concreta.

 La angustia que puede sentir una madre al perder a su hijo en un parque de

diversiones.

5- Población estable

Se le llama así a los grupos de elementos que mantienen sus cualidades casi intactas por un

largo período.

Algunos ejemplos de estos casos tienen que ver, por ejemplo, con:

 Cambios en la geología de un territorio

 Velocidad de movimientos de los astros

6- Población inestable

Las cualidades de este tipo de población varían constantemente.


7- Población dependiente

Es el tipo de población que cambia sus valores por un motivo definido, una causa

identificada. La dependencia puede ser total o parcial.

Un ejemplo de esto podría ser:

 El nivel de ventas de un producto que puede depender de: la calidad del producto,

la publicidad, la distribución, etc.

8- Población polinomial

Se habla de población polinomial cuando en la investigación hay interés por varias de sus

características.

Por ejemplo: un censo poblacional, por lo general, recoge información sobre distintas

variables de los habitantes (edad, ubicación, nivel de ingresos y de instrucción).

INDIVIDUO EN ESTADÍSTICA

En estadística, como individuo o unidad estadística se denomina cada uno de los elementos

que componen una población, es decir, el conjunto de todos los elementos que es sometido a

una medición estadística. Como tal, el individuo es un ente observable, de allí que no tenga

que ser, necesariamente, una persona, sino que también puede ser un objeto, un organismo,

o algo abstracto.
MUESTRA

es una parte de la población con la que realmente se realiza el estudio.

Tamaño: es el número de elementos del que se compone la muestra y se suele representar

por la letra n. La elección de la muestra es muy importante para que los resultados que se

extraigan de ella se puedan generalizar a toda la población. Debe haber pocos individuos,

para que no sea muy costosa su realización, pero elegidos de forma que aparezcan todos los

estratos diferentes que forman la población. Por ejemplo, si quisiéramos saber los gustos

culinarios de la juventud actual; no bastaría preguntar a las puertas de una pizzería, pues hay

una parte de jóvenes que prefieren otro tipo de comidas y no visitan este tipo de

establecimientos. Si lo hiciéramos, la muestra seleccionada no sería representativa de toda la

población a estudiar.

TIPOS DE MUESTREO.

PUNTOS A CONSIDERAR: 1. Definir claramente la población de estudio. Pueden ser

personas, clínicas, fuentes de abastecimiento de agua.

Enfoque del estudio. Será a nivel nacional, regional, local Entre mayor sea la muestra tendrá

a ser más representativa y menor será el error de muestreo. Si se desea hacer cruces de

variables se recomienda no tener menos de 50 casos en c/u de las subcategorías de la variable

principal.

 Tipos de Muestreo
 Probabilístico
 Aleatorio Simple
 Estratificado
 Sistemático
 Por Conglomerado
 No Probabilístico
 Por conveniencia
 Por cuotas

VALOR

El valor es el resultado que puede cada uno de los datos del estudio.

En nuestro ejemplo, estamos realizando un estudio sobre la cantidad de alumnos que

aprueban las matemáticas. Entonces, podemos tener dos valores diferentes por cada dato:

 Sí aprueba

 No aprueba
DATO Y VARIABLE

Se le llama dato a cada uno de los valores obtenidos después de realizar el estudio estadístico

y variable al tipo de dato, que son una determinada característica de la población (número de

hijos, estatura, peso, color, profesión, etc).

Por ejemplo, empezamos estudiando a 3 alumnos y obtenemos estos datos:

 Alumno 1: Aprobado

 Alumno 2: Suspenso

 Alumno 3: Suspenso

En total, 1 «Aprobado» y 2 «Suspenso».

Tenemos 3 datos y cada uno de los datos puede tomar 2 valores («Aprobado» o «Suspenso»).

La variable estudiada en este caso es la calificación de la asignatura.

Dentro de una población se pueden recoger datos de diferentes variables. Por ejemplo, a los

vecinos de un edificio se les puede preguntar su peso, el color de ojos, si son hombre o mujer.

Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin

embargo, en la mayoría de los casos no es posible obtenerlos por razones de esfuerzo, tiempo

y dinero, razón por la cual se extrae, de la población, una muestra, mediante un procedimiento

llamado muestreo.

Se llama muestra a un subconjunto de la población, preferiblemente representativo de la

misma.

Tipos de variables
Variables cualitativas

Son el tipo de variables que como su nombre lo indica expresan distintas cualidades,

características o modalidad. Cada modalidad que se presenta se denomina atributo o

categoría, y la medición consiste en una clasificación de dichos atributos. Las variables

cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí

y no, hombre y mujer o ser politómicas cuando pueden adquirir tres o más valores.

Dentro de ellas podemos distinguir:

 Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar

distintos valores ordenados siguiendo una escala establecida, aunque no es necesario

que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte.

 Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos

a un criterio de orden, como por ejemplo los colores o el lugar de nacimiento.

Variables cuantitativas

Son las variables que toman como argumento cantidades numéricas, son variables

matemáticas. Las variables cuantitativas además pueden ser:

 Variable discreta: Es la variable que presenta separaciones o interrupciones en la

escala de valores que puede tomar. Estas separaciones o interrupciones indican la

ausencia de valores entre los distintos valores específicos que la variable pueda

asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).

 Variable continua: Es la variable que puede adquirir cualquier valor dentro de un

intervalo especificado de valores. Por ejemplo, la masa (2,3 kg, 2,4 kg, 2,5 kg,) o la
altura (1,64 m, 1,65 m, 1,66 m,), o el salario. Solamente se está limitado por la

precisión del aparato medidor, en teoría permiten que exista un valor entre dos

variables.

Según la influencia

Según la influencia que le asignemos a unas variables sobre otras, podrán ser:

Variables independientes

Una variable independiente es aquella cuyo valor no depende de otra variable. Es aquella

característica o propiedad que se supone es la causa del fenómeno estudiado. En

investigación experimental se llama así a la variable que el investigador manipula.

Las variables independientes son las que el investigador escoge para establecer

agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo

especial son las variables de control, que modifican al resto de las variables independientes

y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de

un sesgo.

La variable independiente se suele representar en el eje de abscisas.

La variable independiente es la que se le asignan valores arbitrarios

Variables dependientes

Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable.

La variable dependiente en una función que suele representar por y. La variable dependiente
se representa en el eje ordenadas. Son las variables de respuesta que se observan en el estudio,

y que podrían estar influidas por los valores de las variables independientes.

Hayman (1974: 69) la define como propiedad o característica que se trata de cambiar

mediante la manipulación de la variable independiente.

La variable dependiente es el factor que es observado y medido para determinar el efecto de

la variable independiente.

Otras variables

Variables intervinientes

Son aquellas características o propiedades que, de una manera u otra, afectan el resultado que

se espera y están vinculadas con las variables independientes y dependientes. Y es muy

similar a la variable moderadora, aunque no son iguales solo son muy similares a la forma de

relacionarlas.

Variables moderadoras

Niveles de Medición

Medir significa “asignar números a objetos y eventos de acuerdo a reglas” (Stevens, 1951),

esta definición es adecuada para el área de ciencias naturales, en el campo de las ciencias

sociales medir es “el proceso de vincular conceptos abstractos con indicadores empíricos”

(Carmines y Zeller, 1979, p. 10).

La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos

de las escalas miden variables categóricas y las otras dos miden variables numéricas (Therese
L. Baker, 1997). Los niveles de medición son las escalas nominales, ordinal, de intervalo y

de razón. Se utilizan para ayudar en la clasificación de las variables, el diseño de las preguntas

para medir variables, e incluso indican el tipo de análisis estadístico apropiado para el

tratamiento de los datos.

Una característica esencial de la medición es la dependencia que tiene de la posibilidad de

variación. La validez y la confiabilidad de la medición de una variable depende de las

decisiones que se tomen para operacionalizarla y lograr una adecuada comprensión del

concepto evitando imprecisiones y ambigüedad, por en caso contrario, la variable corre el

riesgo inherente de ser invalidada debido a que no produce información confiable.

DISTRIBUCIONES DE FRECUENCIA

Sea cual sea el tipo de variable, lo que se tiene como información de una variable en una

muestra es un número finito n de datos, es decir, de valores o de anotaciones sobre qué

modalidad (cualitativas) o qué valor (cuantitativas) tiene cada elemento de la muestra; a este

conjunto de datos se le llama distribución y, salvo cuando el tamaño de muestra n sea muy

pequeño, se debe resumir para que el lector pueda comprender bien los resultados.

Un primer y obligado paso de ese resumen de datos es el simple recuento de las repeticiones

de un mismo valor o modalidad; ello nos conduce al concepto fundamental de frecuencia,

con dos enfoques:


Frecuencia absoluta es el número de veces que una modalidad o un valor de una variable

aparece entre los datos de una muestra; si en una muestra de la variable “nivel de estudios”

aparecen 148 personas con nivel de estudios “superiores”, diremos que 148 es la frecuencia

absoluta de la modalidad “superiores”. Naturalmente, el número total de datos es n y, por

tanto, la suma de las frecuencias absolutas de todas las modalidades o valores debe ser igual

al tamaño muestral n.

Frecuencia relativa de una modalidad o valor de una variable es su frecuencia absoluta

dividida entre el tamaño muestral, es decir, la proporción de veces que aparece esa modalidad
o valor entre todos los datos de la muestra; si la frecuencia absoluta 148 del ejemplo anterior

corresponde a una muestra de 2000 personas, diremos que la frecuencia relativa de la

modalidad AB es 148/2000 = 0.074. Es claro que la suma de las frecuencias relativas de todas

las modalidades o valores debe ser 1, ya que las absolutas suman n y estamos dividiendo

entre n. Es muy habitual expresar las frecuencias relativas como porcentajes

(multiplicándolas por cien) y entonces la frecuencia relativa del ejemplo sería 7.4 % y la

condición de la suma sería que deben sumar 100 %, lo que se entiende mejor (la frecuencia

relativa es la parte del total de datos que corresponde a cada valor o modalidad).

Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable, y de ahí su

importancia; además, pese a su simplicidad, dan lugar a conceptos muy importantes, como

el de proporción, y son la base sobre la que se construye cualquier resumen de los datos.

TABLAS ESTADÍSTICAS

Ya hemos introducido la terminología adecuada, ahora vamos a utilizarla para ordenar y

agrupar la información. Lo primero que vamos a hacer es construir tablas estadísticas, en las

que va a aparecer toda la información de forma ordenada. Llamamos tabla estadística a la

disposición de forma ordenada y agrupada de los valores y frecuencias de una distribución.

Distinguiremos entre tablas estadísticas de distribuciones no agrupadas y tablas de

distribuciones agrupadas.

TABLAS DE DISTRIBUCIONES NO AGRUPADAS.

En las tablas de distribuciones no agrupadas aparecen las siguientes columnas: la primera

contiene los valores de la distribución, ordenados de menor a mayor si son caracteres

cuantitativos; la segunda contiene las frecuencias absolutas, la tercera las frecuencias


relativas. Cuando las frecuencias acumuladas se pueden definir se añaden otras dos

columnas, una para las frecuencias absolutas acumuladas y otra para las relativas

acumuladas.

Ejemplo:

TABLA ESTADÍSTICA DE LA 2ª ACTIVIDAD TOMANDO COMO


POBLACIÓN TODA LA CLASE

xi ni fi
Rubio 6 0,18
Pelirojo 1 0,04
Moreno 12 0,36
Castaño 14 0,32
33

TABLA DE ALUMNOS TABLA DE ALUMNAS

xi ni fi xi ni fi
Rubio 2 0,13 Rubia 4 0,23
Pelirojo 1 0,07 Peliroja 0 0
Moreno 6 0,4 Morena 6 0,33
Castaño 6 0,4 Castaña 8 0,44
LA MEDIA ARITMÉTICA

En matemáticas y estadística, la media aritmética, también llamada promedio o media, de un

conjunto infinito de números es el valor característico de una serie de datos cuantitativos,

objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se

obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos.

Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno

de los principales estadísticos muestrales.


GRAFICAS ESTADISTICAS

Las distribuciones de frecuencias se presentan en tablas como las anteriores, o bien en

gráficas. La representación gráfica se utiliza para facilitar al lector la comprensión de los

resultados, pero no añade ninguna información sobre la que contendría una tabla de

frecuencias; el objetivo de las gráficas es que la información “impacte” directamente al lector

y que se exprese el “perfil” de la distribución, pero no debe olvidarse el rigor en aras de la

estética: las gráficas deben reflejar fielmente lo que tratan de representar, fundamentalmente

las frecuencias de cada modalidad o valor. Por ello la regla fundamental para la construcción

de una gráfica es que:

Las áreas (o longitudes) han de ser proporcionales a las frecuencias,

condición inexcusable para que una gráfica sea correcta. Además, con carácter general puede

recomendarse que el pie de la gráfica explique convenientemente de qué se trata, que no se

intente representar demasiada información en una sola gráfica, que los detalles sean lo

suficientemente visibles, etc. Existen diversos tipos de gráficas, cada uno de ellos adecuado

a un cierto tipo de variables, por lo que podemos clasificar las gráficas atendiendo a estos

tipos.

Así, para caracteres o variables Cualitativas se pueden mencionar:

El diagrama de barras o rectángulos, consistente en asociar a cada modalidad de la variable

un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen situar en

horizontal y la escala de frecuencias absolutas o relativas en vertical. Si las bases de los

rectángulos se dibujan todas iguales, para cumplir la regla fundamental antes citada basta

tomar como alturas de los rectángulos directamente las frecuencias, sin mayor complicación
(el rectángulo de una modalidad con frecuencia 7 tendrá altura 7 y así con todas). Los

rectángulos suelen representarse separados en este tipo de gráficas, que también pueden

aparecer con las barras horizontales y las modalidades situadas verticalmente.

Grafica de pastel

Que refleja como sectores de un círculo las frecuencias de cada modalidad. Como el radio es

constante en un círculo, para cumplir la regla fundamental de proporcionalidad basta hacer

al ángulo de cada sector proporcional a la frecuencia, lo que se consigue multiplicando los

360º del círculo por la frecuencia relativa de cada modalidad. Este tipo de gráficas es muy

útil para comparar los resultados de una variable cualitativa en dos o más muestras.

El principio que va a regir las representaciones gráficas de caracteres cualitativos será la

proporcionalidad de las áreas de las figuras asignadas a cada modalidad respecto de su

frecuencia absoluta.

Diagrama de sectores.

Consiste en dividir un circulo en tantos sectores como modalidades presentes el carácter. El

área de cada sector deberá ser proporcional a la frecuencia de la modalidad a la que

representa. Esto se consigue haciendo que el ángulo de cada sector sea proporcional a cada

frecuencia.

Ejemplo:
DIAGRAMA DE SECTORES DE LA ACTIVIDAD 2ª.

Diagrama de barras.

Consiste en representar cada modalidad mediante un rectangulo cuya base será siempre la

misma y cuya área debera ser proporcional a su frecuencia absoluta. Esto se consigue

poniendo la altura proporcional a la frecuencia absoluta, ya que la base es igual para todos.

Ejemplo:

DIAGRAMA DE BARRAS DE LA ACTIVIDAD 2ª

REPRESENTACIONES GRÁFICAS DE CARACTERES CUANTITATIVOS NO

AGRUPADOS.
El principio de las representaciones gráficas de caracteres cuantitativos será la

proporcionalidad de las áreas o de las longitudes de las figuras representadas respecto de las

frecuencias absolutas o relativas de la modalidad a que represente.

Diagrama de barras.

Consiste en representar los valores de una variable en función de sus frecuencias absolutas

o relativas, por tanto dentro de un eje de coordenadas colocaremos los valores de la variable

en el eje de abcisas y la frecuencia absoluta o relativa en el eje de abcisas. La

representación consiste en levantar alturas para cada valor de la variable iguales a su

frecuencia.

Ejemplo:

DIAGRAMA DE BARRAS DE LA 1ª ACTIVIDAD

Polígono de frecuencias.

Se obtiene a partir del diagrama de barras uniendo mediante una linea poligonal las diversas

alturas de las barras obtenidas.

Ejemplo:
POLIGONO DE FRECUENCIAS DE LA 1ª ACTIVIDAD

Curva de distribución.

Se llama función de distribución a la función que asocia a cada valor real la proporción de

individuos de la población que presenta valores menores o iguales al valor considerado. Se

representa F(x).

La representación gráfica de F(x) es la curva de distribución. En el eje de abcisas se

representan los valores de la variable y en ordenadas las frecuencias.

Ejemplo:

CURVA DE DISTRIBUCIÓN DE LA 1ª ACTIVIDAD


REPRESENTACIONES GRÁFICAS DE DISTRIBUCIONES AGRUPADAS.

Histograma de frecuencias.

Esta representación consiste en una serie de rectangulos yuxtapuestos en el que las áreas de

cada uno de ellos son proporcionales a la frecuencia absoluta o relativa de las modalidades

a que representa. Las bases de los rectángulos serán las amplitudes de los intervalos, pero la

altura dependiendo de si todas las amplitudes son iguales o no serán las frecuencias o las

densidades de frecuencias.

Ejemplo:

HISTOGRAMA DE FRECUENCIAS DE LA 3ª ACTIVIDAD

En este caso estamos ante una distrubución de frecuencias agrupada en la que como ya

hicimos en la construcción de la tabla estadística vamos a considerar intervalos de la misma

amplitud, por lo que vamos a utilizar como altura de los rectángulos la frecuencias de cada

intervalo.

Polígono de frecuencias.
Se obtiene a partir del histograma de frecuencias uniendo mediante una poligonal la alturas

de cada una de las marcas de clase de los intervalos considerados.

Ejemplo:

POLIGONO DE FRECUENCIAS DE LA 3ª ACTIVIDAD

Das könnte Ihnen auch gefallen