Sie sind auf Seite 1von 8

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)

UNIDAD 3

APOYO ESTADSTICO
El punto de arranque de toda propuesta de investigacin se ubica en la identificacin y seleccin
del problema, en estos momentos debe estar presente la Estadstica, no como clculo de estadsticos, sino como garanta para poder establecer relaciones entre las caractersticas que se analizan; ello se lleva a cabo mediante diversos modelos estadsticos, y a partir de ellos se busca si
existe alguno que permita la resolucin del problema o bien, si se pudieran aplicar varios, seleccionar aqul el ms adecuado en funcin de criterios fijados.
VALOR DE LA ESTADSTICA
Qu es la estadstica?

Por qu estudiar estadstica?

Es el arte de realizar inferencias y sacar conclusiones a partir de datos imperfectos. Los


datos son generalmente imperfectos en el sentido que an cuando posean informacin til
no cuentan la historia completa. Es necesario
contar con mtodos que permitan extraer informacin a partir de los datos observados para comprender mejor las situaciones que los
mismos representan.

Porque los datos estadsticos y las conclusiones obtenidas aplicando metodologa estadstica ejercen una profunda influencia en casi
todos los campos de la actividad humana. Este
crecimiento, probablemente relacionado con el
inters por aumentar la credibilidad y confiabilidad de las investigaciones, no garantiza que
en todos los casos la metodologa estadstica
haya sido correctamente utilizada, o peor an,
que sea vlida.

Algunas tcnicas de anlisis de datos son sorprendentemente simples de aprender y usar


ms all del hecho que la teora matemtica
que las sustentan, puede ser muy compleja.
Todos, tienen problemas al enfrentarnos con
listados de datos. Existen muchos mtodos estadsticos cuyo propsito es ayudar a poner de
manifiesto las caractersticas sobresalientes e
interesantes de esos datos que pueden ser usados en casi todas las reas del conocimiento.
Los mtodos estadsticos pueden y deberan
ser usados en todas las etapas de una investigacin, desde el comienzo hasta el final. Existe
el convencimiento de que la estadstica trata
con el anlisis de datos (quizs porque esta
es la contribucin ms visible de la estadstica), pero este punto de vista excluye aspectos
vitales relacionados con el diseo de las investigaciones. Es importante tomar conciencia que la eleccin del mtodo de anlisis para
un problema, se basa tanto en el tipo de datos
disponibles como en la forma en que fueron
recolectados.

Por qu debe preocupar la aplicacin incorrecta de mtodos estadsticos en un trabajo


cientfico o en un informe tcnico?
+
+

Porque las conclusiones pueden ser incorrectas.


Porque no todos los lectores estn en condiciones de detectar el error, y esto genera
un importante ruido en la bibliografa
cientfica (aunque este argumento tiende a
sobredimensionar la importancia de una
publicacin, existe considerable evidencia
que los lectores sin formacin metodolgica tienden a aceptar como vlidas las conclusiones de los trabajos publicados, en especial si se encuentran publicados en revistas prestigiosas).

El estudio de la Estadstica y el modo de pensamiento que se genera a partir del mismo, capacita a la persona para evaluar objetiva y
efectivamente si la informacin que recibe (va
tablas, grficos, porcentajes, tasas, etc.) es relevante y adecuada. Por supuesto, la interpretacin de cualquier problema requiere, no slo
1

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 3

de conocimientos metodolgicos sino tambin,


de un profundo conocimiento del tema.
An cuando una persona no est interesada en
especializarse en estadstica, un entrenamiento bsico en el tema permite una mejor comprensin de la informacin cuantitativa.
reas de la estadstica
I. Diseo. Planeamiento y desarrollo de investigaciones.
Es una actividad crucial. Consiste en definir
como se desarrollar la investigacin para dar
respuesta a las preguntas que motivaron la
misma. La recoleccin de los datos requiere en
general de un gran esfuerzo, por lo que, dedicar especial cuidado a la etapa de planificacin
de la investigacin ahorra trabajo en las siguientes etapas. Un estudio bien diseado resulta simple de analizar y las conclusiones suelen ser obvias. Un diseo pobre, o con datos
recolectados o registrados de manera inapropiada puede ser incapaz de dar respuesta a las
preguntas que motivaron la investigacin, ms
all de lo sofisticado que sea el anlisis estadstico.
An en los casos en que se estudian datos ya
registrados, en que se restringe a la informacin existente, los principios del buen diseo,
pueden ser tiles para ayudar a seleccionar un
conjunto razonable de datos que est relacionado con el problema de inters.

(slo son rpidas), hacen aquello para lo que


estn programadas y actan sobre los datos
que les ofrecemos. Datos errneos o inesperados sern procesados de modo inapropiado y
ni usted, ni la computadora se darn cuenta a
menos que realice previamente un anlisis exploratorio de los datos.
III. Inferencia. Hace referencia a un conjunto de mtodos que permiten hacer predicciones o generalizaciones acerca de caractersticas de una poblacin en base a la informacin
de una muestra de la poblacin (informacin
parcial).
Los mtodos de la inferencia permiten proponer el valor de una cantidad desconocida (estimacin) o decidir entre dos teoras contrapuestas, cul de ellas explica mejor los datos
observados (test de hiptesis).
El fin ltimo de cualquier estudio es aprender
sobre las poblaciones. Pero es usualmente necesario, y ms prctico, estudiar solo una
muestra de cada una de las poblaciones.
+
+

Poblacin total de sujetos o unidades


de anlisis de inters en el estudio
Muestra cualquier subconjunto de los
sujetos o unidades de anlisis de la poblacin, en el cual se recolectarn los datos

Se usa una muestra para conocer o estimar caractersticas de la poblacin, y se denomina:


+

Parmetro una medida resumen calculada sobre la poblacin


Estadstico una medida resumen calculada sobre la muestra

II. Descripcin. Resumen y exploracin de


datos.

Los mtodos de la estadstica descriptiva o


anlisis exploratorio de datos ayudan a
presentar los datos de modo tal que sobresalga
su estructura. Hay varias formas simples e interesantes de organizar los datos en grficos
que permiten detectar tanto las caractersticas
sobresalientes como las caractersticas inesperadas. El otro modo de describir los datos es
resumirlos en uno o dos nmeros que pretenden caracterizar el conjunto con la menor distorsin o prdida de informacin posible.

La calidad de la estimacin puede ser muy variada, y generalmente las estimaciones estadsticas son errneas, en el sentido que no son
perfectamente exactas. La ventaja de los mtodos estadsticos es que aplicados sobre datos
obtenidos a partir de muestras aleatorias permiten cuantificar el error que podemos cometer en nuestra estimacin o calcular la probabilidad de cometer un error al tomar una decisin en un test de hiptesis.

Explorar los datos, debe ser la primera etapa


de todo anlisis de datos. Por qu no analizarlos directamente? En primer lugar porque
las computadoras no son demasiado hbiles

Finalmente, cuando existen datos para toda la


poblacin (censo) no hay necesidad de usar
mtodos de estadstica inferencial, ya que es
posible calcular exactamente los parmetros
2

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 3

de inters. En el censo poblacional, por ejemplo, se registra el sexo de todas las personas
censadas, que son prcticamente toda la poblacin, as que es posible conocer exactamente la proporcin de habitantes de los dos sexos.
Poblacin y muestra
Al conjunto de individuos objetivo del anlisis
se le denomina poblacin. Una muestra es
una parte de la poblacin. Cuando se trabaja con una muestra las conclusiones que se
obtienen deben restringirse, inicialmente, a sta. Extraer conclusiones ms generales, aplicables a toda la poblacin, slo puede hacerse
de una manera limitada, siendo necesario entre otras cosas que la muestra sea representativa y que la generalizacin de las conclusiones
se haga de una forma prudente y rigurosa. Las
tcnicas de la estadstica inferencial facilitan esa generalizacin desde la muestra a la
poblacin.
Las tcnicas descriptivas se pueden aplicar a
toda la poblacin, si esta se conoce, o a una
muestra. En el caso de disponer nicamente
de informacin muestral se debern aplicar
las tcnicas de la estadstica inferencial si se
quieren generalizar las conclusiones obtenidas.
El trabajo con muestras es usual. Uno de los
ejemplos ms conocidos para justificar el uso
de las muestras se encuentra en el terreno del
control de calidad. Una empresa dedicada a la
produccin de bombillas, las habr diseado
garantizando un tiempo de vida determinado.
Antes de servir su producto, la empresa desear comprobar la fiabilidad real de su oferta
realizando algn tipo de prueba, pero obviamente esto no lo podr hacer con toda la produccin, puesto que la destruira. Una muestra
representativa permitir a la empresa comprobar el tiempo de duracin real de sus bombillas. Ejemplos de situaciones similares no
son difciles de encontrar. Piense, por ejemplo,
en las empresas de auditora contable cuando
acceden a la informacin de una empresa. Si la
empresa auditora se viera obligada a seguir
cada una de los procesos de la empresa (desde
el primer movimiento contable al archivo de la
ltima factura) se vera metida en una labor
inabordable. La seleccin, al azar, de una

muestra de algunos movimientos contables


puede ser suficiente para verificar la correccin de la toda la gestin.
La necesidad de trabajar con muestras responde en muchas ocasiones a un ahorro en
los costes de obtencin de la informacin. Si puede obtenerse informacin esencial
y generalizable a partir de una muestra no ser
preciso acceder a toda la poblacin.
En ocasiones, el recurrir a las muestras no
obedece a una cuestin de costes, sino a la
imposibilidad de acceder a todas las observaciones. Esta situacin es frecuente en
economa cuando se recoge la evolucin temporal del valor de una variable. Algunos modelos econmicos consideran que, en un momento del tiempo, la poblacin de inters son todos los valores posibles que puede tomar una
observacin. Por ejemplo, imagine que est siguiendo la evolucin diaria del precio de una
accin en un mercado burstil a lo largo de un
ao. Cada da observar el precio de la accin a
la hora del cierre de la sesin de bolsa, de manera que si el mercado abre durante doscientos das, dispondr de doscientos precios. Respecto al ao, ese conjunto de doscientas observaciones, se considera una poblacin o una
muestra del precio de la accin? Se dispone de
todos los precios de cierre observados a lo largo del ao, pero no de todos los precios que ha
tomado la accin. En un da concreto, el precio
de la accin puede tomar distintos valores y es
hasta cierto punto una cuestin de azar el que
a la hora del cierre se observe un precio determinado. Las doscientas observaciones pueden entenderse como una muestra de todos los
precios que puede haber tomado la accin (que
definiran la poblacin). En este caso, los posibles valores de una variable en un momento
del tiempo definiran la poblacin, el valor observado se considerara una realizacin muestral.
El empleo de informacin muestral obedece a
veces a la imposibilidad de observar toda la
poblacin.
Seleccin de la muestra
En este punto el inters se centra en quines
van a ser medidos, es decir, los objetos de estudio. Lo primero que hay que definir es la
3

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 3

unidad de anlisis (personas, organizaciones,


rodales, plantas, etc.) Quines van a ser medidos, dependen de precisar claramente el problema a investigar y los objetivos de la investigacin.
Por esa va se llega a definir o delimitar una
poblacin, de la que normalmente se extrae
una muestra, o un subgrupo de sta. La poblacin debe caracterizarse claramente conforme
a los objetivos del estudio.
Bsicamente las muestras se dividen en probabilsticas y no probabilsticas, es decir que
los individuos de la poblacin tengan o no la
misma probabilidad de ser escogidos. Las
muestras no probabilsticas dependen de causas relacionadas con las caractersticas del investigador o del que hace la muestra, por lo
que tienden a estar sesgadas. Sin embargo, su
uso depender de los objetivos de estudio, del
esquema de investigacin y de la contribucin
que se piensa hacer con dicho estudio.
La muestra probabilstica posee como ventaja
la posibilidad de medir el tamao de error en
las predicciones que les ataen. En ella hay
que determinar el tamao y seleccionar los individuos.
Cul es el nmero mnimo de anlisis de individuos, que se necesita para una muestra con
un error estndar supngase menor al 1%
(P<.01), dado que la poblacin es de aproximadamente tantos elementos? La frmula para determinar el tamao de n es:

s2
var ianza muestral

2
V
var ianza poblacional

Es posible tambin estratificar la muestra, es


decir, cuando no basta que los elementos de la
muestra sean escogidos probabilsticamente,
sino que adems es necesario categorizarlos,
por lo relevante que significa para el estudio.
La estratificacin aumenta la precisin del
procedimiento e implica el uso deliberado de
diferentes tamaos de muestra para cada estrato, a fin de reducir la varianza de cada grupo en la media muestral. Por lo tanto, la frmula para determinar nh (muestra por estrato) es:

nh Nh * fh
nh poblacin estrato * factor cons tan te
Una vez definida la muestra, se procede a seleccionar los individuos siempre al azar, lo que
puede hacerse por el uso de una tmbola, nmeros aleatorios, o seleccin sistemtica.
Las muestras no probabilsticas difieren del
esquema presentado porque sugieren un procedimiento de seleccin informal, y un poco
arbitrario. La muestra dirigida selecciona sujetos tpicos con la esperanza que sean sujetos
representativos. En este caso, son mtodos de
seleccin: la muestra de sujetos voluntarios,
expertos, sujetos tipo y muestra por cuota entre otros.
Recoleccin de los datos
Recolectar los datos implica tres actividades
estrechamente vinculadas entre s:
+
+
+

La seleccin de un instrumento de medicin, que debe ser vlido y confiable.


La aplicacin de ese instrumento de medicin.
La preparacin de las mediciones obtenidas para su anlisis.

La confiabilidad se refiere al grado en que su


aplicacin repetida al mismo sujeto u objeto,
produce iguales resultados, la que se determina a travs de distintas tcnicas.
La validez, en trminos generales, se refiere
al grado en que un instrumento realmente mide la variable que pretende medir.
Entre los factores que pueden afectar la confiabilidad y validez de un instrumento se cuentan: la improvisacin, la utilizacin de instrumentos aplicados en otros contextos sin la debida validacin y las condiciones en que se
aplica el instrumento.
Por ejemplo, en la investigacin social, se dispone de los siguientes instrumentos, entre
otros: escalas de medicin de actitudes como
la Likert, de Diferencial semntico o los escalogramas de Guttman; a estos se suma el cuestionario, el anlisis de contenido, la observacin, pruebas estandarizadas, las sesiones en
profundidad y sus combinaciones.
4

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 3

Los cuestionarios son un conjunto de preguntas respecto a una o ms variables. Debiendo ser las preguntas claras y comprensibles para los respondientes; no deben incomodar al respondiente; deben referirse a un slo
aspecto o relacin lgica; no deben inducir las
respuestas; no deben respaldarse en instituciones, ideas socialmente aceptadas, ni en evidencia comprobada; deben ser adaptadas a las
caractersticas del respondiente. De la misma
manera, no se recomienda comenzar con preguntas difciles de responder o muy directas.
El anlisis de contenido se efecta por medio de la codificacin, o la transformacin de
las caractersticas de un mensaje en unidades
que permitan su descripcin y anlisis preciso.
Para poder codificar, es necesario definir el
universo a analizar, las unidades de anlisis y
las categoras de anlisis. El universo podra

ser un discurso o la obra completa de un autor,


las unidades: las palabras, el tema, los personajes, etc. y las categoras: son los niveles donde son caracterizadas las unidades de anlisis.
La observacin consiste en el registro sistemtico, vlido y confiable de comportamientos
o conducta manifiesta. Como mtodo es muy
similar al anlisis de contenido.
Una variante de este ltimo mtodo es la sesin en profundidad, donde se rene una o
varias veces a un grupo de personas y se trabaja con ste con relacin a las variables de la investigacin.
Todos estos mtodos requieren de un esfuerzo
adicional cual es la codificacin o clasificacin
mediante smbolos para la facilitacin del anlisis. Esta suele utilizarse a travs de numeraciones, o acepcin/exclusin.

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 3

Material Complementario

ANLISIS DE LOS DATOS


Una vez que los datos han sido recolectados y
transferidos a sistemas que faciliten su anlisis, se procede mediante el uso de estadsticas
a su interpretacin.

Por ejemplo, los resultados de una preprueba


con una postprueba. Se pueden comparar
transformando ambos resultados a puntuaciones z la que pasa a ser una escala comn.

Los anlisis que se vayan a practicar a los datos dependen de tres factores:

Razones y Tasas. Razn es la relacin entre


dos categoras, en cambio tasa es la relacin
entre el nmero de casos, frecuencias o eventos de una categora y el nmero total de observaciones multiplicada generalmente por
100 1.000.

+
+
+

El nivel de medicin de las variables


La manera como se hayan formulado las
hiptesis
El inters del investigador

Los principales anlisis que pueden efectuarse


son:
Estadsticas Descriptivas. La tarea de describir los valores o puntuaciones obtenidos para cada variable, se logra por medio de una
distribucin de frecuencias, ya sea relativa o
acumulada (que tambin pueden expresarse
en porcentaje). Normalmente se representan a
travs de histogramas o grficos de otro tipo.
Otra forma de analizar estos valores es mediante las medidas de tendencia central, que
son la moda, la mediana y la media, o las medidas de variabilidad como el rango, la desviacin estndar y la varianza. A stas se suma de
la misma forma la medida de asimetra y la
kurtosis.
Puntuaciones Z. Son transformaciones
que se pueden hacer a los valores o puntuaciones obtenidas, con el propsito de analizar su
distancia respecto a la media, en unidades de
desviacin estndar, es decir, la direccin y
grado en que un valor obtenido se aleja de la
media.

Estadstica Inferencial. Frecuentemente lo


que se busca es generalizar los resultados obtenidos de la muestra a la poblacin. Es decir,
la transformacin de los estadgrafos obtenidos en parmetros poblacionales, en funcin
de la inferencia.
Para esta inferencia es preciso ajustar los planteamientos a una magnitud de certeza: el nivel de significancia, que no es otra cosa que
ese valor de certeza respecto a no equivocarse
y que fija el investigador a priori. Por ejemplo,
el nivel de significancia del .01, implica que el
investigador tiene un 99% en su favor para generalizar sin temor los resultados y un 1% en
contra.
En este punto cobra importancia el intervalo
de confianza, ya que los estadgrafos de la
muestra son valores aproximados a los parmetros poblacionales, es mejor buscar un rango en el que se encuentren los valores paramtricos. Es decir, un nivel de confianza o la probabilidad definida de que un parmetro se va a
ubicar en un determinado intervalo.

El estandarizar los valores permite comparar


puntuaciones de dos distribuciones diferentes.

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 3

PRUEBAS PARAMTRICAS
El anlisis paramtrico supone:

y = a + bx

Prueba t Student. Es una prueba para evaluar si dos grupos difieren entre s de manera
significativa respecto a sus medias. La comparacin se efecta sobre una variable. Si hay diferentes variables, se efectan varias pruebas.

+
+

Que la distribucin poblacional de la variable dependiente es normal.


Que el nivel de medicin de la variable dependiente es por intervalos o razn.
Cuando dos o ms poblaciones son estudiadas, tienen una varianza homognea, o
sea, que tienen una dispersin similar en
sus distribuciones.

Las pruebas estadsticas ms utilizadas son:


Coeficiente de correlacin de Pearson
r. Prueba para analizar la relacin entre dos
variables medidas en un nivel por intervalos o
de razn. Involucra dos variables y no considera a una independiente y a otra dependiente,
ya que no evala causalidad. El coeficiente se
calcula a partir de las puntuaciones obtenidas
en una muestra en dos variables.
Junto a esta prueba se ubica el coeficiente de
determinacin (r2) que es el encargado de informar cunto de la correlacin se explica por
la funcin escogida.
Regresin lineal. La regresin lineal es un
modelo matemtico para estimar el efecto de
una variable sobre otra. Est asociada al coeficiente de Pearson. Involucra dos variables
considerando a una independiente y dependiente a la otra, pero para hacerlo debe tenerse
un slido sustento terico.

Prueba de contraste de la diferencia de


proporciones. Es una prueba para analizar
si dos proporciones difieren significativamente
entre s. La comparacin se efecta sobre una
variable. Si hay varias, se efecta una prueba
de diferencia de proporciones por variable.
Anlisis de varianza unidireccional
(ANOVA Oneway). Prueba para analizar si
ms de dos grupos difieren significativamente
entre s en cuanto a sus medias y varianzas.
Corresponde al enfoque multivariado de la
prueba t Student. Utiliza una variable independiente y una dependiente
Anlisis de varianza factorial (ANOVA).
Prueba para evaluar el efecto de dos o ms variables independientes sobre una variable dependiente. Incluye dos o ms variables independientes y una dependiente.
Anlisis de covarianza (ANCOVA). Prueba que analiza la relacin entre una variable
dependiente y dos o ms variables independientes, removiendo o controlando el efecto de
al menos una de ellas.

PRUEBAS NO PARAMTRICAS
El anlisis no paramtrico considera:
+

La mayora no requiere de supuestos previos acerca de la forma de la distribucin


poblacional. Aceptan distribuciones no
normales.
Las variables no necesariamente deben estar medidas en un nivel de intervalos o de
razn, pueden analizarse datos nominales
u ordinales.

Las pruebas estadsticas ms usadas son:


Prueba de Chi cuadrada 2. Prueba para
evaluar hiptesis acerca de la relacin entre
dos variables categricas. Involucra dos varia-

bles donde no se consideran relaciones causales.


Coeficientes de correlacin e independencia para tabulaciones cruzadas.
Adems de 2 existen otros coeficientes para
evaluar si las variables incluidas en la tabla de
contingencia o tabulacin cruzada estn correlacionadas. Estas tablas a su vez son tiles para describir conjuntamente a dos o ms variables.
Coeficientes de correlacin por rangos
ordenados de Spearman y Kendall. Los
coeficientes de Spearman (rs) y de Kendall
(t), son medidas de correlacin para variables
7

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 3

en un nivel de medicin ordinal, de tal modo


que los individuos u objetos de la muestra

pueden ordenarse por jerarquas.

ANLISIS MULTIVARIADOS
Estos mtodos son aquellos en donde se analiza la relacin entre varias variables independientes y al menos una dependiente. Son mtodos ms complejos que requieren del uso de
software especfico.
Regresin mltiple. Mtodo para analizar
el efecto de dos o ms variables independientes sobre una dependiente.
y = a + b1x1 + b2x2 + b3x3 +... bnxn
Anlisis lineal de patrones. Tcnica para
representar interrelaciones entre variables a
partir de regresiones. Analiza la magnitud de
la influencia de unas variables sobre otras, influencia directa e indirecta. Se trata de un modelo causal.

Anlisis de factores. Mtodo para determinar el nmero y naturaleza de un grupo de


constructos (atributos que explican un fenmeno) que estn subyacentes en un conjunto
de mediciones. En este anlisis se generan variables artificiales (factores) que representan
constructos. Los factores son obtenidos de las
variables originales y deben ser interpretados
de acuerdo a stas.
Anlisis multivariado de varianza (MANOVA). Modelo para analizar la relacin entre dos o ms variables independientes y dos o
ms variables dependientes.

Esta obra est bajo la licencia Creative Commons Reconocimiento- No comercial -Sin obras Derivadas 4.0 Licencia
Internacional. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by-nc-nd/4.0/

Das könnte Ihnen auch gefallen