Sie sind auf Seite 1von 66

VI

CARRERA: CIENCIA TECNOLOGIA Y AMBIENTE CICLO

CONTENIDO TEMATICO
BIOMETRIA

INDICE DE CONTENIDO

INTRODUCCIN
UNIDAD 1. BIOMETRIA
CAPITULO 1: LA BIOESTADSTICA EN LA INVESTIGACIN PECUARIA
HISTORIA DE LA BIOESTADSTICA
USOS E IMPORTANCIA DE LA BIOMETRA EN EL SECTOR AGROPECUARIO ...

MTODO CIENTFICO
CONCEPTOS
INVESTIGACIN CIENTFICA
CAPITULO 2: ESTADSTICA DESCRIPTIVA
MEDIDAS DE TENDENCIA CENTRAL
DISTRIBUCIN DE FRECUENCIAS
GRFICAS
PRINCIPIOS DE PROBABILIDAD
MUESTREO
CAPITULO 3: INFERENCIA ESTADSTICA
INFERENCIA PUNTUAL
PRUEBAS DE HIPTESIS
COMPARACIN DE DOS MEDIAS MUESTRALES
ANLISIS DE COVARIANZA
UNIDAD 2. DISEO DE EXPERIMENTOS
CAPITULO 4: DISEO DE EXPERIMENTOS
EL EXPERIMENTO Y SUS ELEMENTOS
ORIENTACIONES GENERALES EN LA EXPERIMENTACION AGRICOLA
DISEO EXPERIMENTAL
MODELO ESTADSTICO

TRANSFORMACIN DE DATOS
CAPITULO 5: CLASES DE DISEOS EXPERIMENTALES
DISEO COMPLETAMENTE AL AZAR
DISEO EN BLOQUES COMPLETOS AL AZAR
EXPERIMENTOS FACTORIALES
OTRAS CLASES DE DISEOS EXPERIMENTALES
BSQUEDA DE UNIDADES PERDIDAS (MTODO YATES)
CAPITULO 6: ANLISIS ESTADSTICO
USOS DE LAS COMPARACIONES MLTIPLES DE MEDIAS

PRUEBA DE TUKEY
PRUEBA DE RANGO MLTIPLE DE DUNCAN
ANLISIS DE REGRESIN Y CORRELACIN
ANLISIS DE VARIANZA PARA LA REGRESIN
FUENTES BIBLIOGRAFICAS

INTRODUCCIN
En el mundo se est tomando conciencia que todas las producciones, sin importar su
naturaleza y en especial las de principios biolgicos o ambientales deben ser analizadas
numricamente, no solo para determinar el estado de desarrollo, sino las proyecciones o
correcciones que se puedan hacer tanto para lograr beneficios econmicos como
sociales o ambientales. La bioestadstica como rama de la estadstica, es una
herramienta que se puede usar de manera sencilla sin necesidad de profundizar en ella,
ni de dedicar toda una carrera profesional al estudio de esta, no queriendo decir que no
se deben conocer algunos principios y procedimientos bsicos.
Por lo anterior, las profesiones relacionadas con el campo como Zootecnistas, Mdicos
Veterinarios, Ingenieros Agrnomos, Ingenieros Agrcolas, Forestales, Ambientales y
muchas otras, para cumplir satisfactoriamente con las tareas profesionales, implica el
uso de mtodos estadsticos que adems de hacerlo ms eficiente, le facilitan el trabajo.
La mayor ventaja que puede tener un profesional del campo que estudie y maneje la
estadstica como herramienta para el anlisis de variables biolgicas es que lo hace
nico en el entendimiento de la relacin que tiene estas dos ciencias y de la forma de
explicarse una con la otra.
Este modulo, pretende de forma resumida y con algunos ejemplos aplicados presentar a
los profesionales del campo la informacin que ensea y facilita el uso de la
bioestadstica como herramienta til. Es preciso aclarar que el modulo trata de dejar el
componente matemtico complicado de un lado y nicamente presenta los modelos
listos para reemplazar y hacer el clculo que interesa al profesional del campo; sin
profundizar en el origen de estos modelos. La estructura del mdulo se divide en dos
unidades; la primera se titula Bioestadstica y la segunda Diseo Experimental.
La unidad de Bioestadstica comprende desde los conceptos fundamentales, el manejo y
presentacin de datos, principios de probabilidades, muestreo e inferencia estadstica.
Todos los captulos anteriormente mencionados son de gran relevancia y su importancia
aumenta cuando se empieza a entender su uso, tal es el caso de las probabilidades que
son de gran ayuda para los procesos de mejoramiento gentico.
La segunda unidad de Diseo Experimental, muestra en sus captulos los diseos ms
usados en los procesos de investigacin biolgica y da las pautas para el anlisis de
datos. Conocimiento destacado en las personas que se dedican a los procesos
investigativos, tanto as, que para entender la mayora de la literatura cientfica es
imprescindible haberlo estudiado. Es preciso resaltar que la importancia de la
Bioestadstica o Biometra depende del uso y buena aplicacin que se le de a los
conceptos matemticos que implican, es as como, cuando se cometen equivocaciones
en la aplicacin, se pretende justificar que el error de los resultados dependen de la
ciencia como tal y no por la persona que la aplica; diciendo que la estadstica es
mentirosa.

Nombre de la Unidad
Introduccin

Intencionalidades Formativas

Denominacin de captulo 1
Denominacin de Leccin 1
Denominacin de Leccin 2

BIOMETRIA
La unidad de Bioestadstica comprende
desde los conceptos fundamentales, el
manejo y presentacin de datos, principios de
probabilidades,
muestreo
e
inferencia
estadstica. Todos los captulos anteriormente
mencionados son de gran relevancia y su
importancia aumenta cuando se empieza a
entender su uso, tal es el caso de las
probabilidades que son de gran ayuda para
los procesos de mejoramiento gentico..
1. Dar a conocer la historia, usos y conceptos
de la bioestadstica.
2. Ensear las principales formas de tomar,
resumir y presentar un conjunto de datos en
forma numrica o grfica.
3. Estudiar
los
principios
bsicos
de
probabilidades y la aplicabilidad de en reas
relacionados con variables biolgicas o
ambientales.
4. Estudiar las principales distribuciones de
probabilidades y el uso dentro de la
inferencia.
La Bioestadstica en la investigacin
pecuaria
Historia de la bioestadstica
usos

e importancia de la biometra en el

UNIDAD 1. BIOMETRIA
La Bioestadstica en la investigacin pecuaria
Historia de la bioestadstica
La estadstica que muchos creen como algo nuevo, es tan antigua como la misma
humanidad, ya que hay vestigios de su inicio antes de Cristo, como en China donde el
emperador Yao (2.238 a.c) dispuso la realizacin de un censo en su imperio. Algo similar
ocurri en la poca del Rey Herodes, relacionado con un empadronamiento cuando
naci Cristo.
La Estadstica como disciplina tuvo su inicio en Alemania a mediados del siglo XVII, en el
reinado de Godofredo de Achenwall (1719-1772), cuando utiliz la palabra Estadstica y
la separ de la Sociologa.
En Amrica precolombina se haba desarrollado notablemente la estadstica,
especialmente en Mxico y Per. La estadstica del imperio de los incas era tan
completa como la actual, aunque ese pueblo no usaba la escritura, empleaba para sus
cmputos un sistema de cordones de variados colores, armados y combinados para
conservar en ellos las cuentas extensas y complicadas; conocan as la poblacin
distribuida por localidades, sexos y condicin civil, averiguaban el nmero de
nacimientos y muertes, conocan el nmero de hombre aptos para la guerra y la cantidad
de provisiones con que contaban. En general conocan muchos aspectos sobre su
Imperio (Surez 1999).
La palabra Estadstica para algunos proviene de la palabra Status, cuyo significado es
Estado. Para otros se deriva del vocablo Griego Statera que significa balanza, o quiz la
ms confiable, proviene de la palabra Alemana Stara que significa Estado, encargado de
hacer Estadstica. (Martnez 2005).
En los tiempos modernos, donde la Estadstica tiene funciones importantes dentro de
otras ramas, no slo en lo social, en los censos o en la organizacin de cualquier
Estado, si no que hace parte fundamental de los procesos de investigacin, se ha
denominado la BIOESTADISTICA como la ciencia encargada de
analizar
datos
relacionados directamente con variables biolgicas, su importancia, influencia,
relacin o diferencia, etc y que permiten conocer o tomar decisiones acerca del
comportamiento de los seres vivos bajo condiciones estipuladas.
Charles Darwin (1809-1882), siendo un bilogo, dio gran importancia a la estadstica
dentro de la formulacin de sus teoras. Kart Pearson (1857-1936) dedic gran parte de
su vida al estudio de la estadstica y fund la biometra, impulsando as el uso de esta
herramienta. Fisher (1980-1962) inici la relacin entre los mtodos estadsticos y la
agricultura, gentica y biologa.

De esta forma la BIOESTADSTICA o BIOMETRA (medicin de variables biolgicas) se


ha vuelto una herramienta indispensable para ramas tan importantes como la gentica,
nutricin, alimentacin y muchas otras que son componentes de profesiones que
trabajan con seres vivos y factores que los afecten. Es as como en todos los procesos
de educacin donde se tenga como prioridad el estudio de variables biolgicas, se hace
indiscutible el uso de mtodos estadsticos que aportan al conocimiento de los
organismos vivos.
usos e importancia de la biometra en el sector agropecuario
La bioestadstica es una herramienta que le sirve a todo profesional que tenga relacin
con los seres vivos, no solo en el campo investigativo, sino tambin de produccin
animal, anlisis ambientales, poblaciones humanas, producciones agrcolas, etc. Con el
fin ampliar el conocimiento sobre aspectos que permitan de una u otra forma tomar
decisiones sobre los que interesa al desarrollo de la humanidad y del planeta.
Es frecuente escuchar el argumento que la estadstica es un sofisma de distraccin o
que es mentirosa. En realidad, como se vio desde el principio de la humanidad, se ha
utilizado la estadstica y hoy en da una de sus denominaciones la bioestadstica, la
cual no es el proceso o el mtodo el que dice mentiras, si no el mismo analista el que
cambia los conceptos y hace mal uso de la herramienta, acomodndola y
argumentndola a su beneficio. En pocas palabras, estos argumentos no se deben a la
ciencia como tal, sino al hombre que no sabe aplicar el mtodo preciso y mucho menos
interpretarlo para dar suficiente importancia y concordancia con los que suceden en la
naturaleza.
Es as como se debe tener mucho cuidado en el uso de esta herramienta, la cual es
base para el entendimiento de procesos biolgicos y que si es usada correctamente se
vuelve indispensable para formular y comprobar hiptesis, teoras, modelos e incluso
leyes, que conlleven a ampliar otras ciencias como la nutricin, alimentacin, gentica,
fisiologa, ecologa, geologa, botnica, y muchas otras ms relacionadas con la
naturaleza del hombre, los animales, las plantas, microorganismos y en general con el
medio ambiente.
Mtodo Cientfico
Permite recolectar las observaciones mediante registros que se ordenan, clasifican,
cuantifican y se interpretan mediante cuadros y/o grficas, permitiendo la depuracin de
datos en dos aspectos, en su presentacin clara y en su simplificacin, ya que facilita
manejar grandes cantidades de informacin presentadas de manera resumida, tarea que
realizamos a travs de la estadstica descriptiva, luego con la inferencia estadstica y
adems permite el anlisis y la bsqueda de relaciones que puedan existir entre ellas.
El proceso de elaboracin estadstica se puede dividir en seis fases: (Martnez, 2005)
1.

Planeamiento o preparacin.

2.

Recoleccin.

3.

Crtica y codificacin.

4.

Procesamiento.

5.

Anlisis e interpretacin.

6.

Publicacin.

En cuanto al planeamiento o preparacin, un proyecto o plan estadstico debe


contemplar los siguientes aspectos:
a.

El objeto de la investigacin

b.

La finalidad

c.

La fuente de informacin

d.

Los procedimientos

e.

El material

f.

El costo y financiacin.

Es importante tener en cuenta que todo procedimiento de investigacin debe acogerse a


los siguientes criterios:
Claridad. Toda investigacin en todos sus pormenores, debe ser clara y conocida por
todos los que en ella vayan a intervenir. La claridad est ligada directamente con la
comprensin. La estadstica en el periodo de investigacin, en el de elaboracin en la
presentacin y anlisis, debe ser entendida por todo el mundo: investigador(es),
lectores, quienes vayan a utilizar los resultados, etc.
Sencillez. En el proyecto en las instrucciones, en la finalidad, en los objetivos, en la
toma de datos, en los cuadros de exposicin, en los comentarios literarios de anlisis, en
las operaciones de clculo, en los grficos, en todo. La sencillez es un mtodo para
brindar claridad.
Utilidad. Toda estadstica que se inicie debe tener alguna aplicacin prctica de inters.
De otro modo nos hallaremos ante una acumulacin molesta de datos que perjudicarn
por muchos motivos, a la informacin realmente aprovechable.
Conceptos
ESTADSTICA. Es un campo del estudio relacionado con 1) el sistema o mtodo
utilizado para la recoleccin, organizacin, anlisis, descripcin y resumen de datos y 2)
la obtencin de inferencia acerca de un conjunto de datos cuando solo se observa una
parte de ellos.(Daniel, 1990 & Martnez, 2005.)

BIOESTADSTICA. Cuando los datos que se recopilan y analizan corresponden a


disciplinas que forman parte de las ciencias biolgicas, como la Veterinaria, Zootecnia,
Agronoma, Ecologa, etc. Se utiliza el trmino Bioestadstica para diferenciar a esta
aplicacin particular de herramientas y conceptos estadsticos. (Surez, 1999).
VARIABLE. Cuando se observa una caracterstica medible y esta toma valores distintos
entre individuos, lugares, condiciones de produccin o a travs del tiempo, se dice que
sta caracterstica es una variable. Esto explica que la caracterstica vara por algn
efecto y por tanto es lgico llamarla variable. Son ejemplos de esto, la altura de plantas
de maz en un cultivo (presentan diferentes alturas entre ellas por efectos diferentes), la
ganancia de peso de algunos animales (varan por raza, sexo, edad, lugar,
alimentacin), la cantidad de aportes nutricionales del suelo de una granja (vara por
efectos edficos, estructuras fsicas y composiciones qumicas del mismo).
Si analizamos o describimos una variable, caracterstica o atributo en forma
independiente, nos referimos a distribuciones univariantes, si relacionamos dos
Caractersticas entre s sera bivariante y si es el caso de relacionar ms de dos
caractersticas se dira que la distribucin es multivariante.
Las variables, dependiendo de los tipos de datos que la componen se puede clasificar
en variables cuantitativas y cualitativas, y a su vez las cuantitativas pueden ser discretas
o continuas.
Variables cuantitativas. Son las caractersticas mensurables y se describen
numricamente, tales como altura, peso, valor, produccin, ventas, pluviosidad, etc.
Variables cualitativas. Son las que se expresan mediante palabras por no ser
mensurables, pero si cuantificables, tales como raza, marca, posicin socioeconmica,
clima, etc.
Variable Discreta. Se refiere a aquellas que solo pueden tomar unos determinados
valores, siendo imposible que lleguen a tomar valores intermedios entre dos
consecutivos, es decir toma nicamente valores enteros: 1, 2, 3,, tal es el caso del
nmero de lechones por camada, cantidad de colonias de bacterias en un cultivos de
agar, nmero de peces muertos por contaminacin del agua, nmero de huevos viables
para incubar, etc.
Variable Continua. Se toman todos los valores infinitos posibles de un intervalo, es decir,
se admiten valores fraccionarios. Por ejemplo el peso de terneros al nacimiento, altura
alcanzada por plantas de sorgo, velocidad del viento, etc.
Variable aleatoria. Cada vez que se determina un dato en un individuo, planta, lote,
zona, etc., se dice que son el resultado de factores fortuitos y por tanto se ha tomado de
forma aleatoria. Los valores que resultan de los procesos de medicin suelen conocerse
como observaciones o simplemente como medidas. Todos los procesos investigativos en
variables biolgicas deben garantizar que las observaciones o mediciones que se hayan
tomado en individuos, zonas, lotes, plantas, etc., sean el producto de una seleccin
aleatoria.

Variable nominal. Se obtiene cuando se definen las categoras y se cuenta el nmero de


observaciones que quedan en cada una. Las variables nominales comprenden las
categoras como sexo (macho, hembra), color, raza, tamao
(grande, mediano, pequeo). Ninguna de las caractersticas anteriores es numrica por
naturaleza, sin embargo cuando se aplican ya sea en una poblacin o en una muestra,
es posible asignar a cada individuo una categora.
Variables jerrquicas. Constan de valores relativos asignados para denotar orden:
primero, segundo, tercero y as sucesivamente.
POBLACIN. Llamada tambin universo, se define como el mayor grupo de elementos
por los cuales se tiene un cierto inters en un momento dado. Las caractersticas
primordiales de una poblacin son: su naturaleza, su magnitud, el espacio y el tiempo.
Si se lleva a cabo una medicin de alguna variable sobre cada uno de los elementos de
una poblacin, se obtiene una poblacin de valores definida como el mayor grupo de
valores de una variable aleatoria, por los cuales se tiene un cierto inters en un
momento dado. (Daniel, 1990).
Las poblaciones pueden ser finitas o infinitas. Si una poblacin de valores consta de un
nmero fijo de estos valores, se dice que la poblacin es finita. Por otra parte si una
poblacin consta de una sucesin sin fin de valores, dicha poblacin es infinita. Por
ejemplo: si se desea hacer un estudio sobre la poblacin bovina de un pas, se sabe por
censo o registros, un nmero determinado de la poblacin y se convierte en una
poblacin finita. Por el contrario, si se desea estudiar la presencia de un hongo en las
mazorcas que se producen en un cultivo de maz, no se sabe el nmero determinado de
mazorcas producidas y por tanto es una poblacin infinita, o mejor an, si el estudio
pretende determinar la presencia de hongo en una bodega de granos, no se sabe
cuntos granos estn almacenados en la bodega.
MUESTRA. Una muestra puede definirse como una parte de una poblacin. La muestra
es un subconjunto de la poblacin. Cuando la poblacin es relativamente pequea, es
posible estudiar a todos los individuos que la integran, pero cuando la muestra
corresponde o representa a una poblacin grande o infinita, normalmente en estadstica,
esta se debe tomar al azar, ya que todos los individuos de la poblacin tienen la misma
oportunidad de conformar la muestra de estudio y el resultado de esta muestra en el
correspondiente estudio, representa el comportamiento de toda la poblacin. De no
cumplirse esto se tomara como una muestra sesgada y se denomina muestra no
probabilstica.
La muestra no probabilstica corresponde a la seleccin de unidades o elementos, segn
el criterio o conveniencia del investigador. En estos casos algunas unidades
Tienen mayor posibilidad que otras de ser seleccionadas; por tal razn no se puede
determinar la validez, ni la confiabilidad que merecen dichos resultados. Casi por lo
general, las unidades se seleccionan de forma caprichosa.

Al proceso de determinar el tamao y seleccin de una muestra, se le llama muestreo y


depende directamente de la naturaleza de la poblacin. Existen varios mtodos de
muestreo que permiten dar confiabilidad en los resultados de un estudio.
UNIDAD EXPERIMENTAL. Una unidad experimental es un individuo de los que
conforman una muestra o una poblacin, es decir, las muestras o las poblaciones se
componen de unidades experimentales. El conjunto de unidades experimentales es lo
que se simboliza estadsticamente como (N) si es una poblacin o (n) si es una muestra.
En la presentacin de muchas investigaciones, una de las preguntas comunes por los
auditores corresponde a cuntas unidades experimentales estudi?
Una unidad experimental puede estar compuesta por un individuo o por un grupo de
individuos, es decir; individuales o grupales. Las unidades experimentales individuales,
como su nombre los indica son aquellas que estn compuestas por cada uno de los
individuos de la muestra o de la poblacin. Las unidades experimentales grupales son
las que por facilidad de trabajo o conveniencia del estudio se trabajan en grupo. Por
ejemplo: en un estudio de incidencia y prevalencia de Influenza Equina, se toma como
unidad experimental cada uno de los equinos a los que se estn haciendo las pruebas,
entonces se estara hablando de unidades experimentales individuales. Mientras que en
un estudio para determinar la ganancia de peso de caracoles bajo ciertas dietas, para
facilitar el trabajo se pesan los caracoles en grupos de 10, lo cual cada grupo
corresponde a una unidad experimental grupal y los resultados se presentan para
grupos de 10 caracoles.
Esta ltima forma de definir las unidades experimentales puede provocar un error si los
individuos que la conforman no son lo suficientemente homogneos y causan diferencia
con otras unidades experimentales grupales.
HIPTESIS. Es resultado que se asume tentativamente para representar un robar.
Investigacin cientfica
No existe investigacin, proceso o trabajo encaminado a obtener informacin cuantitativa
en general, en la que la estadstica no tenga una aplicacin. La estadstica no puede ser
ignorada por ningn investigador, an cuando no tenga ocasin de emplear la
Estadstica Aplicada en todos sus detalles y ramificaciones. Los resultados de una
investigacin agrcola reflejan los efectos de tratamiento, de diseo, e incluso de factores
biolgicos, ambientales y de manejo que los afectan. Es una caracterstica comn en los
experimentos, en muy diversos campos de la investigacin, que los efectos de los
tratamientos experimentales varan de un ensayo a otro, cuando se repiten. Esta
variacin introduce ciertos grados de incertidumbres en cualquiera de las conclusiones
que se obtienen de los resultados.
La estadstica ha ayudado al investigador en proyectos muy variados en el campo de la
agricultura, tales como el ensayo de maquinarias para escardar, ciertos aspectos
econmicos en la electrificacin de granjas, comparacin de varios mtodos para
secado de semillas, determinacin de los efectos de las diferentes diferentes

velocidades de secado del maz para "palomitas", investigaciones en regado, estudio


del techado de fincas rurales, y en mtodos de cultivo. La Estadstica cuando se usa
adecuadamente, hace ms eficientes las investigaciones, es aconsejable que todos los
investigadores se familiaricen con las tcnicas y conceptos bsicos de esta ciencia tan
til. El papel de la estadstica en la investigacin es, entonces, funcionar como una
herramienta en el diseo de investigaciones, en el anlisis de datos, y en la extraccin
de conclusiones a partir de ellos. Escasamente podr preverse un papel mayor y ms
importante. De utilidad en las investigaciones, la Estadstica nicamente va precedida
por las Matemticas y el sentido comn, de los cuales se deriva.

Estadstica descriptiva
Medidas de tendencia central
En muchas ocasiones, si no son todas, no vemos obligados a representar un conjunto
o (poblacin) o un subconjunto de datos (muestra) con pocos valores que permitan dar
a conocer en forma resumida la descripcin de los mismos. Es as como se puede
hacer uso de las medidas descriptivas.
Las medidas descriptivas, son el resultado de clculos matemticos sencillos que
tienen como objetivo representar o describir en forma muy resumida un grupo de datos
que componen una variable. Dependiendo de los datos que se quieren representar;
estos toman el nombre de Parmetros si proviene de una poblacin o de
Estimadores si son originados por una muestra.

Medidas

Poblacin

Muestra

Parmetros

Estimadores

Caractersticas de las medidas descriptivas.


Las caractersticas de las medidas descriptivas estn en funcin de que le valor
obtenido cumpla con la funcin para lo cual fue calculado (Martnez, 2005).
Debe estar representada por un solo valor.

Debe ser objetiva y definida por una frmula algebraica, de tal manera que cualquiera
que sea la persona que trabaje con los datos, obtenga siempre el mismo valor.
Debe ser descriptiva de los datos en forma que su significancia sea fcil de entender.
No debe ser una abstraccin matemtica, que nicamente pueda ser entendida por
personas muy versadas en esta ciencia, ya que una de las funciones de la estadstica
es simplificar los datos y no hacerlos ms complejos.
Debe ser fcil de calcular.
Debe ser calculada con todos los elementos del grupo de datos.
Debe depender de todo el grupo de datos, de tal manera que si se altera uno de estos,
consecuentemente se altera el valor obtenido.
A pesar de que cada uno de los valores del grupo de datos, debe tener influencia sobre
la medida obtenida, sta debe ser de tal calidad que no vea influenciada en gran
medida por el cambio de algunos pocos datos.
Debe ser de uso fcil para clculos matemticos posteriores.
De otra forma, dependiendo su naturaleza y funcin, las medidas descriptivas se
pueden clasificar en:
Medidas de tendencia central
Medidas de dispersin
Medidas de forma
Medidas de posicin
Notacin Sigma.
Antes de iniciar la presentacin de las medidas descriptivas, se debe estar en
capacidad de de entender el uso del smbolo matemtico (sigma); el cual es uno de
los smbolos ms frecuentes en las frmulas estadsticas.
(sigma); significa sumatoria, es decir; que se debe sumar el grupo de datos con el
que se cuenta.
Medidas de tendencia central.
Es una forma til de describir mediante un solo dato, la totalidad de un grupo de datos.
Como su nombre lo indica es un dato hallado en el centro de la distribucin; es el punto
central o medio entre el conjunto de datos. En Bioestadstica se usan varios tipo de
datos como medida de tendencia central; cada una de ellas con sus ventajas y
desventajas si de compararlas se trata, las cuales marcan la confiabilidad o no del dato
obtenido.
Las principales medidas de tendencia central son:

Media Aritmtica. Media Ponderada. Media Geomtrica. Mediana.


Moda.
Media Aritmtica: es la medida de tendencia centrada ms utilizada, la ms conocida
y sencilla de calcular. Generalmente se le denomina media , promedio media
para datos no agrupados y se define como la suma de un conjunto de datos u
observaciones, dividido entre el nmero total de observaciones que conforman el grupo
sumado. Si corresponde a la media de una poblacin se denomina con el smbolo ,
mientras que para una muestra se simboliza x ; por lo que la frmula sera
Ejemplo de las propiedades. Si se tiene el siguiente conjunto de datos. 3, 5, 7, 8, 4, 5,
6, 3, 8, 7, 5; entonces:

Datos Xi
3
x1
x2
x3
x4
x5
x6
x7
x8
x9
x1
0
x1
1

5
7
8
4
5
6
3
8
7
5
5,55

Diferencia Diferencia
al
s
con s
cuadrado
el
D2
promedio
6,48
X
i - x
-0,55
0,30
1,45
2,45
-1,55
-0,55
0,45
-2,55
2,45
1,45
-0,55
0,00

2,12
6,02
2,39
0,30
0,21
6,48
6,02
2,12
0,30
32,73

diferencia
s con otro
valor
Xi 3
0
2
4
5
1
2
3
0
5
4
2
28,00

Diferencia
s
ala
cuadrado
D2
0
4
16
25
1
4
9
0
25
16
4
104,00

Desventajas de la media aritmtica:


Es sensible a valores extremos (muy altos o muy bajos) en los cuales un solo valor
puede causar una media aritmtica no representativa para un grupo de datos.
Ejemplo. Si se tienen los valores 5, 4, 7, 5, 18. la media aritmtica sera 7,8; lo cual
indica un valor muy alto para el grupo de datos y que est influencias por el dato
extremo 18.
Por la forma como se distribuyen los datos de una variable, no es representativa
para resumirlos y se puede concluir mal sobre dicho dato. En este caso, depende de la
habilidad del investigador para dar la validez al valor de la media.

Cuando las observaciones se han presentado en una tabla de frecuencias, el valor


aproximado de la media aritmtica, que se llamara media aritmtica de datos
agrupados, se puede obtener mediante la siguiente ecuacin:
Media Ponderada: A veces diferentes valores que se promedian, tiene importancia
desigual dentro del conjunto de datos, por lo cual es recomendable tener en cuenta la
importancia relativa dentro de todo el conjunto de datos.
PRECIO PROMEDIO DE TODA LA PRODUCCIN DE UN LOTE

Clasificaci
n
A
B
C
D

Precio
(Kg)
WI
3.000
2.800
2.500
1.800

Produccin
(Kg)
ni
1.200
2.500
3.450
6.420
13.570
ni

wi x ni
3.600.000
7.000.000
8.625.000
11.556.00
0
30.781.00

wi

Esto indica que en promedio, el kilogramo de mango a esos precios (de acuerdo a las
clasificaciones) se vender a 2.268,31 pesos.
La mediana: es el valor que se ubica en el centro de un conjunto de datos, cuando las
observaciones est organizadas de forma ascendente o descendente (por magnitud).
De otra forma, se podra definir como el valor de la variable que supera a no ms de la
mitad de las observaciones y al mismo tiempo es superada por no ms de la mitad de
las observaciones.
Propiedades de la mediana:
Es el punto central de los datos cuando son ordenados por magnitud.
Se dan en las mismas unidades en que fue medida la variable.
No est influencia por valores repetidos. Ventajas de la mediana:

Es un concepto claro y fcil de entender por su simple empleo matemtico.

Es un valor insesgado cuando se refiere a la influencia de datos extremos; es decir, no


es afectada por la presencia de datos extremos, como le sucede a la media aritmtica.
Desventajas de la media aritmtica:
Es necesario ordenar los datos por magnitud (ascendente o descendente).
No se adapta a clculos posteriores, por cuanto solo sirve como medida de descripcin
o resumen.
No es sensible a cambio de valores entre el grupo de datos.

Para hacer el clculo de la mediana, como primera media se debe conocer el nmero
de datos con que se compone la variable a analizar (conocer n) y segundo, determinar
la posicin del dato central en toda la variable. Para cumplir con el primer requisito, es
indispensable contar los datos.
Cuando el nmero de observaciones es par, la mediana es igual al promedio aritmtico
de las dos observaciones centrales, es decir, el valor resultante de la suma de los dos
valores centrales, est dividida por dos.
La moda: cuando la frecuencia de un valor en una distribucin de frecuencias es mayor
que la de otros valores; dicho valor constituye la moda. En general, la moda (M o) de un
conjunto de datos, es el valor (si existe) que ms se repite. Cuando en un conjunto de
datos se encuentra que solo un dato tiene un mximo de repeticiones dentro del
conjunto, se llamara una distribucin unimodal, si se presentan dos datos con la
misma cantidad de veces que se repiten se denomina bimodal, y si es el caso de tres
datos que se repiten la misma cantidad de veces sera trimodal y as sucesivamente
para clasificarse como multimodal.
Ejemplo. En el caso de los datos (1, 4, 3, 1, 2, 5,), la moda sera 1; es el dato que ms
se repite en el conjunto y en este caso es una distribucin unimodal. Para el conjunto
(2, 4, 2, 3, 1, 5, 1), los nmeros 1 y 2 ocurren con la misma frecuencia y por tanto la
distribucin es bimodal.
Se debe tener en cuenta y como sucede en los ejemplos anteriores, la moda no
siempre es una medida de tendencia central y puede incluso, ubicarse en unos de los
extremos de la distribucin de datos. Es una medida fcil de hallar por qu no necesita
de clculos matemticos, pero si requiere de una persona que conozca la distribucin
de los datos y ms cuando el n es grande.
Medidas de dispersin
Las medidas que se han visto anteriormente carecen de validez para indicar si son
representativas para un conjunto de dato o no. Tal es el siguiente ejemplo, donde se
tiene el conjunto de datos (3, 6, 3, 45, 32, 80, 20, 5,), donde el promedio es 24,5, el
cual no es representativo por la variabilidad de los datos por esta razn se han
diseando los clculos de las medidas de dispersin. Estas medidas indican el grado
de variabilidad entre las observaciones, las ms comunes son:

Amplitud.

Varianza

Desviacin estndar.

Coeficiente de varianza.
Al calcular un promedio, por ejemplo la media aritmtica, no sabemos su
representatividad para ese conjunto de datos. Por esto se hace necesario determinar si
hay concentracin de datos alrededor del promedio, lo cual nos indicara una buena
aplicacin en su uso, por el contrario una gran dispersin estara indicando poca

representatividad, reduciendo la confiabilidad. El estudio de la dispersin o separacin


de los datos de la serie se conoce con el nombre de
teora de la dispersin.
Amplitud: es la medida de dispersin ms simple de calcular y se obtiene con la
diferencia entre el mayor y el menor de los valores del conjunto de las observaciones.
Tambin es llamado rango o recorrido. Se usa ocasionalmente, pero en la mayora de
los casos est influenciada por datos extremos.
Si se denota la amplitud, rango o recorrido como R, el mayor valor como XL y el menor
como XS, entonces:
R XL XS
Utilizando los datos de la tabla 10, la amplitud, rango o recorrido es: Dato mayor = 129
Dato menor = 85
R = 129 85
R = 44
La utilidad del recorrido es limitada. El hecho de que slo tome en cuenta dos valores,
hace que sea una medida pobre en cuanto a dispersin. La ventaja principal de
utilizarla es su sencillez de clculo.
Varianza. Cuando los valores de un conjunto de observaciones estn muy prximas a
su media, la dispersin es menor que cuando estn distribuidos sobre un amplio
recorrido. La varianza se define como la media aritmtica de los cuadrados de las
diferencias (desviaciones) entre los valores que toman la variable y su media
aritmtica. De otra forma es la suma de cuadrados de las desviaciones de las
observaciones con respecto a su media, dividida por el nmero de observaciones.
Si se observan las dos definiciones anteriores, aunque indican lo mismo, en la primera
lectura, no son muy claras; por lo que es preciso saber como se calcula para facilitar su
comprensin.
2

Su smbolo es S en una muestra y (sigma al cuadrado) para una poblacin.


2

Para calcularla, se resta la media a cada uno de los valores, se elevan al cuadrado las
diferencias. Estas diferencias se suman para dividirla entre el tamao de la muestras
(menos 1) o de la poblacin.
Desviacin tpica o estndar. La desviacin tpica es la raz cuadrada de la varianza,
considerada siempre con signo positivo. Es la medida de dispersin ms extensamente
aplicada. En el caso de una muestra se denota con la letra s y para una poblacin

Coeficiente de variacin. Ms conocido como Coeficiente de Varianza (CV) o


Variacin relativa. La desviacin estndar es til como una medida de variacin dentro
de un determinado conjunto de datos. Sin embargo, cuando se desea comparar la
dispersin de dos conjuntos de datos, el comparar las dos desviaciones puede conducir
a resultados ilgicos y ms an cuando estas han sido medidas en diferentes unidades.
Por ejemplo. Se desea saber si la ganancia de peso de terneras de leche con
determinado alimento es menos o ms variable que la produccin de leche en vacas
alimentadas con la misma racin.
An cuando se utilice la misma unidad de medicin, las dos medias pueden ser
distintas. Si se compara la desviacin estndar de la ganancia de peso de terneros
destetos (kg) con la desviacin estndar de la ganancia de peso de terneros al ao,
puede encontrarse en stos ltimos, un valor de desviacin numricamente mayor que
la de los primeros debido a que lo propios pesos son mayores y no porque la dispersin
sea mayor.
El coeficiente de variacin se expresa en porcentaje y por tanto es un ndice de
fluctuacin de la media aritmtica que da un valor entre 0,0% y 100%.

Medidas de posicin
Deciles, Cuartiles y Percentiles. Cuanto la distribucin contiene un nmero alto de
intervalos o marcas de clase y se quiere obtener un promedio de una parte de ella, se
puede dividir la distribucin en cuatro, diez o cien partes. En el primer caso se
denominan Cuartiles, en el segundo se denomina Deciles y en el tercero Percentiles.
Cuartil. Se denomina a la medida central que divide la distribucin en cuatro partes
iguales, mostrando el comportamiento promedio de la cuarta parte de la poblacin o
muestra analizada; medida que es anloga a la mediana, variando simplemente los
puntos de referencia. El cuartil se simboliza con la letra Q i el subndice i que determina
el orden, a que pertenece.
Q1.
Representa el primer cuartil o el promedio del 25% de
analizada y su punto de referencia es n/4.

la poblacin

Estadgrafo de forma
Con estos estadgrafos se pretende determinar si una distribucin es simtrica o
asimtrica. Si la distribucin es simtrica se dice que corresponde a una distribucin
normal cuya curva representativa es la campana de Gauss.
Cuando una distribucin es normal, la media aritmtica, la mediana y la moda son
iguales. Cuando la media aritmtica es menor que la mediana y sta, a su vez, menor
que la moda, la distribucin es sesgada a la izquierda o asimtrica negativa. Si la
media aritmtica es mayor que la mediana y sta es mayor que la moda, decimos que
la distribucin es sesgada a la derecha o asimtrica positiva.

Leccin 7: Distribucin de Frecuencias


La primera etapa del anlisis y la interpretacin de un conjunto de datos es la reduccin
del nmero de observaciones en un conjunto de estadsticas descriptivas que
presenten las caractersticas importantes de los datos, ya sea de una muestra o de una
poblacin. Dicho resumen se hace con un cuadro llamado cuadro de distribucin de
frecuencias y posteriormente con grficas como los histogramas, polgonos,
pictogramas, diagramas circulares, etc.
La distribucin de frecuencias es un mtodo utilizado para organizar y resumir datos.
Bajo este mtodo los datos que componen una serie se clasifican y ordenan,
indicndose el nmero de veces que se repite. La distribucin nos permite manejar
gran cantidad informacin en espacios pequeos.
Pasos para elaborar una tabla de frecuencias:
1. Estimar el rango (R)
2. Determinar el nmero de clases (m)
3. Estimar el ancho de cada clase (amplitud de intervalo, C)
4. Estimar lmite inferior y superior de cada clase (xi-1 xi)
5. Estimar las marcas de clase (Xi).
6. Determinar la frecuencia absoluta (ni)
7. Determinar la frecuencia absoluta acumulada (Ni)
8. Determinar la frecuencia relativa (hi)
9. Determinar la frecuencia relativa acumulada (Hi)
1. Estimacin del rango (R). El rango o recorrido es el valor que se obtiene de la
distancia entre el menor y el mayor valor de las observaciones.
Ejemplo: si se tiene el siguiente conjunto de datos. 74, 71, 65, 72, 67, 79, 88, 66,
99, 40, 52.
El rango o recorrido se obtendra:
Dato mayor = 94

Dato menor = 40

R = 94 40
R = 50
2. Estimacin del nmero de clases (m). Para elaborar una tabla de frecuencias, se
establece cierto nmero de clases (denotada con la letra m) en los valores observados.
Dicho nmero por lo general vara entre 5 y 15 a mayor nmero de datos, debe
disponerse de mayor nmero de clases. Se debe tener en cuenta que si el nmero de
clases es muy pequeo, se podra estar encubriendo caractersticas importantes de los

datos debidos al agrupamiento; si se tienen demasiadas clases, pueden aparecer


clases vacas y la informacin no se resume de forma clara.
Existen dos formas de obtener el nmero de clases a utilizar en un cuadro de
frecuencias; partiendo ambos de la cantidad de datos con que se cuenta (en el caso de
ser una muestra n o en el caso de ser una poblacin N).
a. Sabiendo que se recomienda tener un nmero de clases entre 5 y 15, el investigador
puede definir de acuerdo al nmero de datos que tenga, cuantas clases puede
manejar.
b. Si se quiere ser ms preciso, se puede utilizar la formula Sturges, la cual dice que
m=1+3,322(log n); donde m es el nmero de intervalos de clase. En la mayora de los
casos, la aplicacin de esta frmula da nmero decimales, por lo que es necesario
aproximar para tomar un nmero entero de clases. Por ejemplo, si la frmula da que
debe tomar 7,8 clases se aproximara a 8 clases.
Por ejemplo. Si se ha tomado el dimetro en la base de 758 rboles de un bosque que
se compona de 14.250 rboles, el nmero de clases quedara as:
m=1+3,322(log n) m=1+3,322(log 758) m=1+3,322(2,8796) m=1+9,5662 m=10,5662
m=11 clases.
Para justificar cualquiera de los dos mtodos siendo ms usado el primero, es preciso
que la decisin sea tomada por una persona que conozca muy bien los datos y el uso
que se les va a dar.
3. Estimacin del ancho de cada clase (amplitud de intervalo, C). Es el valor que va a
tener como amplitud en cada una de las clases que se han establecido. Es
recomendable estimar un solo valor de amplitud para todas las clases que se
pretendan manejar en la tabla de frecuencias, esto le da ms confiabilidad y
presentacin al resumen de datos que se pretende hacer. El ancho de la clase se
obtiene dividiendo el rango entre el nmero de clases.
4.

h1 h2 h3 ... hm 1

i 1

9. Frecuencias relativas acumuladas (Hi). Es la suma sucesiva de las frecuencias


relativas obtenidas en cada intervalo de clase.
Hi h1 h2 h3 ... hm
El histograma.
Es un tipo especial de grfica de barras para representar distribuciones de frecuencias
absolutas o relativas. Tiene las siguientes caractersticas:
Los valores de la variable que se est considerando se representan en el eje horizontal
(eje x o independiente). Las frecuencias absolutas o relativas se representan en el eje
vertical (eje y o dependiente).

Cada intervalo de clase tomado en la distribucin de frecuencias implica una seccin


sobre el eje horizontal.
Por encima de cada intervalo de clase sobre el eje horizontal se levanta una barra
rectangular, de modo que su altura corresponde con la frecuencia correspondiente.
Polgono de frecuencias.
Se construye localizando el punto medio de cada intervalo de clase (marcas de clase)
en el eje X y marcando un punto al a altura de la frecuencia correspondiente en el eje
Y. Uniendo los puntos medios de las alturas se obtiene un polgono. Es decisin del
investigador si inicia o cierra la lnea trazada sobre el eje X; esto mostrara
hipotticamente que la frecuencia de un intervalo inferior y uno superior a los que se
tomaron, sera cero.
Ojiva:
El estudio clsico de la probabilidad nace aproximadamente en el siglo XVII, en
especial del trabajo de dos matemticos, Pascal y Fermat. Gran parte de la teora se
desarroll a travs de los dados.
Para entender los principios de las probabilidades, es necesario conocer con
anterioridad algunos conceptos relacionados con la teora de conjuntos.
Experimento. Es un proceso por medio del cual se obtiene una observacin o
medicin. Un experimento aleatorio es aquel cuyos resultados no pueden predecirse y
por lo tanto estn sujetos al azar.
Espacio muestral. Es el conjunto formado por todos los resultados posibles de un
experimento, generalmente se indica con la letra S.
Ejemplo: se toma una semilla al azar y se le hace prueba de viabilidad. El resultado
puede ser: viable (V) o no viable (N); entonces el espacio muestral es:
S V , N
Si en el caso anterior se toman tres semillas, el espacio muestral ser:
S VVV , NVV ,VNV ,VVN ,VNN , NVN , NNV , NNN
Se pretende determinar el nmero de conejos enfermos en un conjunto de 8 animales.
El espacio muestral sera:
S 1,2,3,4,5,6,7,8
Si con el caso anterior de los conejos, se pretende estimar el porcentaje de conejos
enfermos:
S X / 0 X 100

Si se pretende estimar el peso de uno de los conejos enfermos


S X / X 0
Eventos o sucesos. Es un conjunto de un espacio muestral. Ejemplo. El hecho de
que se encuentren tres o ms conejos enfermos en el espacio muestral donde se
determinan el nmero de conejos enfermos de los ocho que tiene el conjunto.
S 1,2,3,4,5,6,7,8A 3,4,5,6,7,8Obsrvese que S contiene a A
Si se divide el espacio muestral en un serie de eventos A 1, A2, A3, An y adems A1
A2 A3 An= S, entonces esta divisin se denomina particin del espacio
muestral.
Un suceso que no puede ser descompuesto se denomina suceso simple; por ejemplo
al tomar una semilla, esta puede ser viable o no viable. Se indican con E i los sucesos
simples:
E1

Semilla viable

E2

Semilla no viable

Para el espacio muestral de la viabilidad de tres semillas, los sucesos


simples seran
E1

VVV

E5

VNN

E2

NVV

E6

NVN

E3

VNV

E7

NNV

E4

VVN

E8

NNN

De este modo, el espacio muestral es el conjunto de todos los puntos muestrales de un


experimento y un suceso es un coleccin especfica de puntos muestrales.
Se pueden considerar como sucesos compuestos a la unin o interseccin de otros
sucesos.
Unin de sucesos. Sean A y B dos sucesos de un espacio muestral S. la unin de A y
B (A B) se define como el suceso que contiene todos los puntos muestrales que
estn en A, en B o en ambos.
Interseccin de sucesos. La interseccin de A y B es el suceso formado por todos los
puntos muestrales que estn en A y en B, (A B) o simplemente AB.
Complemento de un suceso. El complemento de un suceso A ( A ) es la coleccin de
todos los puntos muestrales en S que no estn en A.

Sucesos mutuamente excluyentes. Se dice que dos sucesos son mutuamente


excluyentes si el suceso de AB (A B) no contiene ningn punto muestral, lo cual
equivale a que no se pueden dar los dos eventos simultneamente. As como un animal
est enfermo o no.
Definicin de probabilidad clsica. Si un evento puede ocurrir en N maneras
mutuamente exclusivas e igualmente probables y si m de stas posee una
caracterstica E, la probabilidad de ocurrencia de E es:
P(E)
N

Esta definicin clsica o a priori, tiene serias limitaciones pues implcitamente contiene
el concepto de igualmente probable; queriendo decir que de un conjunto de
elementos donde se pretende seleccionar uno, todos tiene la misma probabilidad de
ser seleccionados. De la misma forma considera a priori que todos los eventos tienen
la misma probabilidad de ocurrir. Es as como muchos otros problemas quedaran sin
respuesta. Como por ejemplo: cul es la probabilidad de que un ro aumente su
caudal a ms de 1000 litros por segundo?,
cul es la probabilidad de que bovino aumente ms de 850 gramos por da?,
cul es la probabilidad de que un cultivo de arroz de una variedad especfica, en cierto
tipo de suelo, condiciones de manejo y fertilizacin produzca ms de 40 bultos por
hectrea?
La aproximacin de la frecuencia relativa a la probabilidad depende de la repeticin de
algn proceso y de la capacidad de contar el nmero de repeticiones, as como del
nmero de veces que ocurre algn evento de inters. En este contexto la probabilidad
de observar alguna caracterstica E, de un evento, puede definirse como probabilidad
frecuentista textualmente quedando:
Si un evento se repite n veces y hay m resultados a favor de un evento E, entonces una
estimacin de la probabilidad frecuentista de ese evento es
P(E)
n

Ejemplo. Si se hace un muestreo en ardillas de cola roja y se encuentra que de las 80


capturadas, 55 estn contaminadas con Salmonella. Cul es la probabilidad de que al
capturar otra ardilla, esta est contaminada con Salmonella?
De la informacin se tiene que el evento se repite 80 veces (n=80), de los cuales el
resultado favorable para Salmonella es de 55 veces (m=55); entonces, la probabilidad
de capturar una ardilla con Salmonella P(E) es de:
55
P(E)
0,68.
80
Este punto de vista sostiene que la probabilidad mide la confianza que tiene un
determinado individuo en la veracidad de una proposicin particular.

Probabilidad bajo un concepto axiomtico. Este concepto fue formalizado por el ruso
A.N. Kolmogorov. La base de este concepto de probabilidad, se considera desde el
cumplimiento de tres axiomas relacionados con la teora de conjuntos:
1. Todos los eventos deben tener una probabilidad mayor o igual a cero, lo cual es
un argumento razonable en vista de la dificultad de obtener una probabilidad
negativa. Dicha probabilidad del evento tampoco puede ser mayor a 1.
P(E) O

0 P(E) 1

2. la suma de todas las probabilidades de todos los eventos mutuamente


excluyentes es igual a 1.
P(S ) 1
Esta es la probabilidad de exhaustividad y se refiere al hecho de que el observador de
un proceso probabilstico debe tomar en cuenta todos los eventos posibles y cuando se
toman en su totalidad, la suma es 1.
1.Si se tiene dos eventos mutuamente excluyentes, Ei y Ej. La probabilidad de que
ocurran, es igual a la suma de sus probabilidades individuales.
P(Ei ) P(Ej ) P(Ei ) P(Ej )
Las probabilidades se expresan en proporciones de 0 a 1 o en porcentajes
equivalentes de 0 a 100%.
Leccin 10: Muestreo

En muchos casos, si no es en la mayora, el investigador de cualquier campo se


encuentra con la imposibilidad de estudiar toda una poblacin (todos y cada uno de los
elementos que la componen); razn por la cual se han formulado una serie de mtodos
que permitan determinar el tamao de una porcin de la poblacin, llamada muestra y
con la cual es representativo analizar e inferir sobre la poblacin. Una poblacin debe
estudiarse bien sea a travs de un censo (estudio de toda la poblacin) o en base a
una muestra (parte de una poblacin).
El muestreo, tcnica para seleccionar el tamao de la muestra representativa de una
poblacin y forma como se selecciona cada uno de los integrantes de la muestra, es
una herramienta til para cualquier estudio de aspecto social, de salud, educacin,
ambiental, agrcola, pecuario, financiero e incluso de mercadeo entre otros. sta es la
tcnica base para que se utilice la inferencia estadstica y con la cual se pueden
analizar, concluir y argumentar aspectos relevantes de la poblacin en estudio.
Es preciso determinar el tamao y forma de seleccionar las unidades que componen la
muestra, cuando:

1. La poblacin es grande y su estudio completo excede los recursos asignados.


2. Existe suficiente homogeneidad en las unidades de la poblacin con respecto a lo que
se quiere medir, locuaz permite que una muestra adecuada contenga la informacin
suficiente para el inters del estudio.
3. El proceso de seleccin de la muestra es destructivo, lo cual obliga hacer el estudio
slo en una parte de la poblacin. Ejemplo. Cuando se pretende estudiar la calidad de
la carne en animales y por tanto es necesario sacrificarlos. O cuando se pretende
estudiar el desarrollo radicular de una especie de plantas y por consiguiente es
necesario arrancarlas para tomar las correspondientes medidas.
El muestreo, en general, tiene como objetivo agilizar los procesos de investigacin,
controlar los gastos excesivos de recursos financieros, humanos y de tiempo, pero
tambin en algunos casos evitar que se creen impactos negativos sobre poblaciones
vulnerables al estudio planteado; como sucede cuando se estudian especies silvestres
o se hacen muestreos destructivos.
Existe, adicionalmente, otra razn de peso para hacer uso del muestreo estadstico y
es el estricto control que se puede ejercer sobre la recoleccin de la informacin, muy
superior al que se lograra en el caso de un censo (toda la poblacin). Los errores en el
estudio, especialmente aquellos conocidos como errores muestrales (no respuesta,
inconsistencia, codificacin errada, etc.) disminuyen considerablemente cuando se
realiza un muestreo en vez de un censo.
En las ciencias agropecuarias y ambientales, donde la mayora de los estudios de
investigacin se enfocan en la aplicacin de tratamientos, es preciso, por costos,
aplicacin de los mismos tratamientos y facilidad en la toma de datos, incluso de
control de algunos factores, tomar parte de la poblacin para la experimentacin y
luego inferir.

Las etapas principales en la planificacin y ejecucin de un muestreo son:


a. Planteamiento de los objetivos. Es necesario definir los objetivos. Por lo general
stos se relacionan con la estimacin de los parmetros de inters (usualmente
medias y varianzas) o prueba de hiptesis sobre ellos.
b. Definicin de la poblacin a ser muestreada. De acuerdo a los objetivos, debe
identificarse claramente la poblacin sobre la cual se desea hacer la inferencia.
c. Establecer el tipo de datos que deben recolectarse y los mtodos de medicin. De
esta manera se asegura la obtencin de la informacin que sea pertinente de
acuerdo a los objetivos planteados y se evita la tendencia a recolectar datos
innecesarios.
d. Seleccin de la muestra. La cual incluye la seleccin de la unidad de muestreo, la
definicin del tamao de la muestra y la forma como sera seleccionada esta.
e. Ejecucin del muestreo. En esta fase, una de las ms importantes y de la que
depende la confiabilidad de los resultados, se hace la localizacin de las unidades
que componen la muestra. Se hace necesario planear de forma detallada el
proceso a seguir para la ejecucin del muestreo. Para esto se debe formalizar un
cronograma a cumplir por personas idneas y con conocimiento del estudio para
que le brinden responsabilidad y criterio profesional, cumpliendo con lo
programado.
f. Anlisis de datos. Por lo general las estimaciones se dan por medio de intervalos
de3 confianza para los parmetros. El conocimiento de las varianzas permite
adems planear ajustes o mejores alternativas para los futuros esquemas de
muestreo. En el caso de investigaciones experimentales, el anlisis debe estar
encaminad a la aplicacin de modelos matemticos que permitan cumplir con los
objetivos planteados en la investigacin.
De cualquier poblacin de tamao N, pueden extraerse cierto nmero de muestras
distintas de tamao n. Haciendo esta afirmacin bajo la hiptesis que N es lo
suficientemente grande como para garantizar el muestreo. Por razones obvias, las
poblaciones pequeas no se muestrean, sino que se estudia la poblacin completa.
Muestreo probabilstico.
Existen condiciones que deben cumplirse para poder hablar de una muestra
probabilstica. Ellas son:
1. poder definir el conjunto total de muestras posibles que pueden seleccionarse de
una poblacin de acuerdo con el procedimiento muestral.
2. Conocer para cada una de las muestras posibles la probabilidad de que sea
seleccionada ((s)).
3. el procedimiento utilizado debe dar a cada elemento de la poblacin una
probabilidad de seleccin diferente de 0.
4. la seleccin, debe ser aleatoria, esto es, el mecanismo de probabilidad diseado
para la seleccin, de tal manera que cada multar posible tenga la probabilidad de
seleccin asignada previamente ((s)).
Muestreo no probabilistico.

Una muestras probabilstica es una muestra que es extrada de una poblacin, de tal
manera que todo miembro de esta ltima tenga una probabilidad conocida de estar
dentro de la muestra.
En general todo muestreo que no cumpla con alguna de las condiciones enumeradas
anteriormente es un muestreo no probabilstico. Se cumplira lo siguiente:
1. La muestra se restringe a una parte de la poblacin que es fcilmente accesible.
2. La muestra es seleccionada teniendo en cuenta el azar, ms no la aleatoriedad (se
seleccionan los elementos que estn ms a la mano).
3. Con una poblacin heterognea y pequea, el muestrista inspecciona la poblacin
y selecciona una multar pequea de unidades tipo (cercanas a la impresin que
pueda tener de la media general o a un criterio justificado por la profesin).
4. La muestra se compone esencialmente de unidades voluntarias o impuestas.
Bajo condiciones apropiadas, cualquiera de los casos anteriores, pueden presentar
resultados tiles. Sin embargo, en ellos no se puede aplicar estrictamente la teora del
muestreo ya que ella se basa en el supuesto de seleccin aleatoria donde todas las
unidades tienen una probabilidad de ser seleccionadas.
Al muestrear poblaciones finitas hay tres maneras bien distintas de hacer la seleccin:
1. Muestreo aleatorio. Puede introducirse en e procedimientote muestreo de varias
maneras que nos dan diversos diseos de muestra. Gracias a la aleatorizacin
pueden obtenerse estimaciones validas del error. Se puede aplicar la teora de
probabilidades u se pueden sacar conclusiones vlidas.
2. Muestreo sistemtico. Se usa cuando cada uno de los individuos de una poblacin se
incluye en la muestra, tal procedimiento es fcil pero insatisfactorio si en la poblacin
se presentan tendencias o ciclos no reconocidos aun. Dado que las poblaciones se
deben enumerar antes del muestreo, pueden introducirse en forma inconsistente
ciertas relaciones entre una o ms caractersticas investigadas y orden de
numeracin. En general, no es seguro suponer que no existe tal relacin. El muestreo
sistemtico puede efectuarse en forma tal, que puede obtenerse una estimacin no
sesgada de error de muestreo. Esto requiere de ms de una muestra sistemtica.

3. Muestreo autoritario. Exige que una persona, bien familiarizada con el material que va
a muestrearse, extraiga la muestra sin tener en cuenta la aleatorizacin. Tal
procedimiento depende completamente del conocimiento y pericia de la persona que
hace el muestreo. Puede producir buenos resultados en algunos casos, pero rara vez
se recomienda.
Muestreo aleatorio simple.
Este esquema constituye la base de la mayora de todos los muestreos los muestreos.
Si se estudia una poblacin dividida en n unidades de muestreo (rboles, parcelas,
individuos, animales, etc.), el mtodo consiste en tomar a l azar n unidades de las n, de
tal manera que cada combinacin posible de las n unidades tengan la misma

probabilidad de ser escogida. Las unidades de muestreo se extraen de forma


independiente.
Una manera de seleccionar una muestra aleatoria simple es utilizar una tabla de
nmeros aleatorios simples.
La varianza muestral de la media. Cuando el muestreo es con reemplazo o la
poblacin muestreada es muy grande, la varianza de promedios o error estndar est
dad por:
Tamao de la muestra. Para estimar el tamao de la muestra es necesario decidir que
tan grande es el error que se est dispuesto a tolerar con el estimador, de acuerdo a la
precisin exigida por el investigador.
Considerando una poblacin normal o aproximadamente normal
La estimacin puntual se realiza con base en el valor de un estimador obtenido a partir
de una muestra. El estimador es estadstico, o sea una funcin de las observaciones
que se espera refleje las caractersticas del parmetro desconocido. Por ejemplo, la
media aritmtica X es un estimado de el parmetro de la poblacin.
Es posible proponer varios estimadores para u parmetro dado y adems, como
variable aleatoria, los estimadores tienen distribuciones de probabilidades; por lo cual el
estimado de un parmetro puede estar muy cerca o muy lejos del valor verdadero. Por
esto es importante seleccionar un estimador que est cerca del valor verdadero del
parmetro. Para hacer una buena seleccin de un estimador, se deben seguir por lo
menos dos criterios.
a. Insesgamiento. Sea a. el estimador del parmetro A; se dice que a es un estimador
insesgado de A si la esperanza matemtica de la variable aleatoria a es igual a A.
Esto es:
E (a) = A
De lo contrario, se dice que el estimador es segado y est dado por: Sesgo de a = E (aA).
Cuando se manejan muestras muy grandes, los estimadores generalmente no son
insesgados y en el caso de presentarse un grado de sesgo, este es muy pequeo; es
decir, es ms confiable trabajar con muestras grandes. El concepto de sesgo no es el
nico, ni el ms importante para poder hacer estimacin puntual, para esto se debe
tener en cuenta tambin:
b. Eficiencia. Con este criterio se pretende estimar el grado de explicacin que cubre un
estimador sobre una poblacin. En muchas ocasiones cuando se tiene dos
estimadores y por lo general uno es ms eficiente que el otro.

La varianza del estimador nos indica el grado de dispersin de los diferentes valores
que pueden tomar alrededor del parmetro. Es por esto que la varianza es un indicador
de la eficiencia, deduciendo que entre menor sea la varianza, mayor es la eficiencia
que se tiene con el estimador. Este es quiz el mejor indicador para iniciar una
estimacin puntual.
Estimacin puntual del promedio.
Como se ha visto hasta el momento, el promedio es la medida ms susceptible de
trabajar para representar un grupo de datos sin importar si son de una poblacin o de
una muestra. Por eso la estimacin puntual se hace para el promedio pero no para la
varianza.
Si se tiene una poblacin de tamao N y de esta se toma una primera muestra de
tamao n1, se obtendra un promedio X1 , si se tomara una muestra de tamao n2
(que no puede ser del mismo tamao de n1), se obtendra un promedio X 2 y as
sucesivamente hasta tener Xn promedios; el promedio de todos estos promedios
sera la estimacin del parmetro de la poblacin .
En pocas palabras,
promedio de los promedios es una representacin puntual del parmetro.

el

Esquemticamente sera:
N

n1 X 1 n2 X 2 n3 X 3
.
.nn Xn

X
Xn

N
Ejemplo. Si se tiene una poblacin de 200 terneros de los cuales se requiere estimar el
promedio de peso al nacimiento, por facilidad de trabajo se toman muestras que se
promedian para luego calcular una estimacin puntual del parmetro.
De acuerdo a las muestras, los promedios obtenidos fueron: DATOS OBTENIDOS.
Muestra
Promedio
(Kg/animal)
Muestra 1 (n=10)
44
Muestra 2 (n=15)
40
Muestra 3 (n=10)
42
Muestra 4 (n=20)
44
Muestra 5 (n=12)
43
Promedio
de 42,6
Esto quiere decirpromedios
que el promedio para la poblacin es de 42,6 kilos/animal al
nacimiento. Se debe aclarar que para validar como apropiados los promedios

mustrales y poder sacar un promedio poblacional, se debe tener en cuenta la


variabilidad de cada uno de estos ya sea con la desviacin estndar o con la varianza.
Estimacin puntual para varianza.
Lo contrario a lo que sucede con la media aritmtica, la varianza no se puede calcular
por promedio del resultado de algunas muestras. Para comprobar esta teora, se
presenta el siguiente ejemplo. Si se tienen 4 elementos en un espacio muestral (a, b, c,
d) de los cuales se quieren sacar muestras de a 2 elementos.
Inferencia por estimacin de intervalos.
La inferencia estadstica est basada en el supuesto de tomar muchas muestras, todas
con igual probabilidad de ser seleccionadas y a travs de una de ellas calcular datos
que representen la poblacin para poder tomar decisiones, interpretar o analizar segn
el comportamiento de la variable. No se quiere decir con esto, que siempre se
obtengan los resultados esperados o los que mejor representen a la poblacin, ya que
desde el punto de vista terico y prctico, esto tambin depende de una distribucin de
probabilidades.
Cualquier inferencia que se haga sobre una poblacin siempre tiene un error, de lo
contrario, la varianza del dato que se obtiene debera ser 0 lo cual nunca sucede. Por
tal razn, y para asegurar la validez del estimador sobre el parmetro, en muchas
ocasiones si no son todas, es preciso hacer inferencia por intervalos, en los cuales se
calculen un lmite superior y un lmite inferior que enmarcan el parmetro esperado que
representa la poblacin. Sin embargo, esto lmites siempre siguen guardando un error
sin importar si son para promedio, varianza o proporciones.
Para hacer ms preciso el clculo de intervalos para medias aritmticas y proporciones,
se han propuesto dos distribuciones de probabilidades que son tiles para tal fin. En el
caso de tener muestras grandes (n > 30) se dispone de la distribucin normal o
Gaussiana, mientras que para muestras pequeas (n 30) se cuenta con la
distribucin t-student; la cual no se ha tratado hasta el momento y que se explicar
cuando corresponda. En el caso de hacer inferencia para varianza, se utiliza la
distribucin F (de Fisher) o ji-cuadrado.
Estimacin de intervalos para grandes muestras.
2

A pesar de que la X y la s son estimadores de y , sera sorprendente que fueran


2
realmente y en cambio de encontrarse la aproximacin de stos. Esto
2

permite deducir que puede ser ms apropiado dar un intervalo en torno a la X y la s y


2
decir que se est razonablemente confiado en que y , se encuentran en ese
intervalo. Esto puede hacerse con la ayuda de la distribucin normal para cuando se
tienen muestras grandes (n > 30). Adems del tamao de la muestra,
en otro criterio para inclinarse por el uso de la distribucin norma, es cuando se conoce
la varianza de la muestra.

Se usa distribucin Z (normal o Gaussiana) cuando:


2

1. La varianza de la muestra ( ) se conoce.


2. La varianza de la muestra se desconoce, pero n >30
Se usa distribucin t cuando:
2

1. La varianza de la muestra se desconoce ( )


2. El tamao de la muestra es menor a 30 (n 30)
Los intervalos, en la estadstica se denominan intervalos de confianza. Este concepto
permite que el investigador asocie el valor de una probabilidad con el intervalo aleatorio
de tal modo que la probabilidad de que un intervalo de confianza incluya el parmetro
sea relativamente alta; este valor se conoce como coeficiente de confianza.
Si se tiene la muestra aleatoria procedente de una poblacin con parmetro A,
entonces un intervalo de confianza (L1 y L2) para dicho parmetro es:
P (L1 A L2 ) =1-
Donde:
L1 y L2
Se conocen como lmites del intervalo y son
obtenidos de la muestra aleatoria.
1-

estadsticos

Es el coeficiente de confianza.

Es el error que se permite como probabilidad de que el valor


del parmetro no est entre el intervalo hallado.
El intervalo debe interpretarse como la probabilidad de que se contenga al parmetro
en 1- y no la probabilidad de que el parmetro caiga en el intervalo porque A es un
nmero fijo. Se puede considerar que si se toman muestras repetidas de la misma
poblacin y se obtienen los intervalos de confianza respectivos para el parmetro A
entonces se espera que (1 ) por ciento de estos intervalos incluirn a A.
Intervalo de confianza para la media.
Considerando una poblacin normal en donde se ha tomado una muestra grande para
estimar los parmetros, los lmites de confianza para el coeficiente de confianza 1-,
tendra como base la distribucin normal.
Intervalos de confianza para varianza.
Como se ha venido trabajando y demostrando, la varianza es una medida importante
para el clculo de otros valores y como no tiene interpretacin ni unidades reales, se
puede transformar en desviacin estndar y as determinar la variabilidad de un
conjunto de datos. Por esta razn, es importante en muchas ocasiones encontrar

lmites de confianza para la varianza y as poder inferir desde una muestra en una
poblacin. Tal es el caso de las empresas productoras de farmacuticos, vacunas,
alimentos, y muchos otros, que deben garantizar baja variabilidad del resultado
obtenido por usar el producto. Para esto, se hacen las pruebas en una muestra y luego
se infiere sobre el total de la poblacin que usara el producto. En el caso de
procedimientos de mejoramiento gentico, son importantes ya que a pesar de la
influencia de muchos factores incluidos lo ambientales, los resultados a obtener en una
poblacin dependen de la variabilidad de los ensayos con las muestras.
Pruebas de hiptesis
Desde cuando se inici la inferencia estadstica se plante que la otra forma de
hacerla, es por medio de las pruebas de hiptesis. La inferencia est basada en el
supuesto de tomar muchas muestras, todas con igual probabilidad de ser
seleccionadas y a travs de una de ellas determinar aproximaciones de los parmetros
de la poblacin, permitiendo hacer aseveraciones, estableciendo un error, incluso en
algunos casos incorrectos. En esta parte del mdulo se prender a identificar, si el valor
del estimador obtenido en la muestra es representativo del parmetro o valor
estadstico poblacional de la cual se extrajo.
La prueba de hiptesis denominada tambin prueba de significancia, tiene como objeto
principal evaluar suposiciones o afirmaciones acerca de los valores estadsticos de la
poblacin, denominados parmetros.
Estas suposiciones se llaman hiptesis estadsticas, las cuales son supuestos acerca
de un parmetro o de algn valor estadstico de una poblacin. Esto quiere decir que
no todas las hiptesis son estadsticas. Se debe tomar un parmetro como referencia,
ya sea una media, una proporcin, una varianza, etc.
La hiptesis estadstica, tambin puede considerarse, como la afirmacin acerca de
una caracterstica ideal de una poblacin sobre la cual hay inseguridad en el momento
de formularla y que, a la vez, es expresada de forma que puede ser rechazada.

De esta forma, se puede aclarar que los investigadores tratan con dos tipos de
hiptesis: la hiptesis de investigacin y la hiptesis estadstica. La hiptesis de
investigacin es la conjetura o suposicin que motiva la investigacin. Puede ser el
resultado de aos de observacin por parte del investigador. Un Mdico Veterinario por
ejemplo, puede haber notado que ciertos equinos respondieron ms rpidamente a un
tratamiento para clico. Los proyectos de investigacin suelen resultar del deseo de los
profesionales para determinar si sus teoras o sus sospechas pueden ser apoyadas o
no cuando se someten a los rigores de la investigacin cientfica.
Las hiptesis de investigacin conducen directamente a hiptesis estadsticas. Las
hiptesis estadsticas se establecen de tal forma que pueden ser evaluadas a travs de
tcnicas estadsticas apropiadas. En este mdulo las hiptesis que se estudiarn sern
de este tipo.

Es importante, sin decir que es camisa de fuerza, tener en cuenta algunos pasos o
aspectos para poder aplicar pruebas de hiptesis estadsticas.
1. Datos. Debe comprenderse la naturaleza de los datos que forman la base de
los procedimientos de prueba, ya que estos determinan la particularidad que
debe utilizarse.
2. Suposiciones. Un procedimiento general se modifica, dependiendo las
suposiciones. Se ha visto que stas incluyen, entre otras, suposiciones de la
normalidad de la distribucin de la poblacin, igualdad de varianzas e
independencia de las muestras.
3. Hiptesis. En la prueba de hiptesis se trabaja con dos supuestos o hiptesis
estadsticas que deben enunciarse explcitamente. La primera es la hiptesis
que debe probarse, por lo comn conocida como hiptesis nula y que se
designa con el smbolo Ho. Esta hiptesis se conoce por algunos autores como
hiptesis de no diferencia, ya que es una proposicin de conformidad con (o no
diferencia respecto de) condiciones verdaderas en la poblacin de inters. En
general, la hiptesis nula se establece con el propsito expreso de ser
rechazada. En consecuencia, el complemento de la conclusin que el
investigador desea alcanzar se convierte en el enunciado de la hiptesis nula.
En el proceso de la prueba, la hiptesis nula se rechaza, o bien, no se rechaza.
Si la hiptesis nula no se rechaza, se dir que los datos sobre los cuales se
basa la prueba no proporcionan evidencia suficiente que provoque el rechazo.
Si el procedimiento del aprueba conduce al rechazo, se concluye que los datos
disponibles no son compatibles con la hiptesis nula, pero son apoyo de alguna
otra hiptesis. Esta otra hiptesis se conoce como hiptesis alternativa y puede
designarse con el smbolo Ha.
Debe sealarse que, en general, la prueba de hiptesis o la inferencia, simplemente
indican si esta es apoyada o no por los datos disponibles. Por lo tanto cuando no es
posible rechazar esta hiptesis nula, no se dice que es verdadera, si no que puede ser
verdadera.
4. Estadstica de prueba. Es alguna estadstica que puede calcularse a partir de
los datos de la muestra. Como regla, existen muchos valores posibles que
pueden tener la estadstica de prueba, dependiendo del valor particular
observado de la muestra particular extrada. La estadstica de prueba sirve
como un producto de decisin de rechazar o no la hiptesis nula. En forma
general, se puede representar bajo una frmula que resume cualquier tipo de
estadstica para aplicar en pruebas de hiptesis. Prueba de hiptesis para la
media de una poblacin.

Se desea estudiar la hiptesis de que la media de la poblacin es igual a un valor dado


(0) frente a una alternativa conveniente. Para esto, como se ha venido estudiando, se
plantean dos hiptesis:
Ho:

= 0

HA:

0 (prueba a dos colas)

o bien:

Ho:

= 0

HA:

> 0 (prueba a una cola) HA:

< 0

Debe notarse que, cuando la hiptesis alternativa se plantea como un desconocido


para el parmetro (), el cual tiene como resultado un dato mayor y/o menor que el
estimador (0) y se simboliza con diferente a (); en este caso, la distribucin se trabaja
a dos colas (bilateral). En el caso contrario, cuando se tiene un punto de referencia
para decir en la hiptesis alternativa que, el parmetro es mayor que (>) el estimador o
que el parmetro es menor que (<) el estimador, se trabaja la distribucin a una cola
(unilateral).
Ejemplo. Si se sabe que en unas condiciones especficas, el cultivo de maz para
ensilar da un rendimiento de 20 toneladas por hectrea y se pretende probar la
hiptesis alterna de obtener un resultado diferente con el aumento de la densidad de
plantas sembradas; El resultado obtenido no se estima si es mayor o menor a las 20
toneladas que ya se sabe normalmente se obtiene, por tanto la hiptesis se indica con
el smbolo . Si el estudio consistiera en manejar el cultivo bajo las mismas condiciones
pero agregndole un fertilizante foliar, se sabe por efecto del proceso fisiolgico que se
obtendra un mayor rendimiento, por lo tanto la hiptesis a probar sera que la nueva
produccin es mayor que la tradicional y se simboliza con (>)

Comparacin de dos medias muestrales


La prueba de hiptesis que comprende la diferencia entre la media de dos poblaciones
de utiliza con ms frecuencia para determinar si es razonable o no concluir que las dos
son distintas. En tales casos, se podran plantear una de las siguientes hiptesis:
H 0 : 1 2 0,
H 0 : 1 2 0,
H 0 : 1 2 0,
H A : 1 2 0 H A : 1 2 0 H A : 1 2 0Muestras apareadas.
Tienen igual nmero de elementos entre las dos muestras.
Una muestra depende de la otra, es decir, se analiza el mismo grupo con el efecto
de dos tratamientos. Cuando se habla de dependencia, no se refiere a variables
dependientes e independientes en modelos lineales; esto hace referencia a que
una muestra fue tomada despus de terminar de aplicar la anterior y en los
mismos ejemplares, terreno, etc.
Muestras no apareadas.
Puede contener igual o diferente nmero de datos entre las dos
Siempre se refiere a la aplicacin de tratamientos o medidas en dos grupos
diferentes.

Comparacin de medias para dos grupos con datos apareados


En este caso, trataremos con muestras del mismo tamao; adems, cada valor de la
primera muestra corresponde precisamente un valor de la segunda. Comnmente, a
este tipo de comparaciones se le denomina observaciones apareadas, en virtud de que
los elementos de una muestra son homogneos respecto de la contrastante o son los
mismos; slo que el estmulo o tratamiento es diferente. En lugar de llevar al anlisis
con observaciones individuales, se utiliza como variable de inters la diferencia entre
pares individuales de observaciones.
Sucede con frecuencia que no hay diferencias reales entre las poblaciones en lo que
respecta a la variable de inters, pero la presencia de fuentes extraas de variacin
provocan el rechazo de la hiptesis nula de no diferencia. Por otra parte, las diferencias
reales pueden tambin ser enmascaradas por la presencia de factores extraos.
El objetivo en las pruebas de comparaciones apareadas es eliminar un nmero mximo
de fuentes de variacin extraa, haciendo a las parejas semejantes con respecto a
tantas variables como sea posible. Las observaciones apareadas pueden obtenerse de
varias formas. Los individuos pueden registrarse antes y despus de recibir algn
tratamiento. Camadas del mismo sexo pueden ser asignadas al azar para que reciban
algn tratamiento. Parejas de gemelos o hermanos pueden ser asignados al azar para
que reciban dos tratamientos. O siendo ms explcitos; la respuesta de un cordero a
una dieta antes y despus de la aplicacin de un medicamento; o la produccin de un
rbol antes y despus de la poda.
Anlisis de varianza
El anlisis de varianza fue ideado por Sir Ronald Fisher en 1925. Esta tcnica
estadstica ha resultado de gran aplicacin en aquellas investigaciones que tienen
como propsito analizar los efectos de uno o ms factores sobre el comportamiento de
una cierta caracterstica. En sus inicios se aplico bsicamente en el campo de la
experimentacin biolgica, y muy especialmente en la agricultura; pero hoy en da es
utilizada con xito en diferentes ramas del trabajo experimental. Puede considerarse
adems, que esta tcnica ha contribuido al desarrollo de algunos mtodos estadsticos,
entre ellos, en los llamados mtodos de regresin, y que una de sus ms frecuentes
aplicaciones se encuentra en el propio diseo de experimentos.
Su aplicacin en el diseo de experimentos se debe a que el anlisis de varianza es
considerado como una de las tcnicas ms tiles para aumentar la sensibilidad de
dicho diseo, ya que a travs de l se puede suprimir las variables que intervienen en
un fenmeno dado y que no son de la importancia experimental.
El anlisis de varianza, es esencialmente un procedimiento aritmtico que descompone
una suma total de cuadrados en componentes asociados con fuentes de variacin
reconocida. Se ha usado con provecho en todos los campos de la investigacin en
los que los datos se miden cuantitativamente.

Supuestos del anlisis de Varianza


Aditividad.
La aditividad se refiere a que los efectos de las diferentes fuentes de variacin pueden
sumarse para explicar la variabilidad entre las observaciones. De
este modo,
cualquier unidad experimental puede considerarse como una suma de componentes a
travs de un modelo lineal aditivo. Un caso comn de no aditividad se presenta cuando
los efectos son de tipo multiplicativo. La falta de aditividad en los efectos conduce a
cierto grado de heterogeneidad en el error, no permitiendo estimar una varianza comn
para todos los tratamientos, por lo cual puede ocasionar niveles falsos de significancia
para la comparacin de los efectos de tratamiento. La falta de aditividad puede
probarse mediante el mtodo propuesto por Tukey (1949).
Normalidad. Los errores experimentales y por lo tanto las observaciones deben
presentar distribucin normal. Este supuesto se requiere para sustentar las
pruebas de hiptesis y los intervalos de confianza aunque no es necesario para
la estimacin de las varianzas. Afortunadamente en la mayor parte de los
casos prcticos este supuesto se cumple en forma aproximada, lo cual se
debe a que la distribucin normal es muy comn en la naturaleza,
especialmente cuando se estudian variables continuas, adems, el teorema del
lmite central permite aproximar a la normal la mayor parte de los promedios.
Independencia. Se supone que los errores que afectan las unidades
experimentales son independientes. La distribucin al azar (aleatorizacin) de
los tratamientos sobre las unidades experimentales (teniendo en cuenta las
restricciones de cada diseo), se considera como una medida adecuada para
garantizar este supuesto.
Homogeneidad de varianzas. Supone que las varianzas dentro de cada
tratamiento son homogneas, o sea que constituyen estimaciones de una
varianza comn de errores.
Cuando se presenta la heterogeneidad de varianzas puede ser de dos tipos, regular o
irregular. En el tipo regular generalmente existe cierta relacin funcional entre las
medias de los tratamientos y las varianzas, por ejemplo en las ciencias biolgicas se
encuentra con alguna frecuencia una correlacin positiva entre la media y la varianza, o
sea que grupos de organismos con medias grandes tienden a tener varianzas grandes
y viceversa. Este problema puede solucionarse aplicando una transformacin
apropiada a los datos, de tal manera que en la variable transformada resulten
independientes (o casi independientes) estos parmetros.
En el tipo irregular, ciertos tratamientos poseen considerablemente mayor variacin que
otros sin que exista una relacin clara entre media y varianzas. En este caso a veces
es posible descartar ciertos tratamientos

responsables de la heterogeneidad y analizar los restantes o dividir el error en grupos y


hacer las comparaciones entre los tratamientos de cada grupo donde las varianzas
resulten homogneas.
Para verificar si se cumple el supuesto de homogeneidad de varianzas se han
propuesto diferentes pruebas, tales como la de Hartley descrita en forma detallada por
Gill (1978) que involucra la relacin entre la varianza mayor y la varianza menor de los
diferentes grupos. Sin embargo la ms generalizada es la de Barlett (1937) que puede
utilizarse para tratamientos con desigual numero de replicaciones.
Anlisis de Covarianza
El anlisis de covarianza es un procedimiento muy importante en experimentacin.
Utiliza el anlisis de varianza y el de regresin para eliminar la variabilidad que existe
en la variable independiente X; tambin ajusta medias de tratamiento y as estima
mucho mejor el efecto de la variable independiente X sobre la variable dependiente Y.
El anlisis de covarianza trata de dos o ms variables medidas y donde cualquier
variable independiente medible no se encuentra a niveles predeterminados, como en
un experimento factorial. Este aparte trata de la covarianza lineal. A menudo, una
relacin lineal es una aproximacin razonablemente buena para una relacin no lineal
con tal que los valores de las variables independientes no cubran un intervalo muy
amplio.
La variable independiente X es una observacin hecha en cada unidad experimental
antes de aplicar los tratamientos, e indica hasta cierto grado la respuesta final Y de la
unidad experimental. Por ejemplo, en un experimento con cerdos se tienen pesos
iniciales X, y consumo de alimento Y; si se hubieran usado varias raciones las
diferencias entre sus efectos podran o no ser significativas, es decir, puede o no haber
diferencias en cuanto a la calidad de las raciones. Sin embargo, antes de llegar a
conclusiones hay que preguntarse, de existir la variacin de los pesos iniciales de las
camadas, la diferencia en los pesos finales de los cerdos se puede atribuir a la bondad
de alguna de las raciones?, O alguna parte en las diferencias en los pesos finales se
debe a la diferencia en los pesos iniciales de dichas camadas? Con respecto a esta
ltima pregunta se sabe que los lechones de mayor peso al nacer son ms agresivos
y, en consecuencia, consumen mayor cantidad de alimento y aumentan de peso con
mayor facilidad que los lechones pequeos de poco peso.
Al ajustar los valores de Y, de acuerdo con los valores correspondientes de X, es
posible analizar con mayor precisin los resultados del ensayo. Por medio del anlisis
de covarianza se puede calcular y eliminar la parte correspondiente a las diferencias en
los pesos iniciales. En general, en ensayos de alimentacin con animales, las
diferencias entre medias de tratamiento no ajustadas se deben al valor nutritivo de las
raciones, a la cantidad consumida por los animales, o a ambas causas. Si se ajustan
las diferencias de aumento de peso a un peso inicial comn y se aplican las raciones,
las medias ajustadas indicaran si en realidad las dietas tienen valor nutritivo diferente.

Usos del anlisis de Covarianza


Los usos ms importantes del anlisis de covarianza son:
1. controlar el error y aumentar la precisin
2. Ajustar medias de tratamientos de la variable dependiente a las diferencias en
conjuntos de valores de variables independientes correspondientes.
3. Ayudar en la interpretacin de los datos, especialmente en lo concerniente a la
naturaleza de los efectos de los tratamientos.
4. Particionar
componentes.
5.

una covarianza total o suma de productos cruzados en

Estimar datos faltantes.

Diseo de experimentos
El experimento y sus elementos
Qu es un experimento?
Experimento, tiene dos acepciones, una general y una particular. La regla general se
refiere a "tomar una accin" y despus observar las consecuencias. Se requiere la
manipulacin intencional de una accin para analizar sus posibles efectos y la
aceptacin particular (sentido cientfico). "Un estudio de investigacin en el que se
manipulan deliberadamente una o ms variables independientes (supuestas efectos),
dentro de una situacin de control para el investigador".
Cul es el primer requisito de un experimento puro?
El primer requisito es la manipulacin intencional de una o ms variables
independientes. La variable independiente es considerada como supuesta causa en
una relacin entre variables; es la condicin antecedente, y al efecto provocado por
dicha causa se le denomina variable dependiente (consecuente). El investigador no
puede incluir en su estudio a dos o ms variables independientes.
Un experimento se lleva a cabo para analizar si una o ms variables independientes
afectan a una o ms variables dependientes y por qu lo hacen. En un autntico
experimento, la variable independiente resulta de inters para el investigador por ser la
variable hipottica, que ser una de las causas que producen el efecto supuesto. Para
obtener respuesta de esta relacin causal supuesta, el investigador manipula la
variable independiente y observa si la dependiente vara o no. Manipular es hacer
variar o dar distintos valores a la variable independiente.

La variable dependiente se mide, no se manipula. Se mide para ver el efecto de que la


manipulacin de la variable independiente tiene de ella.
La manipulacin o variacin de una variable independiente puede realizarse en dos o
ms grados. El nivel mnimo de manipulacin es dos: presencia-ausencia de la variable
independiente. Cada nivel o grado de manipulacin implica un grupo en el experimento.

Presencia-ausencia implica, un grupo a la presencia de la variable independiente y otro


no. Luego los dos grupos son comparados para ver si el grupo que fue expuesto a la
variable independiente difiere del grupo que no fue expuesto. Al primer grupo se le
conoce como "grupo experimental" y al segundo se le denomina "grupo de control".
A la presencia de la variable independiente se le llama "tratamiento experimental" o
"estmulo experimental".
En general, en un experimento puede afirmarse lo siguiente: si en ambos grupos todo
fue "igual" menos la exposicin a la variable independiente, es muy razonable pensar
que las diferencias entre los grupos se deban a la presencia-ausencia de la variable
independiente.
Manipular la variable independiente en varios niveles tiene la ventaja de que no slo se
puede determinar si la presencia de la variable independiente o
tratamiento
experimental tiene un efecto, sino tambin si distintos niveles de la variable
independiente se producen diferentes efectos. Es decir, si la magnitud del efecto (Y)
depende de la intensidad del estmulo (X1, X2, X3, etctera). Debe haber al menos dos
niveles de variacin y ambos tendrn que diferir entre s. Cuantos ms niveles mayor
informacin, pero el experimento se va complicando: cada nivel adicional implica un
grupo ms.
En ocasiones, la manipulacin de la variable independiente conlleva una combinacin
de cantidades y modalidades de sta. Finalmente, es necesario insistir que cada nivel o
modalidad implica, al menos, un grupo. Si tiene tres niveles (grados) o modalidades,
se tendrn tres grupos como mnimo.
Experimento aleatorio.
La investigacin en las ciencias agropecuarias se caracteriza en parte porque se puede
repetir bajo las mismas condiciones siguiendo un procedimiento estndar. En el caso
de la aplicacin de un insumo (nutrimento, fungicida, fitohormona, etc.) a una especie
vegetal. De la nica forma como un investigador puede obtener informacin de tal
accin es inmediata la ejecucin de un EXPERIMENTO. Cada experimento termina
con un resultado, pero la caracterstica de estos
experimentos es que el resultado final no se puede predecir con seguridad, sino hasta
la realizacin del experimento.

Esta clase de experimento, con tres caractersticas esenciales: repeticin bajo las
mismas condiciones, desconocimiento del resultado final y conocimiento de todos los
posibles resultados antes de la ejecucin del experimento, se conoce como
experimento aleatorio.
El propsito fundamental de la estadstica es el de proveer modelos matemticos para
estos experimentos aleatorios. Una vez que se provee el experimento aleatorio de tal
modelo, el estadstico y el investigador puede realizar la inferencia (induccin
deduccin), acerca del experimento aleatorio en cuestin. Un alto porcentaje de la
generacin de tecnologa en las ciencias agropecuarias est basado en experimentos
aleatorios. Con estas notas se buscar fundamentalmente, establecer los diferentes
modelos estadsticos que se adecuan a este tipo de experimentos.
Adems de la caracterizacin del experimento aleatorio. Se define el concepto de
experimento como tal. La palabra EXPERIMENTO, para nuestro propsito, es un
ensayo fsico, planeado con el fin de confirmar los resultados de experimentos
anteriores o como resultado de la formulacin de una hiptesis a ser probada mediante
procedimientos experimentales. Con los experimentos se genera la tecnologa, los
cuales contribuyen a la solucin de los problemas del sector agropecuario.
Los experimentos, en general se pueden dividir en tres amplias categoras, as:
bsicos, crticos y demostrativos. En un experimento bsico el investigador prueba un
gran nmero de tratamientos con el objetivo de tener gua para trabajos futuros o bien
es aquel que conduce a la obtencin de nuevos conocimientos a partir de los cuales se
desarrolla la investigacin aplicada.
En experimentos crticos, el investigador compara la respuesta diferentes tratamientos,
usa un mayor nmero de observaciones para asegurar mas la bondad de un conjunto
de tratamientos sobre otro conjunto particular, se busca obtener conocimiento de
origen: nuevos insumos, bienes o servicios, los cuales conducen a que se incorpore
una tecnologa y practicas adecuadas dentro de los diferentes sistemas de produccin.
Los demostrativos ocurren ya con agentes de extensin donde se compara lo obtenido
en una granja experimental contra un estndar regional de amplio uso; es una etapa
fundamental dinmica y se basa en adecuar la tecnologa bsica a nivel de los
sistemas de produccin local.
Se puede agregar que cada experimento es un conjunto de respuestas a una o ms
preguntas. Con esto en mente el investigador decide qu comparacin de tratamientos
produce la informacin ms relevante. Se conduce entonces un experimento para
medir o probar hiptesis sobre diferencias entre los tratamientos bajo condiciones
comparables, se toman observaciones y medidas sobre el material experimental.
En general, el objetivo de un experimento agropecuario o ambiental es obtener
informacin (datos) que resuelva un limitante tecnolgico en una especie animal,
vegetal parmetro ambiental o dar solucin a un interrogante ya planteado en
investigaciones anteriores. En consecuencia, un buen diseo experimental es el

resultado de un anlisis muy preciso del problema o limitando tecnolgico. Al


estadstico con frecuencia se le solicitara asesora para hacer inferencias (inducciones
y deducciones) de los resultados experimentales. Puesto que las inferencias que se
puedan hacer dependen solamente de la forma como se ejecuto el experimento, el
asesor requerir de una descripcin detallada del ensayo y sus objetivos. Entonces es
posible que no se puedan hacer las inferencias requeridas y aquellas variables no
responden a los interrogantes planteados por el investigador; es decir, un refinamiento
que se proponga en la tcnica estadstica, no sustituye la claridad que se tenga a la
problemtica. La estadstica provee de herramientas que facilitan y otorgan medios a la
solucin del interrogante planteado, pero no que decida sobre el problema como tal.
En un diseo de experimentos, se establecen los objetivos, se clasifican los
interrogantes, se plantean las hiptesis, se estiman los efectos, se jerarquizan los
objetivos y finalmente con base al anlisis se producen las recomendaciones.
ORIENTACIONES GENERALES EN LA EXPERIMENTACION AGRICOLA
En la planificacin agrcola o biolgica y en el desarrollo de una investigacin en
particular, son de inters las siguientes aspectos:
a.

Especificar los problemas, con el fin de probar hiptesis o encontrar respuestas. Es


necesario considerar que los experimentos sean:
Experimentos simples, cuando se estudia un solo factor de variacin; por
ejemplo, probar cinco variedades de sorgo, estudiar cinco dosis de nitrgeno en
trigo, etc.
Experimentos factoriales, cuando se estudian simultneamente dos o ms
factores que influyen en la produccin; por ejemplo, estudiar tres
variedades, cada una sembrada a tres densidades de siembra, o bien tratamientos de
fsforo, nitrgeno y potasio, cada uno a cuatro dosis por unidad de superficie.

b.

Ubicar el lugar adecuado para la realizacin de los experimentos, para lo cual se debe
elegir una localidad accesible y representativa de reas agrcolas, de suelo uniforme,
con unidades experimentales lo ms uniforme posible, y escoger el material
adecuado para experimentos, de manera que pueda estratificarse (agruparse
unidades experimentales con caractersticas homogneas) el terreno correctamente
para formar grupos uniformes y de fcil manejo.

c.

Reducir las fuentes de error, tanto del experimento como de aquellos errores o
equivocaciones operacionales. Es muy importante que en la seleccin de datos,
muestreo, etc., el personal responsable est constituido por tcnicos o personas con
entrenamiento.

d.

Mantener constante los diversos factores que pueden afectar a la produccin o a la


calidad del producto, de manera que los nicos factores de variacin sean los
tratamientos objeto de estudio.

e.

Extremar precauciones y ser cautos en los resultados experimentales, considerando


que un experimento es una observacin de una muestra en una poblacin de
experimentos.

f.

Repetir experimentos uniformes en diferentes localidades, suelos y aos.

g.

Tener conocimiento de la tecnologa de campo y saber cules son los problemas del
productor.
En la planeacin o diseo de un experimento agronmico, es necesario aplicar un
conjunto de disciplinas y conocimientos biolgicos con el fin de encontrar una
respuesta correcta a un problema especfico. Por ejemplo, si se comparan diversas
variedades de trigo, todos los factores de la produccin que influyen en el
comportamiento de las variedades deben permanecer constantes y las nicas fuentes
de variacin o diferencias sern presentadas por las variedades de trigo, si tales
fuentes existen. Para lograr lo anterior, es necesario contar con ciertos conocimientos
sobre:
a) Suelos, a fin de elegir el terreno ms uniforme y adecuado para realizar el
experimento.

b) Fertilizacin, para cuando sea necesario planear experimentos

con

fertilizantes qumicos orgnicos o abonos orgnicos.


c) Topografa e hidrulica, para trazar parcelas, niveles, riegos, etc.
d) Especialidades afines como: Botnica, entomologa, fitopatologa, fisiologa,
gentica, ecologa, etc. para poder trabajar con seres vivos.
e) Tecnologas de Cultivos, sistemas agroforestales,
zootecnia, para manejar las unidades experimentales.

agrosilvo pastoriles y

f) Estadstica (biometra o bioestadstica), para evaluar y separar las diversas


causas de variacin y para realizar la interpretacin de los resultados
experimentales.
Pasos al planear un experimento:
El mtodo cientfico sugiere que en el planeamiento de la experimentacin se debe
tener presente las siguientes etapas:
Definir el problema: En esta etapa se debe determinar los antecedentes,
importancia, objetivos, hiptesis a probar y revisin de la bibliografa.
Planeamiento y diseo del experimento: En esta etapa se debe tener en cuenta:
Lugar de ejecucin del experimento, tamao de la parcela o unidad
experimental, nmero de repeticiones por tratamiento, equipos e instrumentos a
utilizar y mtodos de evaluacin de los resultados
Ejecucin del experimento.

Recoleccin de datos del experimento.


Ordenamiento de la informacin experimental.
Discusin de los resultados obtenidos.
Anlisis econmico de los tratamientos que se probaron y utilidad prctica.
Conclusin final y recomendacin.
Diseo experimental.
Kempthorne (1952) plantea que el experimento general del mtodo cientfico es
formular hiptesis y despus verificarlas mediante la experimentacin o medir sus
consecuencias. Para hacer la verificacin se requiere de la observacin y es el diseo
de experimentos quien seala la forma como provienen esas observaciones. El diseo
experimental permite establecer si una hiptesis puede ser verificada o no, de si las
observaciones que se toman son relevantes con la hiptesis y capaces de dar las
respuestas correctas a lo que se plantea. Observaciones que se toman de cierta forma
no proveen la informacin necesaria para probar una hiptesis, mientras que si se toma
de otra forma sirven para la verificacin de la hiptesis. Kempthorne, agrega que una
investigacin estadsticamente diseada consistira de los siguientes pasos:
1-

Establecer el roblema. 2- Formular las hiptesis.

3-

Sealar la tcnica y el diseo experimental.

4-

Examinar los posibles resultados y revisar las razones del problema, para asegurarse
de que el experimento le provee de la informacin adecuada a sus interrogantes.

5-

Considerar los resultados desde el punto de vista de los procedimientos estadsticos


que serian aplicados, para asegurarse de las condiciones necesarias para que estos
sean validos.

6-

Realizar el experimento.

7-

Aplicar las tcnicas estadsticas de los datos experimentales.

8-

Obtener conclusiones, de acuerdo con la estimacin estadstica que se haga; se debe


tener consideracin cuidadosa de la validez de las conclusiones de acuerdo con la
poblacin para la cual se aplica.

9-

Evaluacin de toda la investigacin, especialmente con otras investigaciones realizadas


con el mismo o problemas similares.
Por diseo experimental se entender la forma o procedimiento de cmo se asignan los
tratamientos a las unidades experimentales o bien la restriccin que se hace al asignar
los tratamientos a las unidades experimentales.

Unidad experimental y tratamiento


Una unidad experimental es una unidad material (fsica biolgica) a la cual se aplica un
tratamiento el tratamiento es un procedimiento o estimulo, cuyo efecto se desea medir
o comparar con otra serie de tratamiento.
La unidad experimental puede ser un animal (vaca, novilla, pollo, rbol, muestra de
agua, muestra de suelo, etc.) o grupo de las anteriores especies, una parcela, plantas
de maz, frjol, naranja, etc. Al seleccionar un conjunto de tratamientos es importante
definirlos clara y precisamente con cada uno de ellos y considerarlos uno con respecto
a los dems y as dar una respuesta eficiente a los objetivos de experimentacin.
Error experimental
En general una caracterstica de las unidades experimentales usadas en
investigaciones agropecuarias, es la variacin existente en las unidades cuando se
ejecutan las medidas pertinentes. La variabilidad de las unidades experimentales en las
ciencias agropecuarias es el producto de su misma constitucin: son seres vivos y en
ellos su condicin natural es la variabilidad, dinmicos en su expresin, los resultados
finales de un experimento son inciertos, se requiere de la probabilidad para medir su
incertidumbre y en consecuencia de modelarlos a travs de los as llamados
experimentos aleatorios. A esta variabilidad Cochran y Cox (1952) la denominaron
variabilidad inherente o propia del material experimental. La incertidumbre del resultado
final o variabilidad propia de las unidades experimentales, se conoce estadsticamente
como error experimental. Tambin se interpreta como error experimental al hecho por el
cual las unidades experimentales no producen los mismos resultados aun as estn
tratadas igualmente y manejadas bajo las mismas condiciones experimentales. Existe
otra variabilidad en la experimentacin agropecuaria y es la resultante de no conducir
tcnica o adecuadamente el experimento, son los errores de medicin, de atencin, de
la falla en la tcnica experimental de campo o laboratorio que ocurre al desarrollo de
un experimento. Es de vital importancia hacer todos los esfuerzos posibles para reducir
el error experimental, para mejorar as la eficiencia de la investigacin y asegurar el
xito de la misma. Esto se puede obtener si se considera:
1-

Tomar material experimental en el cual la variabilidad que lo caracteriza sea mnimo.

2-

Refinar la tcnica experimental de campo o laboratorio.


Replicacin y su funcin
Cuando un tratamiento se aplica ms de una vez, se dice que el tratamiento se ha
replicado.
Las funciones de la replicacin son:

1-

Proveer de un estimativo del error experimental.

2-

Mejorar la precisin del experimento al reducir el error estndar del promedio de un


tratamiento.

3-

Aumentar el alcance de la inferencia del experimento, seleccionar y usar el nmero


apropiado de unidades experimentales.
La estimacin del error experimental es necesaria para ejecutar las pruebas de
hiptesis y para establecer los intervalos de confianza para los promedios. Un
experimento en el cual el tratamiento aparece solo una vez se dice que es un
experimento y una replicacin o repeticin; de este experimento no se logra una
estimacin del error experimental; aqu es posible observar la diferencia entre
tratamientos es debida a la naturaleza de una unidad experimental. En otras palabras,
cuando no exista un, mtodo de estimar el error experimental no hay forma de
determinar si las diferencias observadas son debidas a los tratamientos o son causa de
la estructura de la unidad experimental.
Cuando el nmero de replicaciones se incrementa, los estimadores de los promedios
son ms precisos, as si n aumenta y el error tiende a decrecer.
En cierto tipo de experimentos, la replicacin indica un enlace mayor de la inferencia
estadstica. Por ejemplo, deseamos saber si existe un efecto real de un nutriente sobre
dos razas diferentes. Si el objetivo del experimento es sacar conclusiones sobre ambas
razas, es obvio que dichas razas deben estar en un periodo de aos. La razn es obvia
puesto que las condiciones varan de un ao a otro y es importante conocer el efecto
de los aos sobre los diferentes tratamientos, puesto que las recomendaciones
usualmente son hechas para los aos futuros. Igualmente se usan diferentes
localidades para evaluar los tratamientos bajo los diferentes ambientes. Las
replicaciones en el tiempo (aos) y en el espacio (localidades) son consideradas como
repeticiones y su propsito es el de aumentar el alcance de la inferencia. Los mismos
principios se usan con frecuencia en experimentos de laboratorio.
Control del error experimental.
El error experimental puede ser disminuido mediante los siguientes pasos:

1.

1.
Diseo experimental.
2.
Uso de informacin adicional.
3.
Tamao y forma de la unidad experimental.
El uso del diseo experimental como un medio de reducir el error experimental ha sido
ampliamente investigado desde los aos veinte del ao actual. Esta es una materia de
alta discusin y solo se presenta y solo se presentan principios bsicos. Para ver
Cochran y Cox, Federer y Kempthorne.
El control del error por medio del diseo consiste en planear de tal forma que la
variacin natural en las unidades experimentales no contribuyan a falsear la diferencia
debido a tratamientos cuando, por ejemplo, las unidades experimentales se agrupan en
bloques (un bloque que posea todos los tratamientos), de tal forma que la variacin

entre las unidades del bloque sea menor que entre bloques, la precisin del error
experimental incrementa. Tales bloques se denominan replicaciones. El error
experimental se basa el la variacin de las variacin de las unidades dentro del bloque,
puesto que la variacin entre bloques puede ser eliminada.
Cuando el nmero de tratamientos se aumenta, el nmero de unidades por bloque se
incrementa.
Ciertos diseos permiten dividir los bloques en sub-bloques los cuales poseen una
porcin total de tratamientos. Tales diseos se denominan diseos de bloques
incompletos donde la precisin de ciertas comparaciones se incrementa a expensas de
otras
2.

Uso de informacin adicional. En muchos experimentos la precisin se puede aumentar


mediante el uso de una tcnica estadstica llamada covarianza.
Unos de los principales ejemplos de covarianza es el peso inicial de los animales, la
edad de los animales y el nmero de partes al inicio del ensayo.

3.

Tamao y forma de la unidad experimental. El tamao ptimo de una parcela en la


experimentacin de un cultivo particular depende de factores como la forma de la
variabilidad del suelo y el costo de los procedimientos experimentales, los cuales son
determinados por los tratamientos, se debe agregar que existevariacin de ao a
ao en las parcelas donde se experimenta, como resultado de las condiciones ambientales
que interactan con la fertilidad natural de las parcelas.

En los experimentos agronmicos existen los llamados ensayos en blanco o de


uniformidad los cuales conducen a determinar el tamao y la forma de la parcela
experimental, al igual que el nmero de repeticiones. Otros factores de importancia
son la clase de cultivos, el nmero de variedades o tratamientos, clase de maquinaria
agrcola a usar, costo de mano de obra y presupuesto con que se cuenta.
Parcelas pequeas serian convenientes, cuando un nmero alto de tratamientos se
estn comparando, o cuando por ejemplo se dispone de muy poca cantidad de
semillas.
Seleccin de tratamientos
En casi la totalidad de las investigaciones agropecuarias y ambientales (variables
biolgicas), los tratamientos son los entes que van a solucionar los limitantes
tecnolgicos planteados en el estudio; son hasta cierto punto la hiptesis o supuestos
del problema. En consecuencia, son muy importantes en el concepto de la
investigacin; se requiere un serio anlisis para su seleccin, debe dedicarse un buen
tiempo de reflexin, revisin bibliogrfica, para tener antecedentes de los mismos y as
hacer una buena decisin de aquellos que hagan parte de la experimentacin final. El
investigador debe plantearse una pregunta como: es necesario testigo?, Cul?, el
del productor convencional?, el comercial?, se adiciona o sustrae A o B tratamientos,
se resuelven las hiptesis planteadas?, o hacen ms complejos los interrogantes?.

La consulta al estadstico, en esta etapa de la experimentacin, es de fundamental


importancia y de gran ayuda para el investigador.
La seleccin de tratamientos es substancial para la precisin y conclusiones a llegar;
en general, es el investigador quien mejor conoce sus tratamientos, este conocimiento
es el que ayuda a menudo a decidir sobre la cantidad de dosis de un tratamiento
particular.
Tcnica experimental de campo
Una tcnica cuidadosa en la conduccin fsica del ensayo es bsica para las
conclusiones y recomendaciones finales del mismo. Es la responsabilidad del
investigador que cada paso de la experimentacin debe ser ejecutado con el mayor
cuidado posible para asegurarse as de buenos resultados. En general, la variacin
resultante de la no atencin adecuada del experimento no es una variacin aleatoria
por tanto no sujeta las leyes de probabilidad en las cuales esta basada la inferencia
estadstica. Esta variacin puede denominarse incapacidad tcnica, en contraste con
las variaciones mencionadas. Entonces se debe ser cuidadoso en:

Tener unidades uniformes en el caso de que el diseo as les exija.

Precisin en las cantidades de raciones o fertilizantes al suministrarlas a las unidades


experimentales.

Es fundamental el manejo uniforme a todo grupo de unidades del experimento.

Asegurarse en que los tcnicos ejecuten las medidas con la precisin necesaria.

Tomar las observaciones en el momento adecuado y preciso (las plantas y los animales
no tienen das festivos)

Asegurarse de que se transcriban correctamente las informaciones tomadas.


Aleatorizacin
La principal funcin de la aleatorizacin es la de proporcionar estimadores insesgados
para los promedios y la validez de las pruebas de hiptesis. La aleatorizacin es una de
las nuevas caractersticas de los modernos diseos experimentales. La idea y
estructuracin de la misma se debe a Fisher. Generalmente envuelve procedimientos
como el lanzamiento de una moneda, o el uso de tablas de nmeros aleatorios y se
define como el procedimiento mediante el cual se asignan los tratamientos a las
unidades experimentales segn el diseo empleado.
Hay que tener en cuenta que cada tratamiento debe tener igual oportunidad de ser
asignado a cualquier unidad experimental, sea ella favorable o no. Cochran y Cox
sealan: la aleatorizacin es anloga a un seguro, en el sentido de que es una
precaucin contra eventualidades que pueden o no ocurrir y que pueden ser o no
serias si ocurren.
La Idea De Significancia Estadstica

Pearse (1976) presenta el siguiente razonamiento al trmino estadstico significativo y


no significativo. Suponga que en un experimento se encontraron diferencias
estadsticas al nivel del 1%. Esto entonces significa que el investigador tiene que
escoger una de dos alternativas completamente incompatibles y tiene que aceptar que
la diferencia se debe al efecto de los tratamientos o que el resultado es una
coincidencia de uno en cien. En efecto, un nivel de significancia indica que una
probabilidad muy baja de que tal coincidencia ocurra, lo cual es diferente a lo que se
espera como resultado de tratamientos.
Para mayor claridad, significativo al 1% no quiere decir que existe una probabilidad del
99% de que las diferencias corresponden a lo encontrado en el experimento.
Por otra parte, cabe anotar que la seleccin que haga el investigador depender de la
naturaleza de los tratamientos y de sus conocimientos. As por ejemplo suponga que a
un grupo de plantas se les ha humedecido un tratamiento y que estas produjeron ms
que el grupo control. Si dicho tratamiento hubiese sido una invocacin y una danza
ritual a la diosa luna un investigador podra en algn momento pensar en la invocacin
y danza ritual a la diosa luna como explicacin al mayor rendimiento.
El investigador dara el redimiendo por la aplicacin de sulfato de amonio y no por la
invocacin claro que es visto que las dos razones tienen su interpretacin. En general
si (p < 0,05) la evidencia en favor de una diferencia verdadera, es suficientemente
fuerte para merecer su publicacin.
1.

si (p < 0,01) el efecto se considera bien establecido.

2.

si (p < 0,001) la evidencia se considera como real

Modelo estadstico
TIPOS DE MODELOS ESTADISTICOS
De acuerdo a la seleccin de los tratamientos y otros factores se tiene la siguiente
clasificacin:
Modelo I (Efectos Fijos):
Se presenta cuando los tratamientos y dems factores que intervienen en un
experimento son fijados por el investigador; es decir, no se efecta una eleccin
aleatoria. En estos casos las conclusiones del anlisis de variancia solamente son
vlidas para los tratamientos y otros factores usados en el experimento. En el presente
trabajo se ha considerado nicamente el caso de modelo de efectos fijos, por ser el que
se presenta con mayor frecuencia en la experimentacin agraria.
Modelo II (Efectos aleatorios):

Se presenta cuando los tratamientos y dems factores que intervienen en un


experimento son elegidos al azar de una poblacin. En estos casos las conclusiones
del anlisis de variancia son vlidos, tanto para los tratamientos y dems factores
usados, asi como para todas las poblaciones de tratamientos y factores.
Modelo III (Modelo Mixto):
Este modelo es la combinacin de los dos anteriores y se presenta cuando algunos
factores son fijados y otros son elegidos al azar. En estos casos las conclusiones del
anlisis de variancia se- rn vlidas para toda la poblacin de factores cuando estos
son elegidos al azar, y solamente para los factores usados cuando estos son fijados
SUPUESTOS ACERCA DEL MODELO ESTADISTICO
Los supuestos necesarios del modelo estadstico son:
Aditividad: Los factores o componentes del modelo estadstico son aditivos, es
decir la variable respuesta es la suma de los efectos del modelo estadstico.
Linealidad: La relacin existente entre los factores o componentes del modelo
estadstico es del tipo lineal.
Normalidad: Los valores resultado del experimento provienen de una
distribucin de probabilidad Normal con media
y variancia 2 .
Independencia: Los resultados
independientes entre s.

observados

de

un

experimento

son

Variancias Homogneas (Homocedasticidad): Las diversas poblaciones


generadas por la aplicacin de dos o ms tratamientos tienen variancias
homogneas (variancia comn).

Transformacin de datos
La razn principal de la transformacin de datos es que de llevarse a cabo un anlisis
esta- dstico con resultados que no cumplan con los supuestos acerca del modelo
estadstico, se puede llegar a una conclusin equivocada.
Un cambio de escala puede variar la media y la variancia de la variable as como su
relacin con respecto a otras variables. La forma de la distribucin de una variable
cambia con la escala. Mediante una transformacin adecuada puede conseguirse que
un variable que no se distribuye normalmente pase a tener una distribucin casi
normal. Las poblaciones con variancias desiguales pueden convertirse en
homocedsticas (variancias homogneas) mediante una transformacin apropiada.
Las transformaciones ms usadas son:
a. Transformacin logartmica

El modelo lineal (por ejemplo Yij = + i + j + eij) indica que el efecto del bloque , el
efecto del tratamiento y el error experimental, son todos ellos aditivos. Si los bloques y
los tratamientos aumentan o disminuyen las mediciones en un determinado porcentaje
en lugar de una determinada cantidad, entonces se dice que los efectos son
multiplicativos y no aditivos. En estos casos, una transformacin logartmica
transformar en aditiva la relacin multiplicativa y en consecuencia el modelo lineal
podr ser aplicado a los nuevos datos.
Para ciertos tipos de anlisis, el investigador prefiere la escala que elimina las
interacciones mientras que para otras puede preferir la escala que restituye los efectos
lineales. Lo que hay que recordar es que la relacin entre las variables est muy
influenciada por las escalas con las que se miden dichas variables. Las
interpretaciones de los datos slo son vlidas en relacin con la escala particular
adoptada en un caso determinado.
b.Transformacin de la raz cuadrada
Cuando los datos estn dados por nmeros enteros procedentes del conteo de objetos,
como por ejemplo el nmero de manchas en una hoja o el nmero de bacterias en una
placa, los nmeros observados tienden a presentar una distribucin de Poisson ms
que una distribucin normal. Las consideraciones tericas conducen a la
transformacin de la raz cuadrada de los nmeros observados. Normalmente esta
transformacin determina que las variancias de los grupos sean ms iguales. Tambin
es aplicable a las distribuciones sesgadas puesto que acorta la cola larga.
Si y es el nmero observado, para el anlisis estadstico y la prueba de significacin
utiliza- remos y1/2 . Cuando los nmeros observados son pequeos (de 2 a 10), se
prefiere la transformacin (y+0.5)1/2, en especial cuando algunos de los nmeros
observados son cero.

Clases de Diseos experimentales


: Diseo Completamente al azar

Caractersticas generales del diseo completamente al azar


En la actualidad los investigadores de las ciencias agrcolas, pecuarias y ambientales
(en general las que tengan estn relacionadas con variables biolgicas) estn
interesados en detectar diferencias estadsticas, tan pequeas como sean posibles.
Para su obtencin se requiere del uso eficiente de diseo experimentales y mtodos
estadsticos, que reduzcan lo ms efectivamente le error experimental. En el logro de
este propsito, el anlisis de varianza es una de las principales herramientas del
investigador. Esta tcnica se aplican en una amplia gama de experimentos, los cuales
van desde la simple comparacin de un par de tratamientos, hasta ensayos ms
complejos que envuelven varios factores como por ejemplo: raza, sexo, ambiente,

manejo, especie, edad, finca, lote. La simple extensin de comparar tres o ms


tratamientos, constituyen el diseo experimental al azar.
El diseo completamente al azar es el ms simple de todos los diseos que se utilizan
para comparar dos o ms tratamientos, dado que solo considera dos fuentes de
variabilidad: Los tratamientos y error aleatorio. Por eso es comn encontrar casos de
uso y abuso de esta diseo en situaciones en las que no eran lo ms adecuado, sobre
todo porque haba la presencia de otras fuentes importantes de variabilidad (Factores
de bloque por ejemplo),por lo que al final se tienen comparaciones burdas y no
confiables de los tratamientos objeto del estudio.
Este diseo se llama completamente al azar por que todas las corridas experimentales
se realizan en orden aleatorio completo, ya que al no haber bloques (generados por
otro factor adicional al factor de inters), no existe ninguna restriccin a la
aleatorizacin. Ms especficamente, si durante el estudio se hacen en total N pruebas
estas se corren al azar, de manera que los posibles efectos ambientales y temporales
se vayan repartiendo equitativamente entre los tratamientos.
Este tipo de diseo es el ms simple de todos y tambin se le conoce con los nombres
de diseo completamente randonizado o diseo completamente aleatorio o diseo de
una sola va. En l se asignan al azar los tratamientos a un grupo de unidades
experimentales previamente determinadas. Asimismo todas las variables, excepto las
que estn en estudio, se mantienen constantes. Sin embargo R. A. Fisher seala que
claramente que este tipo de diseo es inadecuado para muchos problemas de
investigacin, en virtud de que las leyes naturales de hecho son controladas e
influenciadas por causas (variable)
Este diseo se puede aplicar a ensayos de campo cuando se cuente con condiciones
de suele y ambientes relativamente uniformes. Tambin en til en experimentos con
animales cuando existe cierta uniformidad bien sea gentica, por peso, edad, etc.
En general este diseo no es el ms adecuado para la experimentacin de campo con
plantas o animales mayores, pero es el ms funcional para la evaluacin de cierto tipo
de tratamientos en laboratorios e invernadero o cuando dichos tratamientos son
aplicados a unidades experimentales homogneas.
El diseo experimental proporciona el mximo nmero de grados de libertad para la
estimacin del error experimental; adems no requiere estimar datos faltantes; es decir
el diseo puede analizarse con igual nmero de repeticiones por tratamiento (diseo
balanceado) o diferentes nmeros de repeticiones por tratamiento (diseo
desbalanceado).
Ventajas

No tiene lmite en el nmero de tratamientos (tres o ms), segn se hayan planteado


los objetivos de la investigacin.
El nmero de repeticiones puede variar dentro de cada tratamiento, aunque es
preferible que el nmero sea igual.

El anlisis estadstico es sencillo an cuando se hayan perdido una o ms unidades


experimentales.

En condiciones homogneas, se puede aplicar cuando an cuando el


material experimental es escaso.

En cierta media, aunque puede ser una desventaja en confiabilidad, no


requiere la medicin de variables que influyen sobre los resultados y que
pueden ser costosas o difciles de medir por el uso de equipos o materiales
especializados.
Desventajas

La principal desventaja consiste en que a veces resulta ineficiente ya que


toda la variabilidad resulta de unidades experimentales (exceptuando los
tratamientos) y esta pasa a formar parte del error experimental.

El grado de precisin de los resultados se pueden reducir por el efecto de


aleatorizacin de las unidades experimentales, evitando que los tratamientos
sean aplicado a unidades similares u homogneas.

Cuando el investigador no tiene experiencia en la decisin del modelo


(diseo) a aplicar, tiende a tomar como nica alternativa el Diseo
completamente al alzar, sin ser el ms confiable para el tipo de
experimentacin propuesta. En estos casos, se puede desconfiar de los
resultados y creer que es el mtodo el ineficiente, cuando realmente es que
se ha tomado la decisin errada en la seleccin de mtodo base de
experimentacin.
Modelo estadstico
Para este tipo de diseo (con igual o diferente nmero de repeticiones) se
plantea estadsticamente el siguiente modelo matemtico:
i

=1,2,..,r

repeticiones
=

1,2,

j
t

tratamientos.
Representa la observacin de la repeticin i-sima en el tratamiento
Es la media global de las poblaciones
combinadas Es el efecto producido por el
tratamiento j-simo Es el error experimental
aleatorio en la observacin

j-simo.

Llmese error a la cantidad en la que cualquier valor difiere de la media de su


grupo y se representa con el smbolo ij. El trmino error no significa
equivocacin. Este trmino se utiliza para referirse a la variacin no
controlada que existe entre los miembros de cualquier poblacin. Dada la
poblacin de plantas de maz para ensilar (72 das), por ejemplo, se sabe que
la altura de algunas plantas est por arriba de la altura media verdadera de la
poblacin, mientras que algunas alturas muestran lo contrario. Esta variacin
se debe a diversos factores hereditarios y ambintales. Si cualquier media de
grupo, j se le agrega un error dado, ij, el resultado ser Yij, la observacin
que se desva de la media del grupo por la cantidad ij.
Diseo en Bloques Completos al azar
Caractersticas del diseo de bloques aleatorizado.
De todos los diseos experimentales que se utilizan en la actualidad, parece ser que el
Diseo de Bloques Completos Aleatorizados es el que hasta ahora se utiliza con
mayor frecuencia. Este diseo fue desarrollado por el ao de 1925 por
R. A. Fisher, quien estaba buscando mtodos para mejorar los experimentos en el
campo de la agricultura. El nombre del diseo refleja su origen en los experimentos
agrcolas, donde la tierra se divida en bloques y stos en parcelas que reciban los
tratamientos bajo investigacin.
El Diseo en Bloques Completos Aleatorizados (DBCA), tambin conocido como
Diseo de Bloques Completamente Randonizados o diseo de dos vas, es un diseo
en el que las unidades experimentales a las que se les aplican los tratamientos, se
subdividen en grupos homogneos llamados bloques, de modo que el nmero de
unidades experimentales en un bloque es igual nmero de tratamientos que se estn
estudiando. Se asigna entonces al azar
los
tratamientos a las unidades
experimentales dentro de cada bloque. Debe tenerse en cuenta que cada tratamiento
aparece en todos los bloques y que cada bloque recibe todos los tratamientos.
El objetivo de utilizar el diseo en bloques completos aleatorizados es aislar y eliminar
del trmino de error la variacin atribuible a los bloques, a la vez que se asegura que
las medias de los tratamientos estn libres de los efectos de bloque. La efectividad del
diseo depende de la habilidad para lograr bloques homogneos de unidades
experimentales. La habilidad para formar bloques homogneos depende del
conocimiento del investigador sobre el material experimental. Cuando el diseo se
utiliza apropiadamente, disminuye el cuadrado medio del error (CMEE) en la tabla
ANAVA, aumenta la Razn de Varianzas (FC) y mejora la oportunidad de rechazar la
hiptesis nula.
En experimentos con animales, si se tiene la sensacin de que las diferentes razas de
animales respondern de manera distinta al mismo tratamiento, la raza del animal
puede utilizarse como factor para formar bloques. Las camadas pueden utilizarse
tambin como bloques, caso en el cual un animal de cada camada recibe un
tratamiento. En experimentos en los que intervienen seres humanos, si se desean

eliminar las diferencias que resultan de la edad, pueden agruparse entonces los
individuos de acuerdo con su edad, de modo que una persona de cada edad reciba
cada tratamiento. El diseo en bloques completos aleatorizados puede utilizarse
tambin convenientemente cuando un experimento debe llevarse a cabo en ms de un
laboratorio (bloque), fincas, zonas, o cuando se requieren varios das (bloques) para
concluirlo.
Se pueden resumir las caractersticas en:

Los BLOQUES son conjunto de unidades experimentales seleccionadas


anterioridad.

con

La variabilidad es minimizada dentro de los bloques (homogeneidad dentro de los


elementos de cada uno) y maximizado entre bloque y bloque (se busca
heterogeneidad).

Los tratamientos se deben aplicar al mismo tiempo en cada bloque y el mismo nmero
de veces.

Los grados de libertad se reducen para controlar el error.

La variabilidad del bloque se elimina a partir del error experimental. Cuando


encontremos mayor variabilidad entre bloques mayor es la posibilidad de encontrar
diferencia entre los tratamientos.

Una vez conformados los bloques es aconsejable manejar cada uno de ellos como una
unidad experimental para mantener su homogeneidad interna.

El nmero de tratamientos debe ser el menor posible.

En posible trabajar con bloques de igual nmero de elementos para evitar la


variabilidad dentro del bloque.

Es bueno diferenciar entre bloques, repeticiones o rplicas: Repeticiones: tiene que ver
con el nmero de repeticiones de los tratamientos en un experimento. Bloques:
implican la agrupacin de unidades y se debe procurar la menor variabilidad dentro de
cada uno.

El nmero de repeticiones es igual al nmero de bloques

En el anlisis de varianza se consideran tres fuentes de variabilidad, el factor de


tratamientos, el factor de bloques y el error aleatorio.
Ventajas
Algunas de las ventajas del diseo en bloques completos aleatorizados comprenden el
hecho de que es fcil de comprender y sencillo de calcular. Adems, ciertas
complicaciones que pueden surgir en el curso de un experimento se resuelven
fcilmente cuando se utiliza este diseo.

En general es posible agrupar las unidades experimentales de modo que se logre


mayor precisin con el diseo completamente aleatorizado.

No hay restriccin en cuanto al nmero de tratamientos o de bloques.


Si se desea
usar repeticiones adicionales para cientos tratamientos, esto se puede aplicar a dos o
ms unidades por bloque con aleatorizacin adecuada para dar un diseo de bloques
completo al azar aleatorizado.

Si faltan datos de unidades individuales pueden estimarse fcilmente de tal manera que
no se pierda la comodidad en los clculos.

Si el error experimental es heterogneo, puede obtenerse componentes no sesgados


aplicables de comparaciones especficas.
Desventajas
La principal desventaja de los bloques completos al azar es que cuando la variacin
entre unidades experimentales dentro de un bloque es grande, resulta un trmino de
error considerable. Esto ocurre frecuentemente cuando el nmero de tratamientos es
grande; as puede no ser posible asegurar grupos de unidades suficientemente
uniformes para los bloques. En tal situacin, se dispone de otros diseos para controlar
una mayor proporcin de la variacin.
Modelo estadstico.
Cuando se decide utilizar un diseo de bloques al azar el experimentador piensa que
cada medicin ser el resultado del efecto del tratamiento donde se encuentre, del
efecto del bloque al que pertenece y de cierto error que se espera sea aleatorio. Si
actuara otro tipo de efecto o factor adicional a estos tres, dicho efecto se carga en el
error, el cual deja de ser aleatorio y como consecuencia puede enmascarar el efecto
del factor de inters al realizar el ANAVA.
Experimentos factoriales
El experimento factorial puede ilustrarse mediante un ejemplo. Considrese un
experimento para evaluar rendimientos de variedades de pastos. En el caso de un solo
factor, todas las variables diferentes a las variables se mantienen tan uniformes como
sea posible, esto es, se escoge un solo nivel de los otros factores. Supngase que
tambin es de inters un segundo factor, distancia entre surcos. Se puede planear
un experimento con dos factores en que los tratamientos consisten en todas las
combinaciones entre las variedades y los espaciamientos elegidos de los surcos, esto
es, cada variedad se encuentra presente en todos los espaciamientos de surcos. En un
experimento de un solo factor, todas las variedades se sembraran a un solo
espaciamiento de un surco, o una sola variedad en todos los espaciamientos entre
surcos. En suelos, puede disearse un experimento para comparar todas las
combinaciones de varios niveles de fertilizante de fsforo y potasio. En un experimento

de nutricin animal, los factores en consideracin pueden ser las cantidades y clases
de suplementos de protenas.
El termino nivel se refiere a los diferentes tratamientos dentro de un factor. Se deriva de
alguno de los primeros experimentos factoriales. Estos trataban de fertilidad de suelos
donde las combinaciones de diferentes cantidades, o niveles, de los diferentes
fertilizantes eran los tratamientos. Hoy esa palabra tiene un sentido ms general, que
implica una cantidad o estado dados de un factor. As, si se comparan 5 variedades de
un cultivo, usando tres diferentes practicas de manejo, el experimento se llama
experimento factorial 5 x 3, con cinco niveles del factor variedad y tres niveles del
factor manejo. El nmero de factores y niveles que pueden compararse en un solo
experimento solo se limita por consideraciones prcticas.
As, un experimento factorial es aquel en el que el conjunto de tratamientos consiste en
todas las combinaciones posibles de los niveles de varios factores. En la palabra
factorial est implicado el concepto de diseo de tratamientos.
Notacin y definiciones
Los sistemas de notacin que se usan en experimentos factoriales son similares, pero
presentan diferencias suficientes como para que el lector tenga que comprobar con
cuidado cuando utilice nuevas referencias. Se sigue una notacin parecida en muchos
aspectos a la sugerida por Yates (1933). Las tres letras maysculas se usan para
designar factores,
Arreglos Factoriales
A los diseos completamente aleatorios, bloques completos al azar, cuadrados latinos,
cuadrados grecolatinos, e hipergrecolatinos se pueden utilizar para estudiar el efecto
de un solo factor y eliminar el efecto de otros factores externos.
A un experimento, con la caracterstica anterior, se lo denominamos experimento
unifactorial. Cuando nos interesa estudiar el efecto simultaneo de dos o ms factores,
con diferentes niveles, a los cuatro diseos anteriores debemos agregarle lo que se
denomina arreglo factorial o simplemente factorial.

Un investigador interesado en conocer, por ejemplo, el efecto de tres factores que


tienen dos niveles, cada uno, tiene que recurrir a los experimentos factoriales. Si
analizamos varios factores simultneamente obtenemos mayor informacin que si
estudiamos los factores en forma individual. Cuando utilizamos los arreglos
factoriales tenemos la oportunidad de analizar las interacciones entre los factores.
Ventajas de la experimentacin factorial cuando los factores son independientes.

Las ventajas de la experimentacin factorial dependen naturalmente de la finalidad del


experimento. Supngase por ahora, que el propsito es investigar los efectos de cada
factor, sobre algn intervalo preasignado que est cubierto por los niveles de ese factor
usados en el experimento. En otras palabras: el objeto es obtener un cuadro amplio de
los efectos de los factores, ms bien que encontrar, por ejemplo, la combinacin de los
niveles de los factores que dan una respuesta mxima. Un procedimiento para esto es
conducir experimentos separados, cada uno de los cuales considere un solo factor.
Otro procedimiento es incluir todos los factores simultneamente por medio de un
experimento factorial.
Si todos los factores son independientes en sus efectos, el mtodo factorial significara
un ahorro considerable de tiempo y material dedicado a los experimentos. El ahorro se
deriva de dos hechos: primero como se ha visto, cuando los factores son
independientes todos los efectos simples de un factor son iguales a su efecto principal,
de tal manera que los efectos principales
son las
nicas cantidades necesarias para describir completamente las consecuencias de las
variaciones en el factor. Segundo, en un experimento factorial cada efecto principal se
estima con la misma precisin que si todo el experimento se hubiese dedicado a ese
solo factor.
Otras Clases de diseos experimentales
Existen otras clases de diseos que sirven de apoyo a la labor investigativa, y su
aplicacin est relacionada con situaciones ms especficas de investigacin. La
bibliografa complementaria amplia las aplicaciones de estos diseos, los cuales se
mencionan de manera bosquejada.
Diseo Cuadrado grecolatino:
Podramos definir un cuadrado grecolatino como el producto de dos cuadrados latinos,
este tipo de producto da origen a un tipo de investigacin entre los especialistas
conocido como teora de grupos de Galois. La cual despus de una amplia
sofisticacin, permite extender los factores no homogneos a los que se deseen. Esta
extensin es muy utilizada en experimentos en gentica y se sale de nuestros
objetivos.
El diseo de cuadrado grecolatino, se considera un diseo de agrupamiento triple,
como producto de la superposicin de dos cuadrados latinos, se denota uno con letras
griegas y otro con letras latinas, de tal modo que el par correspondiente que se obtiene,
no se repite, ni por fila ni por columna.
Diseo Bloques Incompletos
Existen ciertos experimentos, en particular aquellos que se utilizan en fitogentica, que
tienen muchas lneas. Por tal motivo, es necesario encontrar las ms representativas
para cierta zona de estudio. En dichos experimentos se presenta un alto nmero de

tratamientos y es imposible trabajarlos mediante un diseo de bloques completos al


azar, porque no se podra controlar la variacin existente dentro de cada bloque.
Ya se dijo que cuando existe un gran nmero de factores y tratamientos se recurre al
principio de confundido para tratar de confundir varias interacciones, al dividir cada
repeticin en varios bloques incompletos para disminuir la excesiva heterogeneidad
existente en el suelo debido al alto nmero de tratamientos, y as evitar bloques muy
grandes.
Diseo Parcelas Divididas
En la leccin anterior sobre experimentos factoriales, se suponan que el conjunto de
todas las combinaciones de tratamientos se aplicaba a las unidades experimentales de
acuerdo con el proceso de Aleatorizacin apropiado para el diseo completamente
aleatorio, de bloque completos aleatorizados o de cuadrado latino. Pero son posible s
otros procesos de Aleatorizacin. Una de las aleatorizaciones alternas da lugar al
diseo de parcelas divididas, que es una clase especial de diseo de bloques
incompletos. El de parcelas divididas y algunas de sus aplicaciones es el tema
siguiente.
Al aumentar la complejidad de un diseo, disminuyen los grados de libertad del error.
Esto se debe al incremento de las fuentes de variacin de los diseos que repercuten
en los grados de libertad del error.
Al usar el diseo de parcela dividida, los decrementos no suceden para la subparcela o
parcela chica, sino que son iguales a medida que aumentan dichos diseos
experimentales. La razn como se menciono previamente es que la primer aparte del
diseo de parcela dividida es el diseo completamente al azar, bloques al azar o
cuadro latino, y la segunda parte es el arreglo factorial, o sea que la parcela dividida
est formada por un arreglo con su respectiva distribucin.
Bsqueda de unidades perdidas (Mtodo Yates)
Cuando por efectos ajenos al tratamiento nos encontramos con unidades
experimentales perdidas ser necesario calcular estas antes de iniciar el anlisis de
datos. El mtodo considera que si falta una observacin en la variable respuesta,
entonces se debe:
a) Estimar la informacin completa.
b) Imputar el dato faltante.
La justificacin del procedimiento se basa en dos ventajas:
1.

Produce estimaciones correctas va mnimos cuadrados

2.

Se logra una estimacin correcta de la suma de cuadrados de los errores.

Existen varias maneras de calcular las observaciones perdidas a travs de promedios,


ya sean entre bloques, tratamientos o con el total; sin embargo, estos procedimientos
incrementan en gran forma el error, lo cual resta eficiencia en el anlisis de los datos.
El mtodo de YATES, que se definir a continuacin, es el que menos incrementa el
error al calcular los datos faltantes. De acuerdo con este mtodo, cuando falta una
observacin se aplica la formula siguiente:
Cuando falta una observacin.
Donde:
x = la observacin faltante.
b = nmero de bloques.
B = suma de las observaciones presentes en el bloque donde falta la observacin. t =
nmero de tratamientos.
T = suma de las observaciones presentes en el tratamiento donde falta la observacin.
G = suma del total de las observaciones presentes en el cuadro de concentracin
donde faltan la observacin.
Una vez calculado el dato, se sustituye en el cuadro de concentracin para analizar los
datos, reduciendo en uno los grados de libertad del error y del total al efectuar el
anlisis de varianza.
Cuando son dos las observaciones que faltan, estas pueden ser del mismo tratamiento,
del mismo bloque o de diferente bloque y diferente tratamiento.
Cuando faltan dos observaciones del mismo tratamiento:
En este caso se debe definir si los dos datos corresponden a un solo tratamiento, a un
solo bloque o a un tratamiento y un bloque diferentes. Los datos faltantes se catalogan
como x1 y x2; para lo cual:
Si los datos faltantes corresponden al mismo tratamiento. Donde:
T12 = Suma de las observaciones presentes en el tratamiento donde falta x1 y x2. B1 =
Suma de las observaciones presentes en el bloque donde falta x1.
B2 = Suma de las observaciones presentes en el bloque donde falta X2.

Si los datos faltantes corresponden al mismo bloque. Donde:

B12 = total de las observaciones presentes en el bloque donde faltan x1 y x2. T1 =total
de las observaciones presentes en el tratamiento donde falta x1.
T2 = total de las observaciones presentes en el tratamiento donde falta x2
Si los datos faltantes corresponden diferente bloque y diferente tratamiento: Donde:
En muchas situaciones experimentales, la misma unidad experimental recibe dos o
ms tratamientos en periodos diferentes; cuando esto sucede, el diseo experimental
se conoce como crossover, el cual puede estudiarse en Jones & Kenward (2003).

Anlisis estadstico
usos de las comparaciones mltiples de medias
Cuando en el diseo se rechaza la hiptesis nula, parecera innecesario plantear ms
preguntas. Sin embargo, considerar solo con el ANAVA el conjunto de tratamientos en
el experimento, hace pensar que sta es una simplificacin exagerada. Por lo general,
el investigador se hara la pregunta dnde estn las diferencias reales?
Tradicionalmente, la tcnica frecuente del anlisis de los datos, recurre a un anlisis de
varianza con su correspondiente prueba de F. sin embargo, por s misma la prueba no
proporciona diferencia sobre comparaciones especficas entre los grupos que a
menudo son de inters. En la prctica, algunas de las comparaciones pueden ser
planeadas o preespecficadas (antes de observar los datos), mientras que otras pueden
ser no planeadas o seleccionadas luego de examinar los datos (seleccionadas posthoc).
Los diseos permiten comparar la diferencia entre tratamientos a nivel de un conjunto,
sin embargo, en ocasiones es conveniente hacer comparaciones particulares con el fin
de determinar la eficiencia precisa de los diferentes tratamientos aplicados en un
experimento, por tanto, se recurre al mtodo de comparacin mltiple de medias.
Este mtodo se puede efectuar aplicando varias pruebas realizadas por algunos
estadsticos. Se debe buscar la ms adecuada para cada uno de los casos. Las
recomendaciones para hacer comparaciones mltiples en pruebas de hiptesis son las
siguientes:
1.

Llevar a cabo la prueba F para igualdad de medias (ANAVA).

2.

Si el estudio F es significativo al 5%, lleve a cabo las comparaciones planeadas que


quiera, usando la metodologa de los contrastes ortogonales o el mtodo de Diferencia
Mnima Significativa. Si se tiene igual nmero de repeticiones por tratamiento, puede
usarse el mtodo de Duncan.o Tukey.

3.

Si el estadstico F para igualdad de medias no es significante, el experimentador an


podr considerar las comparaciones planeadas pero deber usar el mtodo de tmultivariado o el mtodo de Bonferoni. En este caso no debe hacerse ningn tipo de
seleccin post-hoc o comparaciones sugeridas de los resultados. En realidad, dado
que la prueba F no es significante para igualdad de medias, la prueba de comparacin
mltiple no producir ninguna diferencia significativa.
Prueba de Tukey
El procedimiento de Tukey, tambin llamado HDS de Tukey (Diferencia
Verdaderamente Significativa de Tukey) DSH de Tukey (Diferencia significativa
Honesta de Tukey). Este mtodo hace uso de la amplitud estudentizada y es aplicable
a pares de medias; necesita de un solo valor para juzgar la significancia de todas las
diferencias y por tanto es fcil y rpido de usar. Ya que solo se hacen comparaciones
por pares, el valor crtico es menor que el exigido por otros mtodos.
Para efectuar la prueba se utiliza la tabla de puntos porcentuales superiores de
amplitud estudentizada o de Tukey. Con un nmero de tratamientos y los grados de
libertad del error experimental se obtiene el valor T.
Pasos para aplicar el mtodo Tukey.
1 Para facilitar la comparacin de datos es aconsejable ordenar las medias de forma
decreciente.
2. Determinar

el nmero de comparaciones posibles.


Prueba de rango mltiple de Duncan
La prueba de Amplitudes Mltiples de Duncan es la ms popular por su sencillez y
aunque no es muy rigurosa, utiliza ciertos niveles de proteccin para las
comparaciones entre las medias de los tratamientos que estn ms alejados entre s,
una vez que se han ordenado por la magnitud de sus medias. De esta manera se
busca obviar las diferencias en cuanto a nivel de significacin que pueden existir al
comparar los promedios que estn alejados. Sin embargo, la solucin al problema es
solo parcial y algunos autores prefieren recomendar pruebas ms rigurosas como la de
Tukey o la de Sceffe.
A continuacin se describen los pasos a seguir para efectuar la prueba, utilizando las
tablas de Amplitudes Estudiantizadas Significativas o tablas de Duncan

1.

Calcular el error estndar de los promedios.

2.

Con los grados de libertad del error se consultanlas tablas de Amplitudes


Estudiantizadas Significativas de Duncan A.E.S. escogiendo el nivel de significancia
deseado ( = 0,05 0,01) y se buscan los valores de hilera correspondiente hasta un
"p" (grado de separacin entre los promedios que se comparan) igual al nmero de
tratamientos.
P2: tDuncan, P3: tDuncan, P4: tDuncan, Pn: tDuncan,

Estos valores son multiplicados por el error estndar de los promedios

Sxcon el

fin de obtener los valores de amplitudes lmites de significacin de Duncan A.L.S.; tal
como se presenta en la siguiente tabla.
Valores de A,E.S. y A.L.S. para efectuar la prueba de Duncan.
Valores de P.
A.E.S.
A.L.S. = A.E.S x Sx

3.
4.

2
tDuncan
Duncan

3
tDuncan
Duncan

4
tDunca
n
Dunca
n
Se organizan en orden creciente los promedios de los tratamientos, tal como se indica
a continuacin:
Se efectan las comparaciones en el siguiente orden: el promedio ms bajo con los
que estn a su derecha, luego el siguiente promedio con los que estn a su derecha y
as sucesivamente. En cada comparacin de promedios se evala si la diferencia (D)
entre el par de promedios supera al A.L.S. correspondiente. Si la diferencia D > A.L.S.,
entonces se concluye que los promedios difieren significativamente. Si D < A.L.S., la
diferencia no es significativa.
En cada comparacin el A.L.S. escogido tiene en cuenta la ubicacin de los promedios
en el arreglo ordenado, as:
A.L.S. con P = 2:
Cuando los promedios
consecutivos. Por ejemplo A vs B, B vs C, C vs D.

que

se

comparan

A.L.S. con P = 3.
Cuando entre los promedios que se comparan
tratamiento de por medio. Por ejemplo A vs C, B vs D.
A.L.S. con P = 4.
Cuando entre los promedios que se
dos tratamientos de promedio. Por ejemplo A vs D.

son
hay un

comparan existen

y as sucesivamente.
A continuacin se indica el detalle de la prueba para el ejemplo planteado:
COMPARACIN

DIFERENCIA (D) DESICIN

A.L.S.

RESULTADO

A vs B
*, **

X1 X 2 = d

>, <

valor DUNCAN

NS

A vs C

X1 X 3 = d

>, <

valor DUNCAN A vs D

X1 X 4 = d

>, <

valor DUNCAN B vs C

X2 X 3 = d

>, <

valor DUNCAN

B vs D

X2 X 4 = d

vs D

>, <

X3 X 4 = d

valor DUNCAN

>, <

valor DUNCAN

Para indicar todas las comparaciones entre los promedios se puede utilizar una
notacin resumida a base de lneas o letras, as:
a. Utilizando lneas. Los promedios ordenados por magnitud se subrayan con lneas as:
Los promedios que no sean significativamente diferentes se subrayan con una lnea
comn; los promedios que difieren no aparecen unidos. Para el ejemplo anterior, la
notacin queda en la siguiente forma:
Tratamientos
A
Promedios

prom 1.

prom 2.

prom 3.

prom 4.

De acuerdo con la prueba de Duncan el tratamiento D, es diferente a los tratamientos


restantes. Entre los tratamientos A, B, C no se encontr diferencia significativa.
b. Utilizando letras. En este caso, los promedios que no difieren significativamente
aparecen con una letra en comn. Los promedios que difieren significativamente no
tienen letras en comn. As:
A
x.
1.

prom

B
Prom 2.

C
prom 3.

D
prom
4.

Anlisis de regresin y Correlacin


El anlisis de regresin, trata de establecer la naturaleza de la relacin entre variables
es decir, estudiar la relacin funcional entre las variables y, por tanto, proporcionar un
mecanismo de prediccin, o pronostico. El segundo, anlisis de correlacin, tiene como
objetivo determinar el grado de relacin entre variables.
El anlisis de regresin y correlacin es el estudio de la relacin entre varias variables.
El conocimiento de esta relacin nos permite pronosticar el comportamiento de un
evento cuando sospechamos que est siendo afectado por otro u otros eventos.
El anlisis de regresin consiste en generar un modelo o ecuacin que nos permita
pronosticar, aproximadamente, el valor de la variable dependiente Y a travs de valores
conocidos de X.
TIPOS DE REGRESIN:
Graficas:
Regresin lineal: Es un modelo matemtico mediante el cual es posible inferir datos
acerca de una poblacin. Se conoce como regresin lineal ya que usa parmetros

lineales. Sirve para poner en evidencia las relaciones que existen


variables.

entre diversas

Caracterstica:
Slo se maneja una variable independiente, por lo que slo cuenta con dos
parmetros.
Determina la relacin de dependencia que tiene una variable respecto a otra.

Ecuacin:

y = a + bx

Donde:
y = valor esperado
a = intercepto entre la lnea proyectada en el eje y
b

pendiente

x = cualquier valor sobre el eje x.

de

la

lnea

proyectada

FUENTES BIBLIOGRAFICAS
American Association for the Advancement of Science. La naturaleza de la
ciencia.
http://www.project2061.org/esp/publications/sfaa/online/chap1.htm. Accesado
Junio 2005.
Box, G.E.P., Hunter, W.G.S., y Hunter, J.S. 1993. Estadstica para
investigadores: Introduccin al diseo de experimentos, anlisis de datos y
construccin de modelos. Edit. Reverte, Espaa. 422 p.
Bunge, M. La ciencia, su mtodo, y su filosofa. Ediciones Siglo XX. Buenos
Aires. 1972.
Cabria, S. (1994). Filosofa de la estadstica. Servicio de Publicaciones de la
Universidad de Valencia

Chou, Ya-Lun. Anlisis estadstico. Edit. Mc Graw Hill, Mxico. 1992. 808 p.
Clarke, G and Kempson, R. E. 1997. Introduction to the design and analysis
of experiments, Arnod, London.

Cliford, G.J. A history of the impact of research on teaching. In R. M.W.


Travers (Ed), Second handbook of research on teaching. Chicago: Rand Mc
nally,1973, pp 1-46.
Cooper H, Hedges LV. The Handbook of Research Synthesis. New York:
Russell Sage Foundation, 1993.
Collins, C. Statistical Experiment Design and interpretation.
introduction with agricultural examples. Wiley& Sons, New York, 1999

An

Cochran, W.G. y , y G.M. Cox. Diseos Experimentales, Ed. Trillas,


Mxico,1989. 661 p.
Dean, A and S. Voss, D. Design and Analysis of experiments. Springer
Editors, new York, 1999.
De La Loma, J.L. Experimentacin Agrcola, 2 ed. Uteha, Mxico. 1966. 493 p.

Das könnte Ihnen auch gefallen