Sie sind auf Seite 1von 125

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE CIENCIAS ADMINISTRATIVAS

TEMA:
Aplicar funciones de probabilidad y su uso en la distribucin
binomial y distribucin binomial negativa tanto en Excel como
en SPSS.

GRUPO # 2

INTEGRANTES:
GOMEZ DE LA TORRE MOHAMEHT SAYNER SIMBAD
GUALOTO JUNA RONALD PATRICIO
PINCAY BERMUDEZ PAOLA BEATRIZ
TROYA OCAA EDMUNDO EDUARDO
VASQUEZ GUALPA WASHINGTON FELIPE

II PARCIAL

DOCENTE: ECON. GALO APOLO L.

AGOSTO, 2015

ndice
1. INTRODUCCIN ................................................................................................................... 1
1.1 OBJETIVOS: ........................................................................................................................ 2
1.1.1 Objetivos Generales: ................................................................................................. 2
1.1.2 Objetivos Especficos: .............................................................................................. 2
2. DISTRIBUCIN DE PROBABILIDAD BINOMIAL. ......................................................... 3
2.1 Definicin ......................................................................................................................... 3
2.2 Sintaxis ............................................................................................................................. 4
2.3 Propiedades de la distribucin Binomial ................................................................ 5
2.4 Anexos .............................................................................................................................. 5
2.4.1 Ejemplo: 1..................................................................................................................... 5
3. DISTRIBUCIN DE PROBABILIDAD BINOMIAL NEGATIVA ..................................... 9
3.1 Definicin ......................................................................................................................... 9
3.2 Sintaxis ........................................................................................................................... 10
3.3 Propiedades de distribucin Binomial negativo ................................................. 11
3.4 Ejemplo: 1 ...................................................................................................................... 11
4. CONCLUSIN ..................................................................................................................... 16
5. BIBLIOGRAFA ................................................................................................................... 17

1. INTRODUCCIN
Estudiaremos en este tema dos de las distribuciones de probabilidad ms
importantes y que son imprescindibles en el estudio de la estadstica.
La distribucin binomial es uno de los primeros ejemplos de las llamadas
distribuciones discretas (que solo pueden tomar un nmero finito, o infinito
numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza, 1654-1705),
quin escribi el primer tratado importante sobre probabilidad, Ars conjectandi
(El arte de pronosticar). Los Bernoulli formaron una de las sagas de matemticas
ms importantes de la historia.
Hoy en da, en las empresas tenemos muchas situaciones donde se espera que
ocurra o no un evento especifico. Este puede ser de xito o fracaso sin dar paso
a un punto medio. Por ejemplo, En la produccin de un artculo, este puede salir
bueno o malo. Casi bueno no es un resultado de inters. Para situaciones como
estas se utilizan la distribucin binomial.
Se describe el uso de la distribucin binomial para obtener probabilidad de
ocurrencia de ese evento que representa un resultado esperado.
La distribucin binomial negativa puede considerarse como una extensin o
ampliacin de la distribucin geomtrica. La distribucin binomial negativa es un
modelo adecuado para tratar aquellos procesos en los que se repite un
determinado ensayo o prueba hasta conseguir un nmero determinado de
resultados favorables (por vez primera). Es por tanto de gran utilidad para
aquellos muestreos que procedan de esta manera. Si el nmero de resultados
favorables buscados fuera 1 estaramos en el caso de la distribucin geomtrica.

~1~

1.1 OBJETIVOS:
1.1.1 Objetivos Generales:
Conocer las funciones de Probabilidad que se aplicaran en Excel y SPSS
para realizar la Distribucin Binomial y Distribucin Binomial Negativa.
1.1.2 Objetivos Especficos:
Analizar el concepto de Distribucin Binomial y Binomial Negativa.
Calcular la probabilidad del xito o fracaso de un evento.
Identificar las funciones y elementos de probabilidades

~2~

2. DISTRIBUCIN DE PROBABILIDAD BINOMIAL.


2.1 Definicin
En estadstica, la distribucin binomial es una distribucin de probabilidaddiscreta que cuenta el nmero de xitos en una secuencia de n ensayos de
Bernoulli independientes entre s, con una probabilidad fija p de ocurrencia del
xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser
dicotmico, esto es, slo son posibles dos resultados. A uno de estos se
denomina xito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con
una probabilidad q = 1 - p. En la distribucin binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de calcular la probabilidad de
un determinado nmero de xitos. Para n = 1, la binomial se convierte, de hecho,
en una distribucin de Bernoulli.
Para representar que una variable aleatoria X sigue una distribucin binomial de
parmetros n y p, se escribe:

La distribucin binomial es la base del test binomial de significacin estadstica.


Experimento Binomial:
Existen muchas situaciones en las que se presenta una experiencia binomial.
Cada uno de los experimentos es independiente de los restantes (la probabilidad
del resultado de un experimento no depende del resultado del resto). El resultado
de cada experimento ha de admitir slo dos categoras (a las que se denomina
xito y fracaso). Las probabilidades de ambas posibilidades han de ser
constantes en todos los experimentos (se denotan como p y q o p y 1-p).
Se designa por X a la variable que mide el nmero de xitos que se han
producido en los n experimentos.
Cuando se dan estas circunstancias, se dice que la variable X sigue una
distribucin de probabilidad binomial, y se denota B(n, p).

~3~

2.2 Sintaxis
La funcin de probabilidad es

Donde
P(X) =Probabilidad de X xitos, dadas n y p
n = Nmero de observaciones
p = Probabilidad de xitos
1-p = Probabilidad de fracasos
X = Nmero de xitos en la muestra ( X = 0, 1, 2, 3, 4, n )
Donde

Siendo

Las combinaciones de

en

elementos tomados de en)

Ejemplo:
Supongamos que se lanza un dado (con 6 caras) 50 veces y queremos conocer
la probabilidad de que el nmero 3 salga 20 veces. En este caso tenemos una X
~ B (50, 1/6) y la probabilidad sera P(X=20):

~4~

2.3 Propiedades de la distribucin Binomial


Media de la distribucin binomial
La media de la distribucin binomial es igual a la multiplicacin del tamao n
de la muestra por la probabilidad de xito p

np
Desviacin estndar de la distribucin binomial

2 np(1 p)
2.4 Anexos
2.4.1 Ejemplo: 1
Una Urna contiene 40 bolas blancas y 60 bolas negras. Sacamos 8 veces una
bola, devolvindola, cada vez, a la urna:
A. Cul es la probabilidad de que 5 sean blancas?
Paso 1: Identificacin de datos:

~5~

Paso 2: Aplicacin de la Funcin de Probabilidad Binomial Individual,


reemplazando con los datos del ejercicio:

~6~

Paso 1: En SPSS procedemos a identificar las variables con sus respectivos


datos, pulsando la opcin Vista de variables:

Paso 2: Nos dirigimos a Vista de Datos y Escogemos la opcin Transformar se


abre una ventana y seleccionamos Calcular variable:

~7~

Paso 3:
Se abrir un cuadro de dialogo y en Grupo de Funciones escogemos la opcin
FDP Y FDP NO CENTRADA, luego en Funciones y Variables Especiales
escogemos la opcin PDF.BINOM:

Paso 4:
Reemplazamos en

la

funcin

indicada

nuestros datos

seleccionamos la variable de destino y damos clic en aceptar:

~8~

del

ejercicio,

Paso 5:
Comparamos los resultados arrojados en la tabla con los resultados de Excel:

3. DISTRIBUCIN DE PROBABILIDAD BINOMIAL NEGATIVA


3.1 Definicin
Puede definirse como una generalizacin del modelo Geomtrico o de Pascal.
As, dado un suceso A y su complementario Ac, cuando X representa el nmero
de veces que se da Ac (ausencias, fallos, etc.) hasta que se produce r veces el
suceso A, en una serie de repeticiones de la experiencia aleatoria en condiciones
independientes, decimos que X sigue la distribucin Binomial negativa. Ntese
que, cuando r = 1, tenemos exactamente el modelo geomtrico.
Este modelo queda definido por dos parmetros p (la probabilidad de A: p = P(A))
y r (el nmero de veces que debe producirse A para que detengamos la
experiencia).
La funcin de densidad viene dada por:

~9~

Donde q representa el complementario de p: q = 1 p.


NEGBINOM.DIST (funcin NEGBINOM.DIST)
Este artculo describe la sintaxis de la frmula y el uso de la funcin
NEGBINOM.DIST en Microsoft Excel.
Devuelve la distribucin binomial negativa, la probabilidad de que se obtenga un
valor de nm_fracasos antes que de nm_xitos, con un valor de prob_xito.
Esta funcin es similar a la distribucin binomial, con la excepcin de que el
nmero de xitos es fijo y el nmero de ensayos es variable. Al igual que la
distribucin binomial, se supone que los ensayos son independientes.
Por ejemplo, supongamos que necesita encontrar 10 personas que dispongan
de excelentes reflejos y sabe que la probabilidad de que un candidato tenga esta
cualidad es 0,3. NEGBINOM.DIST calcula la probabilidad de que entrevistar un
nmero determinado de candidatos no calificados antes de encontrar los 10
candidatos buscados.
3.2 Sintaxis
NEGBINOM.DIST (nm_fracasos,nm_xitos,prob_xito,acumulado)
La sintaxis de la funcin NEGBINOM.DIST tiene los siguientes argumentos:

Nm_fracasos

Nm_xitos

Prob_xito

Acumulado

Obligatorio. Es el nmero de fracasos.


Obligatorio. Es el nmero lmite de xitos.

Obligatorio. Es la probabilidad de obtener un xito.


Obligatorio. Es un valor lgico que determina la forma

de la funcin. Si el argumento acumulado es VERDADERO,


NEGBINOM.DIST devuelve la funcin de distribucin acumulativa; si
es FALSO, devuelve la funcin de densidad de probabilidad.

~ 10 ~

3.3 Propiedades de distribucin Binomial negativo


1) Esperanza: E(X) = r q/p
2) Varianza: V(X) = r q/p2
3) Se cumplen las siguientes propiedades respecto la funcin de densidad:

4) Este modelo se ajusta bien a contajes (nmeros de individuos por unidad de


superficie) cuando se produce una distribucin contagiosa (los individuos tienden
a agruparse).
5) La distribucin Binomial negativa puede definirse con mayor generalidad si
tomamos r como un nmero real positivo cualquiera (no necesariamente entero).
Pero, en dicho caso, se pierde el carcter intuitivo del modelo y se complican
ligeramente los clculos. Por dichas razones, se ha excluido dicha posibilidad en
esta presentacin.
Donde:
X es nm_fracasos, r es nm_xitos y p es prob_xito.
3.4 Ejemplo: 1
En la serie del campeonato de la NBA el equipo que gane 4 de 7 juegos ser el
ganador, suponga que los equipos de Chicago Bulls y L.A. Lakers se enfrentan
en los juegos del campeonato y que Chicago Bulls tiene una probabilidad de
55% de ganarle a L.A. Lakers:
a) Cul es la probabilidad de que Chicago gane la serie en 6 juegos?
b) Cul es la probabilidad de que Chicago gane la serie en 7 juegos?

~ 11 ~

Paso 1: Identificacin de datos:

Paso 2: Aplicacin de la Funcin de Probabilidad Binomial Negativa,


reemplazando con los datos del ejercicio:

~ 12 ~

Paso 1: En SPSS procedemos a identificar las variables con sus respectivos


datos, pulsando la opcin Vista de variables:

~ 13 ~

Paso 2: Nos dirigimos a Vista de datos, luego clic en opcin Transformar se abre
una ventana y damos clic en Calcular variable:

Paso 3: Se abrir un cuadro de dialogo y en grupo de funciones escogemos la


opcin FDP Y FDP NO CENTRADA, luego en funciones y variables escogemos
la opcin PDF.NEGBIN:

~ 14 ~

Paso 4: Reemplazamos en la funcin indicada nuestros datos del ejercicio,


seleccionamos la variable de destino y damos clic en aceptar:

Paso 5:
Comparamos los resultados arrojados en la tabla con los resultados de Excel:

~ 15 ~

4. CONCLUSIN
En conclusin la mejor manera de visualizar el proyecto es gracias a la
comprensin de conceptos, entendimos que la distribucin binomial y la
distribucin binomial negativa son una poderosa herramienta probabilstica que
bien aplicada nos podr ayudar a facilitar los clculos para la solucin de
problemas.
El objetivo central de este trabajo es saber que aprendimos a diferenciar entre
una distribucin binomial y una distribucin binomial negativa.
Por medio de los grandes avances tecnolgicos hemos ahorrado tiempo para el
anlisis probabilstico, sin embargo la comprensin de la lgica que se utiliza
para llegar a la resolucin del mismo.

~ 16 ~

5. BIBLIOGRAFA
Distribucin de Probabilidad Binomial

http://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial

Lind, D & Marchal, W & Wathen, S (2008). Estadstica aplicada a los Negocios y
la Economa (13 Ed). Mc Graw Hill

Distribucin de Probabilidad Binomial Negativa

https://support.office.com/es-mx/article/NEGBINOMDIST-funci%C3%B3nNEGBINOMDIST-c8239f89-c2d0-45bd-b6af-172e570f8599?ui=es-ES&rs=esMX&ad=MX

~ 17 ~

TEMA:
DISTRIBUCION DE POISSON Y
DISTRIBUCION HIPERGEOMETRICA

TRABAJO DEL GRUPO No. 3


COMPUTO N3
ALUMNOS
PATRICIA ARELLANO
SEGUNDO CHASIJUAN
JOSELINE PARRALES
KATHYUSKA RODRIGUEZ
PROFESOR: EC. GALO APOLO LOAYZA

~ 18 ~

POISSON
Es una distribucin de probabilidad discreta que expresa la probabilidad
de que un nmero de eventos ocurran en un periodo de tiempo y es
utilizado en situaciones donde los sucesos son impredecibles o de
ocurrencia aleatoria.
Una distribucin discreta es un conjunto de variables aleatorias que slo
pueden tomar un conjunto finito o infinito numerable de valores
diferentes.
Aqu la formula donde k es el nmero de ocurrencias del evento o
fenmeno
es un parmetro positivo que representa el nmero de veces que se
espera que ocurra el fenmeno durante un intervalo dado.
e es la base de los logaritmos naturales

Ejercicio # 1: Un radar de carretera detecta un promedio de 6


infracciones diarias. Calcular lo siguiente:
1.- Que el radar detecte 4 infracciones al da.
2.- Que el radar detecte menos de dos infracciones al da.
Debo identificar cual es mi Media o que en este caso es 6, luego mi X,
en el numeral 1 mi X es 4 pues como me indica que las infracciones son 4
al da esto es X=4. En el numeral 2 mi X es 1 pues como me indica que las
infracciones son menos de dos infracciones, esto es X=1.
1) Que el radar detecte 4 infracciones al da.
Media o es 6
P (X=4)

~ 19 ~

Como se puede apreciar las variables que debo llenar son las siguientes:
X en este caso es 4 pues me pide detectar 4 infracciones al da
Media en este caso es mi promedio y en el planteamiento del problema
indica que existe un promedio de 6 infracciones diarias
Acumulado, ponemos cero, porque no se acumula ya que pide un valor
igual a 4, en ninguna parte indica menor o mayor 4, si fuera de esta ltima
forma, se pone 1.
Aqu visto el problema desde otro punto de vista

Vamos a realizar el mismo problema con SPSS:


Al iniciar el programa nos vamos a vista de variable y como solo vamos a
buscar la probabilidad de X, ponemos a Nombre X, le ponemos sin
decimales pues mi nmero es entero.

Luego vamos a vista de datos y ya tenemos como ttulo en mi columna


X, el nmero que vamos a buscar son las 4 infracciones, luego ponemos:
Transformar/Calcular Variable y se abre una nueva ventana

~ 20 ~

En variable de destino pondremos la letra Y, en grupo de funciones


buscaremos FDP y FDP no centrada, luego en el otro men de funciones
y variables especiales elegimos Pdf.Poisson el cual se me ejecuta mi
expresin numrica para ya trabajarlo, tengo dos interrogantes (?), la
primera interrogante es X que ya en su momento colocamos el 4 y la otra
interrogante es mi Media o sea el nmero 6, doy aceptar y se me abre
una nueva ventana que me muestra que mi formula se ha ejecutado.

Aqu el resultado final en SPSS

~ 21 ~

Y podemos observar que tanto en Excel como en SPSS el resultado es el


mismo

ANALISIS: La probabilidad de que el radar detecte 4 infracciones al da es


del 13,39%
2) Que el radar detecte menos de dos infracciones al da.
Media o es 6
P (X<2)

Como se puede apreciar las variables que debo llenar son las siguientes:
X en este caso es 1 pues me pide detectar menos de dos infracciones al
da
Media en este caso es mi promedio y en el planteamiento del problema
indica que existe un promedio de 6 infracciones diarias
Acumulado, ponemos uno, porque aqu si se acumula ya que pide un
valor menor a dos.
Aqu visto el problema desde otro punto de vista

~ 22 ~

Vamos a realizar el mismo problema con SPSS:


Como yo hicimos un ejercicio anterior, borramos los datos y el nmero
que vamos a buscar es menos de dos infracciones, es decir ahora el
nmero 1, luego ponemos: Transformar/Calcular Variable y se abre una
nueva ventana

En variable de destino ya est colocada la letra Y, en grupo de funciones


buscaremos FDA y FDA no centrada, luego en el otro men de funciones
y variables especiales elegimos Cdf.Poisson el cual se me ejecuta mi
expresin numrica para ya trabajarlo, tengo dos interrogantes (?), la
primera interrogante es X que ya en su momento colocamos el 1 y la otra

~ 23 ~

interrogante es mi Media o sea el nmero 6, doy aceptar y se me abre


una nueva ventana que me muestra que mi formula se ha ejecutado.

Aqu el resultado en SPSS

Y podemos observar que tanto en Excel como en SPSS el resultado es el


mismo

ANALISIS: La probabilidad de que el radar detecte menos de dos


infracciones al da es del 1,74%
Ejercicio # 2: Las llamadas de emergencia registradas en una estacin de
polica son 10 por hora. Calcular lo siguiente:
1) Que ingresen dos llamadas por hora.
2) Que ingresen como minino tres llamadas por hora.
Media o es 10
P (X=2)
P (X<3)
Ya identificado mis variables, procedemos a realizar en Excel el
planteamiento.
1) Que ingresen dos llamadas por hora.

~ 24 ~

X es igual a dos, mi media es 10 y como mi valor no es acumulado, se


pone 0.
La resolucin del ejercicio en SPSS

En variable de destino pondremos la letra Y, en grupo de funciones


buscaremos FDP y FDP no centrada, luego en el otro men de funciones
y variables especiales elegimos Pdf.Poisson el cual se me ejecuta mi
expresin numrica para ya trabajarlo, tengo dos interrogantes (?), la
primera interrogante es X que ya en su momento colocamos el 2 y la otra
interrogante es mi Media o sea el nmero 10, doy aceptar y se me abre
una nueva ventana que me muestra que mi formula se ha ejecutado.

~ 25 ~

Aqu el resultado en SPSS

Y podemos observar que tanto en Excel como en SPSS el resultado es el


mismo

ANALISIS: La probabilidad de que ingresen dos llamadas por hora es del


0.23%
2) Que ingresen como minino tres llamadas por hora.

X es igual a dos porque se busca mnimo tres llamadas por hora, mi media
es 10 y como mi valor es acumulado, se pone 1.
La resolucin del ejercicio en SPSS

~ 26 ~

En variable de destino ya esta colocada la letra Y, en grupo de funciones


buscaremos FDA y FDA no centrada, luego en el otro men de funciones
y variables especiales elegimos Cdf.Poisson el cual se me ejecuta mi
expresin numrica para ya trabajarlo, tengo dos interrogantes (?), la
primera interrogante es X que ya en su momento colocamos el 2 y la otra
interrogante es mi Media o sea el nmero 10, doy aceptar y se me abre
una nueva ventana que me muestra que mi formula se ha ejecutado.

Aqu el resultado en SPSS

~ 27 ~

Y podemos observar que tanto en Excel como en SPSS el resultado es el


mismo

ANALISIS: La probabilidad de que ingresen menos de tres llamadas por


hora es del 0.28%

~ 28 ~

HIPERGEOMETRICA
En Estadstica, la hipergeomtrica es una de las distribuciones de
probabilidad discreta. Esta distribucin se utiliza para calcular la
probabilidad de una seleccin aleatoria de un objeto sin repeticin.
Aqu, el tamao de la poblacin es el nmero total de objetos en el
experimento.

Ejercicio No. 1:
De 40 edificios en un parque industrial 15 no cumplen con el cdigo
elctrico. Si se seleccionan 10 edificios aleatoriamente. Determine la
probabilidad de que:
3 no cumplan el cdigo
PROCEDIMIENTO:
Para desarrollar en Excel realizamos el siguiente procedimiento:
1. Determinamos los elementos:
N=
n=
C=
x=

40
10
15
3

N-C=
n-x=

25
7

2. Aplicamos la funcin Excel:

~ 29 ~

3. Se obtiene el resultado:

En SPSS:
Para desarrollar el ejercicio en SPSS realizamos el siguiente
procedimiento:
1. Identificamos y detallamos los datos de la siguiente manera:
X= poblacin
Y= muestra
Z= poblacin xito
A= muestra xito
B= resultado

~ 30 ~

2. En vista de datos colocamos los valores previamente identificados:

2. Luego nos ubicamos en transformar , calcular variables en esa


pantalla a la derecha nos ubicamos en grupo de funciones en el
caso de la hipergeomtrica es FDP Y FDP no centrada en la
ventada de funciones y variables especiales nos ubicamos en
Pdf.Hyper

~ 31 ~

3. En el recuadro de expresin numrica colocamos los elementos de


la formula en el siguiente orden: (a,x,z,y) donde a es igual a muestra
xito , x es igual a la poblacin , z es igual a la muestra xito y y a
la muestra.
Y en variable de destino seleccionamos b que es el resultado

~ 32 ~

4. Presionamos

aceptar

~ 33 ~

se

procesa

el

resultado:

5. Se

obtiene

el

resultado:

6. Al final se compara los resultados con la funcin Excel y SPSS por


comprobacin.

Ejercicio No. 2:

1.- Planteamiento:
~ 34 ~

Cul es la probabilidad de que del total de 100 estudiantes del curso de


Computacin:
3 mujeres, 7 varones (nuevos estudiantes) y un repetidor reprueben el curso,
cuando del universo de estudiantes 22 son mujeres y los 78 restante son hombres,
de los cuales son 70 nuevos estudiantes y 8 estan repitiendo.
Estudiantes
Mujeres
Varones
Repetidor
Suman

Variables
Acierto
muestra
3
22
7
70
1
8
11

Probabilidad
Fx= Excel
Fx= SPSS
0.254948
0.254948
0.231960
0.231960
0.407297
0.407297

100

2.- Aplicacin Excel


a) Seleccin de formular.- La frmula en Excel a utilizar para resolver el
ejercicio planteado es DISTR.HIPERGEOM a la misma se puede acceder
por dos mecanismo: Va comando directamente de la celda
=Distr.Hipergeom o desde la barra de herramienta opcin formulas +
Estadisticas + Distr.Hipergeom.

b)

Seleccin de
variables.vez
identificada
formula se
procede a la
seleccin las
variables

Una
la

requeridas por la ventana de Argumentos de funcin:


* Muestra_xito: 3 Es el nmero de aciertos que necesitamos medir su
probable distribucin en el resultado.
* Nm_de_muestra: 22 Es la cantidad exacta del universo toda que
forma parte de la probabilidad global para nuestros aciertos.
* Poblacin_xito: 11Es el nmero total de todos los aciertos que
necesitamos obtener su probabilidad de las diferentes variables (para
este ejercicio son tres variables: Mujeres; Hombres y repetidores)
* Nm_de_poblacin: 100 El del universo total de donde tomamos las
muestra para el estudio de distribucin

~ 35 ~

c) Resultado:
Una vez seleccionadas las variables se procede a dar clip en aceptar
y se obtiene la probabilidad, y el proceso se repite para cada una de las
variables

Variables
Acierto muestra
Mujeres
Varones
Repetidor
Suman

22

70

11

100

Probabilidad
Fx= Excel
Fx= SPSS
0.254948
0.231960
0.407297

Nota: En el caso de tener una serie de variable y para ahorrar el trabajo,


al momento de seleccionar en la formula las celdas de
Poblacion_de_xito y Nm_de_poblacin se las fijan con F4.

~ 36 ~

3.- Aplicaci3n en SPSS Statistics


a) Planteamiento.- En diferencia al planteamiento en Excel, las
sumatoria se las colocan directamente como una columna ms, es
decir sin que esto implique una frmula para el resultado.

b) Seleccin de formula.- Una vez planteado el ejercicio se procede a la


seleccin de la frmula que en diferencia a Excel no existe un comando
en las celdas misma que te permita ir directamente, necesariamente se
necesita seleccionar en la barra de herramientas la opcin
transformar + Calcular variable

Una vez selecciona la opcin calcular variable se activa una ventana


en la cual debemos seleccionar de Grupo de funciones la opcin
FDP y FDP no centrada; y de Funciones y variables especiales la
opcin Pdf.Hyper que es la funcin de distribucin Hipergeometrica, y

~ 37 ~

le damos doble clip y automticamente nos aparece la formula en la


parte superior en Expresin numrica.

a)

c) Seleccin de
variables.- Una vez
identificada la
formula se
procede a la
seleccin las variables requeridas por la ventana de Calcular variable:
Formula PDF.HYPER(,?,?,?)
* C: Es la columna de los nmeros de aciertos que deseamos en el caso de
nuestro ejercicio es Aciertos.
* total: Es la columna del total de la poblacin en nuestro ejercicio es igual a
Total_Poblacin.
* Muestra: es cada una de la muestra de las diferentes variables o variable
que plante el ejercicio, en el caso de nuestro ejercicio es la columna
muestra.
* Aciertos: Es la sumatoria de cada uno de los aciertos que deseamos en
cada variable, en nuestro ejercicio es la columna Total Aciertos
* Variable de destino: es el nombre que le damos a la columna donde se
reflejara el resultado.

c) Resultado:

~ 38 ~

Una vez seleccionadas las variables se procede a dar clip en aceptar y se


obtiene la probabilidad de cada una de las variables, en diferencia a Excel no
debes calcular una a una ni debes fijar alguna celda para rellenar.

~ 39 ~

Ejercicio No. 3:
Al someter a prueba un tipo de caucho para camiones sobre un terreno
mojado, se observ que de los 120 camiones puesto a prueba,
36 no terminaron la prueba por deslizamiento. Si
se someten a prueba 16 camiones
Hallar
la
probabilidad
de
que
exactamente 6 no finalicen la prueba
Halle la probabilidad de que
menos que 2 no finalicen la
prueba

Paso 1
Comienzo a analizar el ejercicio, aqu me est indicando que tengo un
total de 120 camiones. Cual sera mi probabilidad de que de estos
exactamente 6 no finalicen la prueba y de que menos de 2 no finalicen
la prueba. Defino mis variables y comienzo a resolver
probabilidad de que 6 exactamente no finalicen
la prueba
N=
120
C=
36
n=
16
x=
6

probabilidad que menos de 2 no finalicen la


prueba
N=
C=
N=
x<2

120
36
16
1

Al escoger mi formula tengo que verificar bien, ya que existe una


distribucin Hipergeometrica normal y una negativa, en este caso se
aplica la normal

~ 40 ~

Esta es la que yo voy a aplicar porque voy a


hallar mi probabilidad

Paso 2
Comienzo a aplicar mi formula de Excel de la siguiente manera

Como vemos aqu mi muestra de xito es 6 de los que me piden que


exactamente esos no finalicen la prueba, esta es mi probabilidad.
Luego me pide mi nmero de muestra que en este caso viene a ser mis
16 camiones que se someten a la prueba
Luego de este ubico mi poblacin de xito que es mi 36 que no
terminaron la prueba por deslizamiento.
Y por ltimo tenemos mi poblacin total que son mis 120 camiones.
Y como resultado me da 0.173234572

Ejercicio en spss
Comienzo a ubicar mis variables y valores

~ 41 ~

Luego veo mis datos si estn correctos

Y procedo a irme a transformar calcular


Transformar variables y cojo fdp y fdp no centrada y luego pdf hyper

Me va a aparecer una ventanita que me sale calcular variable existente


y ponemos aceptar, porque es all donde aparecer nuestro resultado

~ 42 ~

Y procedo a calcular
Ubicando mis variables

En este caso el orden para obtener mi resultado es mi prueba de xito,


luego x que es mi poblacin total, de ah pongo z que es mi poblacin
de xito y por ltimo y que es mi muestra y obtengo mi resultado de la
sgte manera:

~ 43 ~

Luego de esto me ubico en vista de datos para ver mi resultado

Y ese es el resultado obtenido tanto en Excel como en sps


Comparacin

Procedo a resolver mi sgte probabilidad de que menos de 2 no finalicen


la prueba

Y obtengo mi resultado

Y se realiza el mismo procedimiento


En spss

~ 44 ~

Y obtenemos el resultado

~ 45 ~

REGRESIN LINEAL SIMPLE EN EXCEL Y SPSS.

Docente:

Integrantes:

Econ. Galo Apolo

lava Velsquez Darlin Humberto

Asacata Asacata Walter Gonzalo

Barchi Jimnez Mara Isabel

Castro Ypez Carmen Carolina


~ 46 ~

Guzmn Rugel Alexandra Esther

N3:

GRUPO # 5

7HOO - 10H00 AM

Segundo Parcial

REGRESIN LINEAL SIMPLE


Es el proceso que consiste en poner en relacin a una variable dependiente (Y)
en Funcin de otra independiente (X), llamada tambin variable explicativa o
predictora, mediante la ecuacin de una recta, basados en una relacin de
causalidad para el fenmeno en estudio.
As, en el ejemplo 5.1 vemos que las cantidad demandada de muecas (Y), es
una funcin del precio de las mismas (X). Es decir, que Y = f(X).
La relacin funcional a la que se postula es la ecuacin de una recta, por lo tanto,
se postula que:
Yi = a + bXi.

Donde a y b son los coeficientes de regresin, siendo b la pendiente de la recta


y es negativa porque recoge el efecto de la relacin inversa entre el precio de
las muecas y la cantidad demandada.
En el diagrama de dispersin obtenido antes, se puede apreciar que no todos los
puntos caen sobre la recta postulada, por lo que es necesario agregarle al
modelo una Componente de error, as el modelo queda como:

~ 47 ~

Yi = a + bXi + ei

Ahora el problema se reduce a encontrar los valores de a y de b que permitan


hacer pronsticos de Y asumiendo determinados valores de X,. Para poder
determinar los valores de a y de b, se postula que los errores promedien cero,
es decir buscando que todos los puntos caigan sobre la recta y que la varianza
de estos errores sea mnima, surgiendo as el mtodo de los mnimos cuadrados
ordinarios.

Modelo de Regresin Lineal Simple Frmulas

~ 48 ~

Donde:

Regresin lineal simple en Excel


Para poder realizar el ejercicio de regresin lineal simple e Excel se tiene abrir el
programa Excel:

Y nos aparecer de esta manera:

Abierto el programa el siguiente paso es ingresar el ejercicio y los datos de


regresin lineal simple:
Ejercicio

~ 49 ~

En una agencia bancaria se registr el nmero de depsitos realizados y el


monto total de estas transacciones en una hora de trabajo dando los siguientes
resultados.

y monto (miles de dolares)


x numero de depositos

10
16

5
9

7
3

19
25

11
7

8
13

a) Obtenga la ecuacin de regresin lineal simple el monto total y el nmero


de depsitos.
b) Estime cual sera el monto total cuyo nmero de depsitos es 20 interprete
el resultado.
c) Realice el grafico de los datos junto con la recta estimada a y b de una
interpretacin al mismo.
Ya ingresado procedemos con el desarrollo del ejercicio de regresin
lineal simple los datos los ordenamos en forma vertical:

Observaciones numero de depositosmonto miles de dolares


x
y
1
16
10
2
9
5
3
3
7
4
25
19
5
7
11
6
13
8
Y sumamos los datos del nmero de depsitos x es una variable independiente
y tambin los monto miles de dlares y es una variable dependiente quedando
de esta manera como esta en el grfico.
Como y depende de x.

~ 50 ~

Observaciones numero de depositosmonto miles de dolares


x
y
1
16
10
2
9
5
3
3
7
4
25
19
5
7
11
6
13
8
73
60
Se procede a resolver el cuadro de regresin lineal simple se multiplica el valor
de x con el valor de y y presionamos enter y nos da un resultado como este y
lo resolvemos en forma vertical:

Ahora procedemos con el siguiente proceso de elevar los valores de x al


cuadradox^2 en forma vertical excepto la sumatoria:

~ 51 ~

Ya realizado el cuadro con los valores y el siguiente paso es obtener el nmero


de datos, la media y, la media x, y la media x elevado al cuadrado x^2 y nos
queda de esta manera.
Para obtener el nmero de datos se arrastra el ltimo valor de observaciones
que a su vez es el 6.

n datos

Para obtener la media y se debe aplicar la funcin promedio y nos indicara que
ingrese los valores y tenemos que ingresar los valores de media excepto la suma
total y se presiona enter y nos da un resultado como se puede observar.

media y

10

Las obtener la media de x se debe aplicar la funcin promedio y nos indicara que
ingrese los valores y tenemos que ingresar los valores de x excepto la suma
total y se presiona enter y nos da un resultado como se puede observar.

~ 52 ~

Procedemos a resolver la media x elevada al cuadrado:

Y nos da el resultado requerido.

~ 53 ~

Procedemos a resolver las frmulas de regresin lineal simple:

En este caso procedemos a resolver la formula de b ingresamos la suma de xy


menos el numero multiplicado la media de x y la media y y presionamos enter.
En forma manual:

Resolvemos el siguiente paso que es la suma de x^2 menos el numero de datos


multiplicado con la media de x^2y presionamos enter.

~ 54 ~

Y resolvemos la ecuacin de b dividiendo la primera parte de la formula con la


segunda parte y presionamos enter.

Y nos da el resultado esperado:

~ 55 ~

En forma de funcin se tiene usar la funcin de pendiente tomamos todos los


valores de numero de depsitos x y monto miles de dlares y y presionamos
enter y el resultado esperado.

Ahora resolvemos la formula a:

Tomamos la media y menos el resultado de b multiplicado con la media de x y


presionamos enter:

~ 56 ~

Y la forma de funcin es mediante la funcin interseccin eje donde tomamos los


valores de numero de depsitos x y los valores de monto miles de dlares y y
presionamos enter y obtenemos el resultado esperado.

El siguiente paso es resolver la ecuacin de regresin lineal simple con su


respectivo anlisis:

= a + bx
En la cual se toma el resultado de a ms el resultado de b multiplicado con
variable x que a su vez da como resultado de 13,96.

~ 57 ~

En forma de funcin se aplica la funcin de pronstico en la cual se toma los


valores de nmeros de depsitos x y los valores de monto miles de dlares y
presionamos enter y nos da el resultado de 13,96.

Ahora realizamos el literal b que es estime cual sera el monto total cuyo nmero
de depsitos es 20 interprete el resultado.
Procedemos a restar el valor de y menos el monto miles dlares que es 19
menos el resultado de la ecuacin que es 13,96 y nos un resultado de 5,04 y en
el siguiente grafico podemos observar el anlisis de este resultado.

~ 58 ~

Anlisis se puede observar en el permetro que en el nmero de depsitos es


de 25 el monto es de 19 al estimar el monto de 20 existe una disminucin del
monto de 5,04 debido a la baja de 5 depsitos.
El siguiente paso es realizar el grafico:
Tomamos los valores de nmero de depsitos x y el monto miles de dlares y:

~ 59 ~

numero de depositosmonto miles de dolares


x
y
16
10
9
5
3
7
25
19
7
11
13
8
Y nos vamos a insertar en el cual buscamos en donde dice dispersin y hacemos
clic y dndonos algunas opciones pero en este caso escogemos la primera
opcin y automticamente nos da el grafico y hacemos clic:

Y el siguiente paso es ingresar la lnea de dispersin primero hacemos clic en


los puntos azules que estn en el grfico y damos un clic derecho y nos
aparecen unas opciones y escogemos la opcin agregar lnea de tendencia, la
presentacin ecuacin en el grfico y automticamente la lnea, la ecuacin de
la regresin lineal aparece y se plasma en el grfico.

~ 60 ~

Y el siguiente paso realizar un anlisis sobre el grafico de regresin lineal


simple:
Anlisis:
La pendiente es positiva lo que nos indica que a medida que aumenta el
nmero de depsitos aumenta el nmero
Del monto total adems, al obtener un coeficiente de determinacin 0.64
podemos concluir que el 64% del monto de ventas se explica por la relacin
lineal que existe entre el nmero de depsitos.
El siguiente paso es ir a archivo hacer clic en opciones:

~ 61 ~

Y nos dar una serie opciones de entre las cuales haremos clic en
complementos, iremos en donde dice administracin y haremos clic en
complementos de Excel y haremos clic en donde dice ir:

Y nos aparecer un cuadro de complementos con una serie de opciones y


debemos poner un visto en herramientas de anlisis y herramientas de anlisis
de VGA y hacemos clic en aceptar

~ 62 ~

Y queda instalado la base de datos de esta manera:

~ 63 ~

Ir a base de datos hacer clic y nos dar un serie de opciones

Y escogemos regresin y nos aparece un cuadro de anlisis de regresin lineal


simple en donde se debe ingresar los datos de x y y en donde dice rango y de
entrada van todos los datos de y y en donde dice rango x de entrada van los
datos de x damos un clic en rtulos y para que aparezca los ttulos de x y y en
donde dice opciones de salida marcamos en rango de salida para escoger algn
lugar de la hoja de Excel para que aparezca en ese lugar escogido en este caso
yo escog una hoja nueva.

Y de esta manera aparece el cuadro de resumen de anlisis regresin lineal


simple y anlisis de varianza:

~ 64 ~

Y procedemos a realizar un anlisis de datos estadsticos de la regresin.


El siguiente paso es realizar un anlisis sobre este cuadro
Anlisis:

R^2 0,55 Es una relacin positiva media entre estos 2 puntos de x y.


Entre ms se acerque a 1 este valor tiene una relacin positiva
Entre ms se acerque este a 0 este valor no pueden tener una relacin positiva.

~ 65 ~

Y = a+bx
Y=3,85263158+ 0,50526316x

REGRESIN LINEAL EN SPSS

1. Primero se debe tener abierto el programa de EXCEL y el SPSS y copiamos


las variables X y para traerlas al SPSS
EN EXCELL:

~ 66 ~

Para llevar las variables X y se lo puede hacer con las teclas CTRL + C; luego y
ya abierto el SPSS damos con las teclas CTRL + V para copiar los valores en
SPSS como podemos ver en el siguiente grfico:

2. Para obtener el grafico de regresion lineal se busca la opcion GRAFICO DE


DIALOGO ANTIGUOS y de hay DISPERSION DE PUNTOS

~ 67 ~

3. Escogemos la opcin DISPERSIN SIMPLE. Y la opcin DEFINIR

4. El cual nos va a mostrar otra ventana, en donde tenemos que ubicar las
variables independientes (X) y las variables dependientes (Y) como se muestra
en el siguiente grficos

~ 68 ~

5 Se da ACEPTAR para que salga el diagrama regresin lineal y se da click en


cualquiera de los puntos y escogemos la opcin LINEAL de los cuadros
pequeos. Para obtener el grafico del ejercicio

~ 69 ~

60 Ya que se obtuvo el grafico; nuestro siguiente paso es el obtener los datos de


la REGRESIN LINEAL. Para ello debemos ir a la barra de herramientas del
SPSS y escoger la opcin ANALIZAR el cual nos va aparecer una lista de
opciones en la que tenemos que escoger REGRESIN y luego escoger de la
nueva lista la opcin LINEALES

~ 70 ~

7. De aqu se nos abre una ventana en donde tenemos que definir las variables
dependientes (Y) y las variables independientes (X)

Ya una vez ubicadas las variables procedemos a elegir la opcin ACEPTAR.


Para que nos aparezca el cuadro el cuadro de texto del SPSS en donde nos
viene toda la informacin de la REGRESION LINEAL

~ 71 ~

Con estos resultados podemos comparar con EXCEL los resultados que est en
el TEXTO DEL SPSS encerrados en crculos; incluyendo tambin el grafico tanto
en EXCEL como en el SPSS:

~ 72 ~

EN EXCELL

Quedando la siguiente formula:

En donde si X es cero; Y es igual a 3.85 Como se demostr en el SPSS


El grafico en EXCEL es el siguiente:

~ 73 ~

UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS ADMINISTRATIVAS

TRABAJO EN EQUIPO
REGRESIN LINEAL MLTIPLE

ASIGNATURA: CMPUTO 3
TUTOR: ING. GALO APOLO

INTEGRANTES:

ARVALO PARRA BLANCA ARACELLY.


CAMPOS CEDEO LISSETTE ANNABEL.
JIMENEZ ORTEGA JENNY GEOMAIRA.
SEGURA SEGURA KIMBERLY PAMELA.

PERIODO LECTIVO: 2015-2016

REGRESIN LINEAL MLTIPLE (EXCEL)

~ 74 ~

El promotor inmobiliario selecciona al azar una muestra de 11 edificios de


oficinas entre 1.500 edificios y obtiene los siguientes datos:

1
2
3
4
5
6
7
8
9
10
11

X1
rea
2.3
3.4
3.2
5.7
5.3
5.1
4.8
6.4
5.4
9.1
10.4

X2
Antigedad
2
8
11
9
11
12
22
8
17
18
12

Y
Precio
98
162
164
230
210
200
182
300
192
360
464

X1= Area es la variable independiente.


X2= Antigedad es la variable independiente.
Y= Precio es la variable dependiente.

DE FORMA MANUAL

1. Se eleva X1 al cuadrado, arrastramos las celdas hacia abajo, y


seleccionamos autosuma.
2. Se eleva X2 al cuadrado, arrastramos las celdas hacia abajo, y
seleccionamos autosuma.
3. Se multiplica X1 por X2, arrastramos las celdas hacia abajo, y
seleccionamos autosuma.
4. Multiplicamos X1 por Y, arrastramos las celdas hacia abajo, y
seleccionamos autosuma.
5. Multiplicamos X2 por Y, arrastramos las celdas hacia abajo, y
seleccionamos autosuma.

~ 75 ~

DEMOSTRACIN

FRMULA MATRICIAL

DEMOSTRACIN

Reemplazar mediante la frmula los datos de la tabla anterior de la siguiente


manera:

~ 76 ~

PRIMERA MATRIZ
PRIMERA COLUMNA DE LA FRMULA

1.

N es el nmero de datos

11

2. X1 es la suma total de los valores del rea.

61.1

3. X2 es la suma total de los valores antigedad.

130

SEGUNDA COLUMNA DE LA FRMULA


1. X1 es la suma total de los valores del rea.

61.1

2. X12 es la suma total de los valores del rea elevado al

397.81
775

cuadrado.
3. X1*X2 es la multiplicacin de los valores de rea por antigedad.

TERCERA COLUMNA DE LA FRMULA


1. X2 es la suma total de los valores antigedad.
2. X1*X2 es la multiplicacin de los valores de rea por antigedad.
3. X22 es la suma total de los valores de la antiguedad elevado al cuadrado.

XXT

11
61.1
130

61.1
397.81
775

130
775
1840

SEGUNDA MATRIZ
1. y es la suma total de los valores del precio.
2. X1*Y es la multiplicacin del rea por el precio.
3. X2*Y es la multiplicacin de la antigedad por el precio.

~ 77 ~

130
775
1840

2562
16677
31792

XTY

INVERSA DE LAS MATRICES

1. Seleccionamos 3 filas y 3 columnas.


2. Buscamos la formula MINVERSA y seleccionamos la primera parte de la matriz,
cerramos parntesis y presionamos Ctrl+Shift+Enter.

0.79916157 -0.07102961 -0.02654514


-0.07102961 0.02032199 -0.00354114
-0.02654514 -0.00354114 0.00391046
3. La segunda matriz permanece igual.

2562
16677
31792

Para obtener los coeficientes hacemos la multiplicacin de la inversa de las matrices


mediante la frmula MMULT.

18.9680762
44.352118
-2.74279421

~ 78 ~

Entonces nuestra ecuacin es la siguiente:

Donde:
B0 = 18.9680762
B1 = 44.352118
B2= -2.74279421

Realizamos el anlisis:
El precio depende del rea y la antigedad a mayor valor aumentar sus precios.
A menor valor de las variables independientes el precio disminuye.

REGRESIN LINEAL MLTIPLE (FORMULA EXCEL)

El promotor inmobiliario selecciona al azar una muestra de 11 edificios de


oficinas entre 1.500 edificios y obtiene los siguientes datos:

1
2
3
4
5
6
7
8
9
10
11

X1
rea
2.3
3.4
3.2
5.7
5.3
5.1
4.8
6.4
5.4
9.1
10.4

X2
Antigedad
2
8
11
9
11
12
22
8
17
18
12

~ 79 ~

Y
Precio
98
162
164
230
210
200
182
300
192
360
464

1. Seleccionamos en la barra de herramientas la opcin Datos.


2. Seleccionamos anlisis de datos.
3. En el cuadro de anlisis de datos seleccionamos regresin y damos clic en aceptar.

4. Aparece la ventana de regresin

En rango Y de entrada: seleccionamos la columna de precio (variable


dependiente).

~ 80 ~

En rango X de entrada: seleccionamos las columnas rea y antigedad (variables


independientes).
Si seleccionamos los datos desde su nombre de la variable, seleccionamos la
opcin rtulos.
Opciones de salida: podemos elegir entre las 3 alternativas.
Rango de salida: se ubica en la celda de la misma hoja.
En una hoja nueva: en otra hoja.
En un libro nuevo: se crea otro archivo.

5. Damos clic en aceptar y aparece automticamente la tabla de resumen de la regresin


lineal mltiple.
Resumen

Estadsticas de la regresin
Coeficiente de correlacin mltiple

0.98331805 Existe una relacin positiva fuerte.

Coeficiente de determinacin R^2

0.96691439

R^2 ajustado

0.95864299

Error tpico

21.1259041

Observaciones

11

ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresin

104344.4785

52172.23924

Residuos

3570.430607

446.3038259

10

107914.9091

Total

Coeficientes
Intercepcin

Error tpico

Estadstico t

F
116.8984808

Probabilidad

Valor crtico de F
1.19828E-06

Inferior 95%

Superior 95%

Inferior 95,0%

Superior 95,0%

18.9680762

18.88567882

1.004362957

0.344611754

-24.58237722

62.51852967

-24.58237722

Area

44.352118

3.011607702

14.7270569

4.44265E-07

37.40733817

51.2968978

37.40733817

51.2968978

Antigedad

-2.7427942

1.321080602

-2.076174768

0.071539279

-5.789211544

0.303623119

-5.789211544

0.303623119

~ 81 ~

62.51852967

REGRESIN LINEAL MLTIPLE (SPSS)

El promotor inmobiliario selecciona al azar una muestra de 11 edificios de


oficinas entre 1.500 edificios y obtiene los siguientes datos:

1
2
3
4
5
6
7
8
9
10
11

X1
rea
2.3
3.4
3.2
5.7
5.3
5.1
4.8
6.4
5.4
9.1
10.4

X2
Antigedad
2
8
11
9
11
12
22
8
17
18
12

Y
Precio
98
162
164
230
210
200
182
300
192
360
464

1. Seleccionamos en vista de variables e insertamos los nombres de las variables que


vamos a analizar (X1,X2,Y)
2. Ubicamos las diferentes opciones de vista de variables dependiendo de nuestros
datos, en este caso utilizaremos nuestra primera variable con decimales.
3. Ponemos etiquetas a nuestras variables.
4. Podemos alinear a la izquierda, derecha o centrado.
5. Seleccionamos la medida, como nuestros datos son cuantitativos seleccionamos
escala.
Demostracin:

~ 82 ~

1. Ubicamos en vista de datos los valores de nuestras variables (copiar, tipear o enviar
directamente desde el archivo).

2. Seleccionamos en Analizar luego regresin y elegimos lineales.

3. Aparece el cuadro de regresin lineal y ubicamos las variables la Y que es la dependiente:


precio, Independientes: X1 es el rea y X2 es la antigedad y damos clic en aceptar.

~ 83 ~

RESUMEN DEL ANLISIS DE LA REGRESIN MLTIPLE

Variables entradas/eliminadasa

Modelo
1

Variables

Variables

introducidas

eliminadas

Mtodo

Antiguedad,

. Intro

Areab
a. Variable dependiente: Precio

b. Todas las variables solicitadas introducidas.

Nos damos cuenta que todas las variables estn insertadas.


Resumen del modelo

Modelo
1

R
,983a

R cuadrado

R cuadrado

Error estndar

ajustado

de la estimacin

,967

,959

21,126

a. Predictores: (Constante), Antiguedad, Area

Es la estadstica de la regresin.
ANOVAa
Suma de
Modelo
1

cuadrados
Regresin

104344,478

Media
gl

cuadrtica
2

~ 84 ~

52172,239

F
116,898

Sig.
,000b

Residuo
Total

3570,431

107914,909

10

446,304

a. Variable dependiente: Precio


b. Predictores: (Constante), Antiguedad, Area

Es el anlisis de la varianza
Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1

Error estndar

(Constante)

18,968

18,886

Area

44,352

3,012

Antiguedad

-2,743

1,321

estandarizados
Beta

Sig.

1,004

,345

1,032

14,727

,000

-,145

-2,076

,072

a. Variable dependiente: Precio

COMPROBACIN
FORMA MANUAL
18.9680762
44.352118
-2.74279421

FORMULA EXCEL (REGRESIN)


Intercepcin
Area
Antigedad

18.9680762
44.352118
-2.74279421

SPSS
Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1

Error estndar

(Constante)

18,968

18,886

Area

44,352

3,012

Antiguedad

-2,743

1,321

a. Variable dependiente: Precio

~ 85 ~

estandarizados
Beta

Sig.

1,004

,345

1,032

14,727

,000

-,145

-2,076

,072

GRUPO #4

Diana Olives Moncayo


PRUEBA T SUPONIENDO VARIANZAS IGUALES
A continuacin, explicaremos como realizar una prueba T suponiendo varianzas
iguales en ambos Excel y el programa SPSS.

EXCEL
En Excel tenemos las siguientes calificaciones de dos universidades distintas, la
Universidad de Guayaquil y la Universidad Catlica. Queremos verificar si las medias
de los datos son diferentes o iguales entonces declaramos las siguientes hiptesis (cabe
recalcar en utilizaremos un margen de error de 0.05):

H1= Existe una diferencia significativa entre la media de calificaciones del grupo de la
Universidad de Guayaquil y la media de calificaciones del grupo de la Universidad
Catlica.
H0= NO existe una diferencia significativa entre la media de calificaciones del grupo
de la Universidad de Guayaquil y la media de calificaciones del grupo de la
Universidad Catlica.

En Excel, para determinar el estadstico T hay que hacer 3 pasos:

~ 86 ~

Tenemos las siguientes formulas:

Para realizar ambas frmulas elaboramos la siguiente tabla. Es solamente tomar los
datos de ambas universidades y elevarlos al cuadrado como nos pide la formula y

calcular n.

Utilizamos la funcin Contar y en este caso n1 y n2 tienen el mismo valor que es


15.

~ 87 ~

Realizamos la primera formula de esta manera:


S1:

S2:

El siguente paso para calcular la Prueba T es:

~ 88 ~

Asi realizamos la formula y obtenemos el valor 1.44.


Finalmente, determinamos la Prueba T utilizando una formula, o sea de forma manual.

Obtenemos el valor 0.1522. Este es nuestro estadstico T. Para confirmar que esta
bien, realizamos la prueba T mediante Analisis de datos en Excel.
Primero, hacemos clic en Datos y despues en Analisis de datos.

Segundo, localizamos en la lista Prueba t para dos muestras suponiendo varianzas


iguales.

~ 89 ~

Despues para cada variable, elegimos los rangos de cada universidad. En este caso el
primer rango son las calificaciones de la Universidad de Guayaquil y el segundo rango
las calificaciones de la Universidad Catlica.

Elegimos una opcion de salida. Vamos a escoger un rango de salida para que nos
aparezca en la misma hoja de trabajo.

~ 90 ~

Aqu podemos verificar que nuestro estadistico t si tiene el mismo valor que nos dio la
formula (0.1522).

Ahora, para ver cual hipotesis se rechaza y cual se acepta, observamos el estadistico t
(0.15522) y el valor critico de t (dos colas). Utilizamos dos colas porque son dos
muestras.

Si el estadistico t es MENOR que el valor critico de t,


entonces aceptamos la hipotesis nula que es que NO
existe una diferencia significativa entre las dos medias.
Rechazamos la hipotesis alterna.

H1= Existe una diferencia significativa entre la media de calificaciones del grupo de
la Universidad de Guayaquil y la media de calificaciones del grupo de la Universidad
Catlica.

H0= NO existe una diferencia significativa entre la media de calificaciones del


grupo de la Universidad de Guayaquil y la media de calificaciones del grupo de la
Universidad Catlica.

~ 91 ~

SPSS

H1= Existe una diferencia significativa entre la media de calificaciones

Abrimos el programa SPSS y copiamos los mismos datos de Excel de esta forma:

del grupo de la Universidad de Guayaquil y la media de calificaciones del


grupo de la Universidad Catlica.

H0= NO existe una diferencia significativa entre la media de


calificaciones del grupo de la Universidad de Guayaquil y la media de
calificaciones del grupo de la Universidad Catlica.

Primero, en vista de variables, le ponemos nombres a cada variable. En este caso


Universidad y Calificacin. Le bajamos a 0 decimales. Tenemos que poner etiqueta
a la variable Universidad y darle valores a cada universidad. Para eso hacemos lo
siguiente:
Hacemos clic en valores como podemos ver en la imagen.

Nos aparece la siguiente ventana. Le damos un nombre y un valor a cada universidad.


Primer en valor ponemos 1 y como etiqueta UG y hacemos clic en Aadir, esto
quiere decir que el numero 1 va a representar a la Universidad de Guayaquil.
Hacemos lo mismo para la Universidad Catolica pero ahora el numero 2 va a
representar a la UC.

~ 92 ~

El siguiente paso es copiar y pegar nuestros valores de Excel a SPSS y eso se hace
seleccionando los datos y pegarlos en SPSS en donde corresponden. Tenemos lo siguiente:

~ 93 ~

Ahora, para realizar la prueba t, hacemos clic en Analizar.

~ 94 ~

Ponemos el cursor sobre Comparar medias y despus hacemos clic en Prueba T para
muestras independientes.

Nos aparece la siguiente ventana. En esta ventana ingresamos la variable de prueba que este
caso es la variable dependiente, la calificacin de los estudiantes de cada universidad. En
Variable de agrupacin insertamos la variable Universidad.

Como podemos observar en la imagen superior, despus de universidad nos aparecen dos signos
de interrogacin. Aqu vamos a dar uso a los valores de cada etiqueta, o cada universidad.

~ 95 ~

Hacemos clic en Definir grupos y nos aparece la siguiente ventana. Si bien recordamos el
numero 1 representaba a la Universidad de Guayaquil, en este caso el grupo 1. Y el numero 2
representaba a la Universidad Catlica, en este caso el grupo 2. Hacemos clic en Continuar y
despus en Aceptar.

Finalmente, se abre otra ventana donde aparecen los datos de la Prueba T. Aqu tambin
podemos analizar las medias. Tambin se puede verificar el valor del estadstico t (0,152) que
es igual al de Excel.
En lo contrario al procedimiento en Excel, en vez de comparar el valor del estadstico t con el
valor crtico, vamos a comparar el valor significativo (si se asumen varianzas iguales) con
nuestro margen de error (0.05) para ver cul hiptesis se rechaza o se acepta.

Nuestro valor significativo es 0.88.

~ 96 ~

Si el Pvalor es mayor que el margen de error, entonces se


acepta la hiptesis nula y se rechaza la hiptesis alterna.

H1= Existe una diferencia significativa entre la media de calificaciones


del grupo de la Universidad de Guayaquil y la media de calificaciones del
grupo de la Universidad Catlica.

H0= NO existe una diferencia significativa entre la media de


calificaciones del grupo de la Universidad de Guayaquil y la media de
calificaciones del grupo de la Universidad Catlica.

~ 97 ~

ESTADIGRAFO Z PARA LA DISTRIBUCIN NORMAL

Determina el nmero de desviaciones estndar entre algn valor X y la media de


la poblacin. Para calcular el valor de Z usamos la siguiente frmula.

VALOR REQUERIDO

MEDIA

DESVIACION ESTANDAR

Ejemplo en datos simples:

El gerente de personal de una gran compaa requiere que los solicitantes


a un puesto efecten cierta prueba y alcancen una calificacin de 500. Si
las calificaciones de la prueba se distribuyen normalmente con media 485
y desviacin estndar 30 Qu porcentaje de los solicitantes pasar la
prueba?

VARIABLE
MEDIA
DESV. ESTA

500
485
30

0.50

~ 98 ~

Ejemplo en datos agrupados:

En una poblacin de 17 personas varan sus edades con un aumento de


3 aos en cada una de ellas, a continuacin hallar la distribucin normal
y las edades de los individuos empezando con la primera edad que es de
3 aos.
#DE PERSONAS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

EDAD
3
6
9
12
15
18
21
24
27
30
33
36
39
42
45
48
51

Pasos a utilizar para hallar la distribucin normal en Excel:


1. Hallar la media de los datos
=PROMEDIO(datos)
En nuestro caso los datos es la edad

2. Hallar la desviacin estndar


=desvest(datos)
En nuestro caso los datos es la edad

3. Aplicamos la frmula de la distribucin normal

Z
ESTNDAR

Z= (EDAD MEDIA) / DESVIACIN

~ 99 ~

GRAFICO:
1. Seleccionamos los valores de la columna DISTRIBUCIN NORMAL
2. Damos clic en INSERTAR, Grafico de dispersin.

PASOS PARA HALLAR DISTRIBUCIN NORMAL EN SPPS


1. INGRESAMOS LOS DATOS

~ 100 ~

2. DEBEMOS CALCULAR MEDIA Y DESVIACIN ESTNDAR


Damos clic en ANALIZAR, luego en COMPARAR MEDIDAS, y por ltimo en MEDIAS
Ubicamos la lista de datos dependientes e independientes y damos clic en aceptar

~ 101 ~

3. DAMOS CLIC EN TRANSFORMAR Y LUEGO EN CALCULAR VARIABLE

En el grupo defunciones escogemos FDP Y FDPNO CENTRADA


En funciones y variables especiales damos clic en Pdf.Normal
4. INGRESAMOS LOS DATOS QUE NOS PIDE LA FORMULA Y ACEPTAMOS

5. AUTOMTICAMENTE APARECE LA COLUMNA DE LA DISTRIBUCIN NORMAL

~ 102 ~

GRAFICO
1. DAMOS CLIC EN GRFICOS, CUADRO DE DILOGOS ANTIGUOS Y
DISPERSIN/PUNTOS

2. ESCOGEMOS DISPERSIN SIMPLE Y DAMOS CLIC EN DEFINIR

3. SELECCIONAMOS LAS VARIABLES Y ACEPTAMOS

~ 103 ~

EN NUESTRA HOJA DE RESULTADOS APARECER EL GRAFICO DE NUESTRA


DISTRIBUCIN.

~ 104 ~

MATERIA: COMPUTACION APLICADO A LA


ESTADISTICA

TEMA:

INTEGRANTES:

ESTADISTICO F O DISTRIBUCION F

VERONICA REYES DEL PEZO


ROSA ADRIAN CERCADO
FREDDY MIGUEL NUEZ

PROFESOR:

Econ. GALO APOLO

2015 - 2016

~ 105 ~

~ 106 ~

INDICE

Tabla de contenido
CONCEPTO .................................................................................................................................... 1
CALCULO DEL ESTADISTICO F .................................................................................................. 2
DETERMINACION DE LOS GRADOS DE LIBERTAD ................................................................... 3
EJERCICIO.................................................................................................................................. 4
FORMA MAUAL........................................................................................................................ 5
FORMA FUNCION ..................................................................................................................... 8
FORMA IBM
SPSS.....10

~ 107 ~

PRUEBA FISHER O ESTADISTICO F


1.1.-Concepto.- Esta es la distribucin de probabilidad de la razn de dos varianzas,
provenientes de 2 poblaciones diferentes. Por medio de esta distribucin es posible
determinar la probabilidad de ocurrencia de una razn especifica.

1.1.1.-Caractersticas de la distribucin F
1.- Existe una distribucin F diferente para cada combinacin de tamao de muestra y
numero de muestras. Por lo tanto existe una distribucin F que se aplica cundo se toman
cinco muestras de seis observaciones cada una. En caso de la distribucin F, los valores
crticos para los niveles 0,005 y 0,01 generalmente se proporcionan para determinadas
combinaciones de tamaos de muestra y numero de muestras.
2.- La distribucin es continua respecto al intervalo de 0 a + . La razn no puede ser
negativa, ya que ambos trminos de la razn F estn elevados al cuadrado. Por otra
parte, grandes diferencias entre valores medios de muestra, acompaadas de pequeas
variancias mustrales pueden dar como resultado valores extremadamente grandes de
la razn F. La distribucin F no puede ser negativa, El menor valor que F puede tomar
es 0.
3.- La forma de cada distribucin de muestreo terico F depende del nmero de grados
de libertad que estn asociados a ella. Tanto el numerador como el denominador tienen
grados de libertad relacionados.
4.- Tiene sesgo positivo la cola larga de la distribucin es hacia el lado derecho. Cuando
el nmero de grados de libertad aumenta, tanto en el numerador como en el
denominador, la distribucin se aproxima a ser normal.
5.- Es asinttica cuando los valores de X aumentan, la curva F se aproxima al eje X pero
nunca lo toca. Este caso es similar al comportamiento de la distribucin de
probabilidad normal.

2.1.-Anlisis de la Varianza (ANOVA)


Tambin se la utiliza la distribucin F en el anlisis de la tcnica de la varianza
(ANOVA), en la cual se comparan tres o ms medias poblacionales para determinar si
pueden ser iguales. Para emplear ANOVA, se supone lo siguiente:
1.- Las poblaciones siguen la distribucin normal.
2.- Las poblaciones tienen desviaciones estndares iguales.
3.- Las poblaciones son independientes.
Cuando se cumplan estas condiciones, F se emplea la prueba del estadstico de prueba .
Por qu es necesario estudiar ANOVA? Por qu no solo se emplea la prueba de las
diferencias entre medias poblacionales. La razn ms importante es la acumulacin

~ 108 ~

indeseable del error tipo 1. Suponga cuatros mtodos distintos (A, B, C, D) para capacitar
personal para ser bomberos. La asignacin de cada uno de los 40 prospectos del grupo
de este ao es aleatoria en cada uno de los cuatros mtodos. Al final del programa de
capacitacin, a los cuatros grupos se les administra una prueba comn para medir la
compresin de las tcnicas contra incendios. La pregunta es: existe una diferencia entre
las calificaciones medias del examen de los cuatros grupos? La respuesta a esta pregunta
permitir comprar los cuatros mtodos de capacitacin.

CALCULO DEL ESTADISTICO F (MATEMATICAMENTE)

Nota: Para calcular el estadstico f podemos utilizar las funciones de anlisis de


varianzas tales como:

ANOVA
PRUEBA T
PRUEBA ESTADISITICO F
REGRESION LINEAL
CHI-CUADRADO

2.1.1-Determinacin de los grados de libertad


Los grados de libertad para el numerador y le denominador del a funcin F se basan en
los clculos necesarios para derivar cada estimacin de la variancia de la poblacin. La
estimacin intermediante de varianza (numerador) comprende la divisin de la suma de

~ 109 ~

las diferencias elevadas al cuadrado entre el nmero de medias (muestras) menos uno,
o bien, k 1. As, k -1 es el nmero de grados de libertad para el numerador.
En forma semejante, el calcular cada variancia muestral, la suma de las diferencias
elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se
divide entre el nmero de observaciones de la muestra menos uno, o bien, n 1. Por lo
tanto el promedio de las variancias mustrales se determina dividiendo la suma de las
variancias de la muestra entre el nmero de muestras, o K. los grados de libertad para
el denominador son entonces, k(n 1).

Los trminos
Son las varianzas mustrales respectivas. Si la hiptesis nula es verdadera, el estadstico
de prueba.
Sigue la distribucin F con n1 1 y n2 1 grados de libertad. A fin de reducir el tamao
de la tabla de valores crticos, la varianza ms grande de la muestra se coloca en el
numerador; de aqu, la razn F que se indica en la tabla siempre es mayor que 1.00. As,
el valor crtico de la cola derecha es el nico que se requiere. El valor crtico de F de una
prueba de dos colas se determina dividiendo el nivel de significancia entre dos y despus
se consultan los grados de libertad apropiados en el apndice.
3.1.-Ejercicio N1

APLICADO EN EXCEL
3.1.1FORMA MANUAL
Un profesor universitario tiene en su grupo de alumnos que provienen de 4 escuelas
de bachillerato, despus de aplicarles el primer examen, obtiene los siguientes
resultados:
ESCUELA A ESCUELA B
6
6
8
7
9
8

ESCUELA C
10
6
5

ESCUELA D
9
9
9

6
7

Nominacin de cada elemento:


Formula Matemticas aplicar:

t 2c
2
~ 110

SCT
x / ~N
nc
T 2c

1er Paso

2do Paso

Desarrollo del primer paso


SCT= Suma de Cuadrados de Factor Fuente

Suma total de las variables obtenidas

Suma total de las variables independiente

Suma total de Nmero de datos

Nmero de datos

Desarrollo del segundo paso


SCE= Suma de cuadrado error

Suma total de X ^2

Suma total de las variables obtenidas

~ 111 ~

SUMAS

CUADRADO
S
36

36

100

81

TOTAL
253

64

49

36

81

230

81

64

25

81

251

81

36

117

49

49
900

Suma total de Nmero de datos


Luego de desarrollar independientemente las partes de la frmula matemtica procedemos a
realizar la TABLA ANOVA

FUENTE
FACTOR
ERROR

MANUAL
GRADOS DE LIBERTAD
3
11

SUMA DE CUADRADOS
10.8
22.8

TOTAL

CALCULO DE LA SUMA AL CUADRADO:


Suma total de las variables obtenidas
Factor

Suma total de las variables


Independiente

Suma total de Nmero de datos

Nmero de datos

CALCULO DEL GRADO DE LIBERTAD:

NUMERO DE VARIABLES MENOS UNO


NUMERO TOTAL DE DATOS MENOS UNO

CALCULO DE GRADO MEDIO:

~ 112 ~

CUADRADO MEDIO
3.6
2.07

F
1.74

SUMA DE CUADRDOS
TOTAL DE LOS GRADOS DE LIBERTAD DEL FACTOR

SUMA DE CUADRADOS
TOTAL DE LOS GRADOS DE LIBERTAD DE ERROR

Obtenidos estos datos (3.6 y 2.07), los dividimos y como resultado me da 1.74 que es
la funcin F como lo vemos en la grafica remarcada de color rojo.

3.1.2 FORMA FUNCION

~ 113 ~

Posteriormente vamos al MENU de Excel parte superior y damos clic en DATOS y luego
HERRAMIENTA DE ANALISIS DE DATOS y nos despliega una ventana llamada ANALISIS
DE DATOS posteriormente damos clic en ANALISIS DE VARIANZA DE UN FACTOR

~ 114 ~

Posteriormente siguiendo el proceso me aparece una ventana llamada ANALISIS DE


VARIANZA DE UN FACTOR luego sombreo los rtulos con los datos de todas las escuelas
y activo una pestaa en la casilla ROTULOS y activo RANGO DE SALIDA para obtener los
datos en la misma celda. Doy clic en aceptar y me aparece el anlisis de varianza de un
factor

Comparamos los resultados que estn remarcados con rojo y notamos que de la forma
matemtica y Excel el estadstico F es el mismo resultado.

~ 115 ~

3.1.3 APLICADO EN IBM SPSS STATISTICS


Abrimos el programa IBM SPSS STATISTCS
Luego en vista de variables colocamos las variables en este caso son las variables
ESCUELAS y ALUMNOS (poblacin), en decimales dejamos en cero el valor, luego a
vamos valores y me aparece una ventana que dice etiquetas de valor. En VALOR
colocamos el uno porque es la primera escuela y en ETIQUETA colocamos ESCUELA A y
damos clic en aadir posteriormente le damos valor a las siguientes escuelas como lo
hicimos con la ESCUELA A. Luego damos clic en aceptar y se agregan las 4 escuelas.

~ 116 ~

Luego vamos a vista de datos y colocamos los datos que tenemos en Excel , es decir en
ESCUELA colocamos el tipo de ESCUELA A,B,C O D y en POBLACION colocamos los
DATOS de cada escuela.

~ 117 ~

Luego vamos a la opcin del men ANALIZAR damos clic y posteriormente vamos a
COMPARAR MEDIAS y luego ANOVA DE UN FACTOR y damos clic.

Siguiendo el proceso anterior me aparece una ventana llamada ANOVA DE UN FACTOR


y coloco en lista de dependientes la POBLACION y en factor ESCUELA y luego doy clic
en Post hoc.

~ 118 ~

Siguiendo el proceso anterior me aparece una ventana llamada ANOVA DE UN FACTOR


COMPARACIONES MULTIPLES POST HOC y activo con una pestaa en la casilla DMS
posteriormente doy clic en CONTINUAR.

~ 119 ~

Siguiendo el proceso anterior despus doy clic en OPCIONES y me aparece una ventana
llamada ANOVA DE UN FACTOR OPCIONES activo con una pestaa en las casillas
DESCRIPTIVOS, PRUEBA DE HOMOGENIEDAD DE LAS VARIANZAS y GRAFICOS DE LAS
MEDIAS y doy clic en CONTINUAR.

~ 120 ~

Luego del proceso anterior me aparecer una ventana nueva de resultado, en esta
ventana observamos los diferentes resultados como los GRADOS DE LIBERTAD y el
ESTADISTICO F con el mismo valor de FORMA MANUAL O MATEMATICAMENTE, EXCEL
y IBM SPSS. Los resultados los podemos comparar de FORMA MANUAL O
MATEMATICAMENTE, EXCEL y IBM SPSS ya que estn sombreados de color rojo.

~ 121 ~

ANOVA
poblacion
Suma de
cuadrados

Media
gl

cuadrtica

Entre grupos

10,800

3,600

Dentro de grupos

22,800

11

2,073

Total

33,600

14

~ 122 ~

F
1,737

Sig.
,217

En conclusin: Se acepta la hiptesis nula y se rechaza la hiptesis alternativa. Si el


resultado F hubiera sido mayor que mi F critico como conclusin rechazo la hiptesis
nula y acepto la hiptesis alternativa.

Zona de aceptacin
de la hiptesis nula

Zona de rechazo

Se busca el valor crtico en la tabla de la distribucin F

~ 123 ~

Das könnte Ihnen auch gefallen