Sie sind auf Seite 1von 82
MBA EM BUSINESS INTELLIGENCE APOSTILA DE ESTATISTICA APLICADA A BUSINESS INTELLIGENCE Prof°. Giancarlo de França

MBA EM BUSINESS INTELLIGENCE

APOSTILA DE ESTATISTICA APLICADA A BUSINESS INTELLIGENCE

APOSTILA DE ESTATISTICA APLICADA A BUSINESS INTELLIGENCE Prof°. Giancarlo de França Aguiar Email:
APOSTILA DE ESTATISTICA APLICADA A BUSINESS INTELLIGENCE Prof°. Giancarlo de França Aguiar Email:

Prof°. Giancarlo de França Aguiar

1
1
Esta apostila contém material base e introdutório para a cadeira de Estatística Aplicada a Business
Esta apostila contém material base e introdutório para a cadeira de Estatística Aplicada a Business
Intelligence (30 horas) do MBA em Business Intelligence da Universidade Positivo. Este material
foi organizado de modo enxuto para proporcionar uma visão técnica de algumas ferramentas de
Estatística que serão abordados durante todo o curso. De maneira alguma, este descritivo objetiva
excluir os referenciais bibliográficos constantes na literatura, mas promover a facilidade no tratar
de negócios para estudantes oriundos de cursos de graduação que tiveram ou não a disciplina
Estatística.
Prof. Giancarlo de França Aguiar
2

Sumário

1.0

Apresentação

04

2.0

Distribuição de Probabilidades

06

3.0

Descrição, Exploração e Comparação de Dados

12

3.1 Tabelas de Frequência

12

3.2 Medidas de Tendência Central

18

3.3 Medidas de Dispersão

21

4.0

Probabilidade por Meio de Simulação

27

5.0

Análise de Correlação Linear

30

6.0

Análise de Regressão Linear

36

7.0

Simulação

41

7.1 Modelos de Programação Linear

41

7.2 Simulação em Excel

52

7.3 Modelos de Estoques

54

7.4 Simulação

68

8.0

Planejamento de Projetos

75

8.1 Redes PERT

75

8.2 Redes PERT/Custo

78

9.0

Referências

82

1.0 APRESENTAÇÃO

É presente no comércio, academia e indústria a procura por profissionais que tenham a competência de pensar Estatística e estimular a sua utilização. Mais do que tratar um conjunto de dados, é preciso interpretá-los. Atualmente é imprescindível tomar decisões sem algum modelo ou método que auxilie o tomador de decisões. Os slides a seguir dão uma breve noção da importância da Estatística.

método que auxilie o tomador de decisões. Os slides a seguir dão uma breve noção da
método que auxilie o tomador de decisões. Os slides a seguir dão uma breve noção da
método que auxilie o tomador de decisões. Os slides a seguir dão uma breve noção da
método que auxilie o tomador de decisões. Os slides a seguir dão uma breve noção da
método que auxilie o tomador de decisões. Os slides a seguir dão uma breve noção da
método que auxilie o tomador de decisões. Os slides a seguir dão uma breve noção da
Diz-me, e eu esquecerei; ensina-me e eu lembrar-me-ei; envolve-me, e eu aprenderei. (Autor desconhecido) 5
Diz-me, e eu esquecerei; ensina-me e eu lembrar-me-ei; envolve-me, e eu aprenderei. (Autor desconhecido) 5

Diz-me, e eu esquecerei; ensina-me e eu lembrar-me-ei; envolve-me, e eu aprenderei.

(Autor desconhecido)

2.0 DISTRIBUIÇÃO DE PROBABILIDADES

É possível explorar um conjunto de dados utilizando para isto, gráficos, tabelas e medidas que serão abordadas no próximo capítulo (3), contudo, podemos combinar essas medidas de forma a estabelecermos distribuições de probabilidades que podem descrever o que provavelmente ocorrerá.

medidas de forma a estabelecermos distribuições de probabilidades que podem descrever o que provavelmente ocorrerá. 6
medidas de forma a estabelecermos distribuições de probabilidades que podem descrever o que provavelmente ocorrerá. 6
medidas de forma a estabelecermos distribuições de probabilidades que podem descrever o que provavelmente ocorrerá. 6
medidas de forma a estabelecermos distribuições de probabilidades que podem descrever o que provavelmente ocorrerá. 6
medidas de forma a estabelecermos distribuições de probabilidades que podem descrever o que provavelmente ocorrerá. 6
medidas de forma a estabelecermos distribuições de probabilidades que podem descrever o que provavelmente ocorrerá. 6
7
7
7
7
7
7
7
7
Problemas para iniciar a discussão: 1- Problema do Jogo Pick Three Considere o jogo de

Problemas para iniciar a discussão:

1- Problema do Jogo Pick Three

Considere o jogo de números praticado há muitos anos por organizações ligadas ao crime e agora legalizados por muitos governos organizados assim como também por alguns governos não muito bem organizados. Em geral conhecido como “escolha três” (Pick three), o apostador aposta em três números, que deverão coincidir com os números sorteados (há mil possibilidades de 000 a 999). O ganho típico é de 499 para 1, o que significa que para cada $ 1 apostado o jogador recebe $500 (ou seja, um retorno líquido de $499). Suponha o leitor que apostou $1 no número 327. Qual é o valor esperado (média) de seu ganho ou perda? Considere um número significativo de jogadas/apostas (longo prazo).

R:

de seu ganho ou perda? Considere um número significativo de jogadas/apostas (longo prazo). R: Tomador de

Tomador de Decisão:

2-

Problema do Jogo do Bicho no Grupo

R:

Tomador de Decisão:2- Problema do Jogo do Bicho no Grupo R: 3- Problema do Jogo do Bicho na

3- Problema do Jogo do Bicho na Milhar

R:

Tomador de Decisão:2- Problema do Jogo do Bicho no Grupo R: Tomador de Decisão: 3- Problema do Jogo

Exercícios:

1- Ao apostar em um cassino $5 no número 7 da roleta, tem-se uma probabilidade de 1/38 de ganhar $175 e uma probabilidade de 37/38 de perder $5. Qual é o valor esperado? Em um número muito grande de apostas, quanto se perde para cada dólar apostado?

2- Uma mulher de 27 anos decide contratar uma apólice de seguro de vida de R$ 100.000,00 por um ano, pagando um premio de R$ 156,00. A probabilidade de ela sobreviver um ano é de 0,9995 (base de dados do Ministério da Saúde). Qual é o seu valor esperado para a apólice de seguro?

Nos exercícios (3, 4, 5 e 6), determine se é dada uma distribuição de probabilidades. Caso sim construa o seu histograma de frequências e calcule a sua média, variância e o desvio-padrão.

3- Ao escolher aleatoriamente um colega de cela condenado por dirigir alcoolizado (DA), a distribuição de probabilidade do número “x” de sentenças anteriores em casos de (DA) é dada na tabela a seguir.

x

P

(x)

0

0,512

1

0,301

2

0,132

3

0,055

4- Se sua faculdade contrata os 4 próximos funcionários sem distinção de sexo e o conjunto de candidatos é grande, com números iguais de homens e mulheres, o quadro a seguir dá a distribuição do número x de mulheres contratadas.

x

P

(x)

0

0,0625

1

0,2500

2

0,3750

3

0,2500

4

0,0625

5- Para resolver uma questão de paternidade, fazem-se testes de sangue em duas pessoas diferentes. Se “x” é o número dos que têm sangue do grupo A, então “x” pode ser 0, 1 e 2, e as probabilidades correspondentes são 0,36; 0,48 e 0,16, respectivamente.

6- Ao avaliar riscos de crédito, o Jefferson Valley Bank investiga o número de cartões de crédito que a pessoa tem. Com “x” sendo o número de cartões de crédito que os adultos possuem. O quadro a seguir dá a distribuição de probabilidades para um conjunto de solicitantes (base da dados da Matriz Marketing Research , Inc.).

x

0

1

2

3

4

5

6

7

P(x)

0,26

0,16

0,12

0,09

0,07

0,09

0,07

0,14

São dois os mais fortes dos guerreiros: o tempo e a paciência”.

3.0 DESCRIÇÃO, EXPLORAÇÃO E COMPARAÇÃO DE DADOS

3.1 Tabelas de Frequência

3.0 DESCRIÇÃO, EXPLORAÇÃO E COMPARAÇÃO DE DADOS 3.1 Tabelas de Frequência 12
3.0 DESCRIÇÃO, EXPLORAÇÃO E COMPARAÇÃO DE DADOS 3.1 Tabelas de Frequência 12
3.0 DESCRIÇÃO, EXPLORAÇÃO E COMPARAÇÃO DE DADOS 3.1 Tabelas de Frequência 12
3.0 DESCRIÇÃO, EXPLORAÇÃO E COMPARAÇÃO DE DADOS 3.1 Tabelas de Frequência 12
3.0 DESCRIÇÃO, EXPLORAÇÃO E COMPARAÇÃO DE DADOS 3.1 Tabelas de Frequência 12
3.0 DESCRIÇÃO, EXPLORAÇÃO E COMPARAÇÃO DE DADOS 3.1 Tabelas de Frequência 12
13
13
13
13
13
13
13
13
“O trabalho espanta três males: o vício, a pobreza e o tédio”. Problema para iniciar
“O trabalho espanta três males: o vício, a pobreza e o tédio”. Problema para iniciar
“O trabalho espanta três males: o vício, a pobreza e o tédio”. Problema para iniciar
“O trabalho espanta três males: o vício, a pobreza e o tédio”. Problema para iniciar

“O trabalho espanta três males: o vício, a pobreza e o tédio”.

Problema para iniciar a discussão:

Voltaire

Os dados da tabela abaixo fornecem o tempo em dias exigido para se completar auditorias de fim de ano para uma amostra de 20 clientes da Sanderson and Clifford, uma pequena firma de contabilidade. Construir uma tabela de frequências, frequências relativas e frequências acumuladas para os dados.

 

Tempo em dias de auditorias de fim de ano

 

12

14

19

18

15

15

18

17

20

27

22

23

22

21

33

28

14

18

16

13

R:

R: Exercícios Tomador de Decisão: 1- Um radar da polícia rodoviária registrou as velocidades de 50

Exercícios

Tomador de Decisão:

1- Um radar da polícia rodoviária registrou as velocidades de 50 veículos em uma rodovia, obtendo-se os seguintes resultados (velocidade em Km/h):

75,3

78,5

65,6

80,0

79,2

36,8

77,9

80,7

78,2

50,3

83,0

67,2

75,0

73,9

85,0

78,6

79,0

81,6

35,9

67,8

79,2

81,0

79,3

68,0

77,2

79,6

70,2

90,6

80,9

73,6

78,1

80,0

80,0

79,9

74,0

55,4

60,7

80,2

77,0

80,0

82,0

83,1

79,6

80,5

65,7

83,7

68,0

75,6

71,9

78,3

Monte uma tabela de freqüência com 7 classes.

2- As companhias de seguro pesquisam continuamente as idades e as causas de morte. Construa um histograma correspondente aos dados da tabela de frequências abaixo. Os dados se baseiam em um estudo da revista Time sobre vítimas fatais de armas de fogo na América durante uma semana. O que o histograma sugere quanto às idades dessas vítimas fatais?

Idade na Morte

Frequência

16

25

22

26

35

10

36

45

6

46

55

2

56

65

4

66

75

5

76

85

1

3- O tempo que cada cliente de um restaurante permanece na mesa foi medido. Para uma amostra de 50 clientes, os dados obtidos (tempo em minutos) e já organizados em tabela de frequência, foram:

Tempo de Permanência (min)

Frequência

10

2010 5

5

2

302 13

13

30

4030 19

19

40

5040 9

9

50

6050 2

2

60

7060 1

1

70

8070 1

1

 

Soma

50

Construa um histograma e um polígono de frequência (unindo os pontos médios da parte superior de cada retângulo do histograma com segmentos de reta, obtemos o chamado polígono de frequência) para esses dados.

4- Uma pesquisa coletou o consumo comercial de energia elétrica (Eletrobrás) de 1970 a 2010. Fonte: IPEA, 2012 (http://www.ipeadata.gov.br/).

Data

Consumo de Energia Elétrica

1970

5.158

1971

5.679

1972

6.396

1973

7.237

1974

8.117

1975

8.987

1976

9.860

1977

10.487

1978

11.340

1979

12.539

1980

13.750

1981

14.424

1982

15.477

1983

16.754

1984

17.704

1985

18.539

1986

19.610

1987

20.465

1988

21.337

1989

22.367

1990

23.790

1991

24.957

1992

25.940

1993

27.392

1994

28.869

1995

32.276

1996

34.764

1997

38.197

1998

41.544

1999

43.589

2000

47.627

2001

44.433

2002

45.255

2003

47.522

2004

49.609

2005

52.985

2006

55.308

2007

58.744

2008

61.949

2009

65.379

2010

69.080

Monte uma tabela de frequências.

5- Uma pesquisa coletou o risco Brasil (título de dívida) em 2012. Fonte: IPEA, 2012 (http://www.ipeadata.gov.br/). Monte uma tabela de frequências.

 

Risco

Data

Brasil

19/03/2012

163

16/03/2012

171

15/03/2012

167

14/03/2012

163

13/03/2012

168

12/03/2012

180

09/03/2012

179

08/03/2012

183

07/03/2012

193

06/03/2012

198

05/03/2012

190

02/03/2012

190

01/03/2012

190

29/02/2012

194

28/02/2012

199

27/02/2012

205

24/02/2012

201

23/02/2012

199

22/02/2012

196

17/02/2012

197

16/02/2012

201

15/02/2012

205

14/02/2012

204

13/02/2012

196

10/02/2012

198

09/02/2012

195

08/02/2012

201

07/02/2012

204

06/02/2012

209

03/02/2012

205

02/02/2012

217

01/02/2012

216

31/01/2012

221

30/01/2012

221

27/01/2012

218

26/01/2012

218

25/01/2012

212

24/01/2012

209

23/01/2012

209

20/01/2012

211

19/01/2012

218

18/01/2012

227

17/01/2012

232

16/01/2012

233

13/01/2012

237

12/01/2012

228

11/01/2012

232

10/01/2012

223

09/01/2012

217

06/01/2012

214

05/01/2012

212

04/01/2012

212

03/01/2012

214

02/01/2012

223

3.2 Medidas de Tendência Central

05/01/2012 212 04/01/2012 212 03/01/2012 214 02/01/2012 223 3.2 Medidas de Tendência Central 18
05/01/2012 212 04/01/2012 212 03/01/2012 214 02/01/2012 223 3.2 Medidas de Tendência Central 18
19
19
19
19
19
19
19
19
20
20
20
20
20
20
20

3.2 Medidas de Dispersão

3.2 Medidas de Dispersão 21
3.2 Medidas de Dispersão 21
3.2 Medidas de Dispersão 21
3.2 Medidas de Dispersão 21
3.2 Medidas de Dispersão 21
3.2 Medidas de Dispersão 21
3.2 Medidas de Dispersão 21
3.2 Medidas de Dispersão 21
Problema para iniciar a discussão: Com a tabela de frequências para a variável aleatória “tempo

Problema para iniciar a discussão:

Problema para iniciar a discussão: Com a tabela de frequências para a variável aleatória “tempo em

Com a tabela de frequências para a variável aleatória “tempo em dias exigido para se completar auditorias de fim de ano” para uma amostra de 20 clientes da Sanderson and Clifford, construída no capítulo anterior:

a) Determine à média e o desvio-padrão para o conjunto de dados agrupados.

b) Utilize o teorema de Theibichev (

1

1

K

2

) para determinar um intervalo de

T T

confiança para a média populacional. Utilize K 2.

R:

um intervalo de T T  confiança para a média populacional. Utilize K  2. R:

Tomador de Decisão:

Exercícios

1- O tempo que cada cliente de um restaurante permanece na mesa foi medido. Para uma amostra de 60 clientes, os dados obtidos (tempo em minutos) foram organizados no quadro a seguir. Determine a média e desvio-padrão dos dados resumidos na tabela de

) para determinar um

frequências. Utilize o teorema de Theibichev (

1

K

2

T T

1

intervalo de confiança para a média populacional. Utilize K 2.

Tempo de Permanência (min)

Freqüência

10

19

13

20

29

5

30

39

9

40

49

18

50

59

2

60

69

11

70

79

2

 

Soma

60

2- As companhias de seguro pesquisam continuamente as idades e as causas de morte. Construa um histograma correspondente aos dados da tabela de freqüências abaixo. Os dados se baseiam em um estudo da revista Times sobre vítimas fatais de armas de fogo na América durante uma semana. O que o histograma sugere quanto às idades dessas vítimas fatais? Calcule a sua média e o desvio-padrão. Utilize o teorema de Theibichev

(

) para determinar um intervalo de confiança para a média populacional.

1

K

2

T T

1

Utilize K 2.

Idade na Morte

Freqüência

16

25

22

26

35

10

36

45

6

46

55

2

56

65

4

66

75

5

76

85

1

3- Milhões de americanos se levantam todas as manhãs e vão para o escritório, em sua própria casa. Sugere-se que o uso de computadores pessoais seja uma das razões para que mais pessoas possam trabalhar em casa. A seguir está uma amostra de dados, por idade, de indivíduos que trabalham em casa:

22

58

24

50

29

52

57

31

30

41

44

40

46

29

31

37

32

44

49

29

Calcule a média e o desvio-padrão. Utilize o teorema de Theibichev (

1

T T  

1

K

2

) para

determinar um intervalo de confiança para a média populacional. Utilize K 2.

4- Um departamento de produção usa um procedimento de amostragem para testar a qualidade de itens recém-produzidos. O departamento emprega a seguinte regra de decisão em uma estação de inspeção: se uma amostra de 14 itens tem uma variância de mais que 0,005, a linha de produção precisa ser paralisada para reparos. Suponha que os seguintes dados tenham sido coletados:

3,43

3,45

3,43

3,48

3,52

3,50

3,39

3,48

3,41

3,38

3,49

3,45

3,51

3,50

A linha de produção deveria ser paralisada? Por quê?

5- Um posto de gasolina registrou a seguinte distribuição de frequência para o número de litros de gasolina vendidos por carro em uma amostra de 680 carros.

Gasolina (litros)

Frequência

0

4

74

5

9

192

10

14

280

15

19

105

20

24

23

25

29

6

 

Total

680

Calcule a média, a variância e o desvio-padrão para esses dados agrupados. Se o posto de gasolina espera atender cerca de 120 carros em um determinado dia, qual é a estimativa do número total de litros de gasolina que serão vendidos?

Exercícios Complementares

1- A Média Harmônica costuma ser usada como medida de tendência central para conjuntos de dados que consistem em taxas de variação, como por exemplo, velocidades. A média harmônica é obtida dividindo-se o número n de valores pela soma dos inversores de todos os valores. Se expressa como:

n 1

x

(nenhum valor pode ser zero) Por exemplo, teremos como média harmônica para os números 2, 4 e 10:

n

3

3

1

x

1

1 0,85

1

2

4

10

3,5

Um despachante calcula a velocidade média, em milhas por hora, do percurso de ida e volta entre duas cidades. Dá-se a seguir os resultados obtidos em 14 viagens diferentes. Com base nestes dados, qual é a velocidade média harmônica de um ônibus neste percurso?

42,6

41,3

38,2

42,9

43,4

43,7

40,8

34,2

40,1

41,2

40,5

41,7

39,8

39,6

2- A Média Geométrica é usada em administração e economia para achar taxas médias de variação, de crescimento, ou razões médias. Dados n valores (todos positivos), a média geométrica é a raiz n ma do seu produto. Por exemplo, determina-se a média geométrica de 2, 4 e 10 multiplicando-se os três valores (o que neste caso da 80) e tomando-se a raiz cúbica do resultado (porquê há 3 valores). O resultado é 4,3. O fator de crescimento médio para o dinheiro composto às taxas anuais de juro de 10%, 8%, 9%, 12% e 7% pode ser determinado calculando-se a média geométrica de 1.10, 1.08, 1.09, 1.12 e 1.07. Calcule esse fator médio de crescimento.

3- A Média Quadrática é utilizada em geral em experimentos físicos. Em sistemas de distribuição de energia, por exemplo, as tensões e correntes são em geral dadas em termos de sua média quadrática. Obtém-se a média quadrática de um conjunto de valores elevando-se cada um ao quadrado, somando-se os resultados, dividindo-se o total pelo número n de valores e tomando-se a raiz quadrada do resultado. Por exemplo, obtemos a média quadrática de 2, 4 e 10:

 x 2 4  16  100 120    40 n 3
 x
2
4
16
100
120
 
40
n
3 3

6,3

Calcule a média quadrática dos seguintes valores de fornecimento de energia (em volts):

151

162

0

81

- 68

4- A Média Ponderada é utilizada quando os valores dos dados têm diferentes pesos. Consideremos que em uma festa escolar existam pessoas com 18, 19, 20, 35 e 40 anos de idade. Além disso, consideremos também que sejam 5 pessoas com 18 anos, 9 com 19 anos, 4 com 20 anos, 1 com 35 anos e 1 com 40 anos. A média ponderada é o resultado da soma dos produtos do número de pessoas (por idade) multiplicado por suas idades, divididos pelo número total de pessoas.

média ponderada

m

k

1

k

k

.

p

k

m

k 1

p

k

18.5

19.9

20.4

35.1

40.1

5

 

9

4

 

1

1

20,8

Um aluno de estatística tirou nota 8,5 na primeira prova, 3,5 na segunda, 4,5 na terceira e 4,5 na última. Calcule a média ponderada com peso 2 para a primeira prova, peso3 para a segunda, peso 2 para a terceira e peso 3 para a quarta.

5- Calcule a média dos dados da tabela a seguir inserindo na própria tabela as colunas que representam a média dos intervalos de classe e seu produto pela freqüência

 

Classe

Freqüência

10

10 12 4

12

4

12

12 14 12

14

12

14

14 16 21

16

21

16

 

18

13

18

18 20 6

20

6

“A riqueza de um homem está em seu coração. É em seu coração que ele é o rei do mundo. Viver não exige a posse de tantas coisas”.

Giono

4.0 PROBABILIDADE POR MEIO DE SIMULAÇÃO

A determinação direta de probabilidades de eventos às vezes é muito difícil. Eventualmente os resultados, embora corretos, não são o que esperávamos. Em lugar de confiar exclusivamente nos princípios abstratos da teoria das probabilidades, a simulação pode vir a ajudar-nos.

Definição: Uma simulação de um experimento é um processo que se comporta como o próprio experimento, produzindo resultados análogos.

Exemplo 1: Em técnicas de teste sobre seleção de sexo, os pesquisadores médicos precisam conhecer probabilidades relacionadas com o sexo de nascituros. Admitindo que os sexos (masculino e feminino) sejam igualmente prováveis, descreva um experimento que simule o sexo em nascimentos.

R: Vamos representar como:

1 = Masculino

e

0 = feminino

Agora vamos simular 20 nascimentos:

Masculino e 0 = feminino Agora vamos simular 20 nascimentos: Função: aleatórioentre(0;1) Obtivemos: doze (uns) e

Função: aleatórioentre(0;1)

Obtivemos: doze (uns) e oito (zeros). Ou seja,

P(masculino) = 12/20 = 0,6 = 60%

P(feminino) = 8/20 = 0,4 = 40% em simulação.

Exemplo 2: A fabricante de telefones celulares Delmarva Comunications Company vem experimentando uma taxa de 6% de defeitos. O controlador de qualidade sabe que os telefones são produzidos em lotes de 240 e que, em média, há aproximadamente 15 defeitos por lote. Ele deseja saber a variação típica do número de defeitos. Descreva uma simulação de 240 telefones celulares fabricados com um taxa de 6% de incidência de defeitos.

R: Tomamos a taxa de defeito 0,06 (ou seja, 6 a cada 100 lançamentos). Tomaremos que:

os números 1, 2, 3, 4, 5 e 6 representarão os defeitos, e

os números 7, 8,

, 100 representarão os não-defeitos.

Simulando 240 lançamentos de 1 a 100 e ordenando os dados:

Simulando 240 lançamentos de 1 a 100 e ordenando os dados: Obtivemos por simulação um total

Obtivemos por simulação um total de 14 defeitos em um lote de 250 celulares.

Realizando 10 simulações obtivemos os seguintes resultados:

14

11

8

15

9

14

15

9

10

12

Média e Desvio-Padrão do número de defeitos:

_

x

x

117

n

10

11,7

S

  ( x  x n  1
( x
x
n  1

) 2 2,6687

Coeficiente de Variação:

Exercícios para sala:

2,6687

11,7

0,2280

22,8%

1-

Simule

o

lançamento

de

um

dado

não

viciado

200

vezes

e

encontre

as

probabilidades de sair os números 1, 2, 3, 4, 5 e 6.

 

2- Simule o lançamento probabilidade sair cara.

de

uma

moeda

não

viciada

100

vezes

e

encontre

a

“Todo o nosso descontentamento por aquilo que nos falta procede da nossa falta de gratidão por aquilo que temos”.

Daniel Defoe

5.0 ANÁLISE DE CORRELAÇÃO LINEAR

5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
5.0 ANÁLISE DE CORRELAÇÃO LINEAR 30
31
31
31
31
31
31
31
31
Problemas para iniciar a discussão: 1- O gerente de uma grande loja está interessado em
Problemas para iniciar a discussão: 1- O gerente de uma grande loja está interessado em
Problemas para iniciar a discussão: 1- O gerente de uma grande loja está interessado em

Problemas para iniciar a discussão:

Problemas para iniciar a discussão: 1- O gerente de uma grande loja está interessado em investigar
Problemas para iniciar a discussão: 1- O gerente de uma grande loja está interessado em investigar
Problemas para iniciar a discussão: 1- O gerente de uma grande loja está interessado em investigar

1- O gerente de uma grande loja está interessado em investigar a relação entre o número de comerciais mostrados no fim de semana e as vendas na loja durante a semana seguinte. Os dados de amostra com as vendas expressas em centenas de dólares são fornecidos no quadro a seguir:

 

Dados de Amostra para a Loja

 

N° de Comerciais

Volume de Vendas

Semana

“x”

“y”

1

2

50

2

5

57

3

1

41

4

3

54

5

4

54

6

1

38

7

5

63

8

3

48

9

4

59

10

2

46

Existe algum relacionamento entre o número de comerciais e o aumento no volume de vendas?

R:

46 Existe algum relacionamento entre o número de comerciais e o aumento no volume de vendas?

Tomador de Decisão:

Exercícios

1- A Média Industrial Dow Jones (DJIA) e o índice Standard & Poor´s 500 (S&P 500) são ambos utilizados como medidas do movimento global no mercado de ações. O DJIA é baseado no movimento de preços de 30 ações; o S&P 500 é um índice composto de 500 ações. Alguns dizem que o S&P 500 é uma medida melhor do desempenho do mercado de ações porque é baseado em maior número de ações. O Quadro a seguir ilustra o preço de fechamento para o DJIA e para o S&P 500 para 10 semanas em 1997.

a-

Calcule o coeficiente de correlação para a amostra.

b-

O que o coeficiente de correlação nos conta sobre a relação entre os índices DJIA e S&P 500?

Preços de fechamento para os índices da média industrial Dow Jones e S&P 500

 

Data

Dow Jones

S&P 500

24

de outubro

7.715

942

31

de outubro

7.442

915

7

de novembro

7.581

928

14

de novembro

7.572

928

21

de novembro

7.881

963

28

de novembro

7.823

955

5

de dezembro

8.149

984

12

de dezembro

7.838

953

19

de dezembro

7.756

947

26

de dezembro

7.679

936

2- O quadro a seguir relaciona os pesos (em centenas de libras) e as taxas de consumo de combustível em rodovia (em mi/gal) para uma amostra de carros de passeio novos. Com base nos resultados, espera-se um maior consumo de combustível se adquirir um carro mais pesado? Os resultados se modificam se os pesos forem dados como 2900,

3500,

,

2400?

x peso

29

35

28

44

25

34

30

33

28

24

y combustível

31

27

29

25

31

29

28

28

28

33

3- A tabela a seguir dá os pesos (em libras) do plástico descartado por uma amostra de residências, juntamente com o tamanho destas. Há alguma correlação linear significatica?

x plástico 0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05 (lb) y tamanho 2 3
x plástico
0,27
1,41
2,19
2,83
2,19
1,81
0,85
3,05
(lb)
y tamanho
2
3
3
6
4
2
1
5
residência

4-

Fez-se um estudo para investigar a relação entre idade (em anos) e a CAS

(Concentração de Álcool no Sangue) medida quando os motoristas intoxicados condenados foram presos pela primeira vez. Com base no resultado, parece haver

relação entre o nível de CAS e a idade da pessoa testada?

Idade 17,2 43,5 30,7 53,1 37,2 21 27,6 46,3 CAS 0,19 0,2 0,26 0,16 0,24
Idade
17,2
43,5
30,7
53,1
37,2
21
27,6
46,3
CAS
0,19
0,2
0,26
0,16
0,24
0,20
0,18
0,23

5- A tabela a seguir dá o número (em milhares) de armas automáticas registradas, juntamente com a taxa de criminalidade (em crimes por 100.000), para estados selecionados aleatoriamente. Consideram-se automáticas as armas que continuam disparando enquanto o gatilho está acionado. Os crimes com armas de fogo parecem estar relacionados com as aramas automáticas? Uma correlação linear significativa implica que o aumento do número de armas automáticas resulta em maior número de crimes?

Armas 11,6 8,3 3,6 0,6 6,9 2,5 2,4 2,6 automáticas Taxa de 13,1 10,6 10,1
Armas
11,6
8,3
3,6
0,6
6,9
2,5
2,4
2,6
automáticas
Taxa de
13,1
10,6
10,1
4,4
11,5
6,6
3,6
5,3
criminalidade

6.0 ANÁLISE DE REGRESSÃO LINEAR

6.0 ANÁLISE DE REGRESSÃO LINEAR 36
6.0 ANÁLISE DE REGRESSÃO LINEAR 36
6.0 ANÁLISE DE REGRESSÃO LINEAR 36
6.0 ANÁLISE DE REGRESSÃO LINEAR 36
6.0 ANÁLISE DE REGRESSÃO LINEAR 36
6.0 ANÁLISE DE REGRESSÃO LINEAR 36
6.0 ANÁLISE DE REGRESSÃO LINEAR 36
6.0 ANÁLISE DE REGRESSÃO LINEAR 36
37
37
37
37
37
37
37
37
Problemas para iniciar a discussão: 1- Pressupondo a correlação entre o número de comerciais e
Problemas para iniciar a discussão: 1- Pressupondo a correlação entre o número de comerciais e

Problemas para iniciar a discussão:

Problemas para iniciar a discussão: 1- Pressupondo a correlação entre o número de comerciais e o
Problemas para iniciar a discussão: 1- Pressupondo a correlação entre o número de comerciais e o

1- Pressupondo a correlação entre o número de comerciais e o volume de vendas em um determinada loja, é possível predizer o volume de vendas para a loja na próxima semana sabendo que o numero de comerciais desta semana foi 3.

 

Dados de Amostra para a Loja

 

N° de Comerciais

Volume de Vendas

Semana

“x”

“y”

1

2

50

2

5

57

3

1

41

4

3

54

5

4

54

6

1

38

7

5

63

8

3

48

9

4

59

10

2

46

Exercícios Tomador de Decisão: 1- A figura a seguir ilustra o diagrama de dispersão da

Exercícios

Tomador de Decisão:

1- A figura a seguir ilustra o diagrama de dispersão da população de estudantes (em milhares no eixo x) e o volume de vendas trimestrais (em milhares de dólares) para a Armand´s Pizza Parlors. Determine a equação de regressão linear para o diagrama e determine qual seria o volume de vendas se a população de estudantes fosse de 13 mil estudantes.

220 202 200 180 169 160 157 149 140 137 120 118 117 105 100
220
202
200
180
169
160
157
149
140
137
120
118
117
105
100
Série1
88
80
60
58
40
20
0
0
2
4
6
8
10
12
14
16
18
20
22
24
26
28

2- Os dados seguintes mostram o gasto com mídia (milhões de dólares) e as vendas de caixas (milhões) para sete grandes marcas de refrigerantes.

Marca

Gastos com Mídia (US$)

Vendas de Caixas

Coca-Cola

131,3

1.929,2

Pepsi-Cola

92,4

1.384,6

Coca-Cola Light

60,4

811,4

Sprite

55,7

541,5

Dr. Pepper

40,2

536,9

Mountain Dew

29,0

535,6

7-up

11,6

219,5

a) Desenvolva um diagrama de dispersão para esses dados.

b) Encontre a equação de regressão estimada.

c) Tente prever a venda de caixas para uma marca com um gasto com mídia de US$ 70 milhões.

3- Os dados de performance de linhas aéreas americanas foram reportados no The Wall Street Journal Almanac 1998. Os dados da porcentagem de vôos chegando na hora e o número de reclamações a cada 100.000 passageiros são apresentados a seguir:

Linha Aérea

Porcentagem de Pontualidade

Reclamações

Southwest

81,8

0,21

Continental

76,6

0,58

Northwest

76,6

0,85

US Airways

75,7

0,68

United

73,8

0,74

American

72,2

0,93

Delta

71,2

0,72

American West

70,8

1,22

TWA

68,5

1,25

a) Desenvolva um diagrama de dispersão para esses dados.

b) Desenvolva uma equação de regressão estimada.

c) Qual será o número de reclamações/100.000 passageiros se a porcentagem de vôos chegando na hora for de 80%?

4- Um gerente de vendas reuniu os seguintes dados considerando os anos de experiência e as vendas anuais.

Vendedor

Anos de Experiência

Vendas Anuais (US$ 1.000)

1

1

80

2

3

97

3

4

92

4

4

102

5

6

103

6

8

111

7

10

119

8

10

123

9

11

117

10

13

136

a) Desenvolva um diagrama de dispersão para esses dados.

b) Desenvolva a equação de regressão estimada.

c) Use a equação para estimar as vendas anuais para um vendedor com nove anos de experiência.

7.0 SIMULAÇÃO

A Pesquisa Operacional é uma ciência aplicada e voltada para a resolução de problemas reais. Tem como objetivo a tomada de decisões. Fundamenta-se em conceitos e métodos de outras áreas científicas para o planejamento e operação de sistemas e projetos.

“A Pesquisa Operacional surgiu durante a Segunda Guerra Mundial, quando os Aliados se viram confrontados com problemas (de natureza logística, tática e de estratégia militar) de grande dimensão e complexidade. Para apoiar os comandos operacionais na resolução desses problemas, foram então criados grupos multidisciplinares de matemáticos, físicos e engenheiros e cientistas sociais. Esses cientistas não fizeram mais do que aplicar o método científico, que tão bem conheciam, aos problemas que lhes foram sendo colocado. Desenvolveram então a idéia de criar modelos matemáticos, apoiados em dados e fatos, que lhes permitissem perceber os problemas em estudo e simular e avaliar o resultado hipotético de estratégias ou decisões alternativas” (http://www.sobrapo.org.br/PO.htm).

“O sucesso e credibilidade ganhos durante a guerra foram tão grandes que, terminado o conflito, esses grupos de cientistas e a sua nova metodologia de abordagem dos problemas se transferiram para as empresas que, com o "boom" econômico que se seguiu, se viram também confrontadas com problemas de decisão de grande complexidade” (http://www.sobrapo.org.br/PO.htm).

“Seguiram-se então grandes desenvolvimentos técnicos e metodológicos que hoje, com o apoio de meios computacionais de crescente capacidade e disseminação, nos permitem trabalhar enormes volumes de dados sobre as atividades das empresas e, através de adequados modelos de base quantitativa, simular e avaliar linhas de ação alternativas e encontrar soluções que melhor servem aos objetivos dos indivíduos ou organizações” (http://www.sobrapo.org.br/PO.htm).

7.1 Modelos de Programação Linear

1. Histórico

II Guerra Mundial

Programação Linear 1. Histórico  II Guerra Mundial alocação de recursos limitados  1947 George B.

alocação de recursos limitados

1947

II Guerra Mundial alocação de recursos limitados  1947 George B. Dantizig formulou o “ Método

George B. Dantizig

de recursos limitados  1947 George B. Dantizig formulou o “ Método Simplex ” para a

formulou o “Método Simplex

para a resolução de problemas de programação linear.

A partir daí ocorreram vários aprimoramentos do método.

2. Exemplo de um Problema Linear com duas (2) variáveis

(Problema 1) Uma empresa deseja lançar duas variedades de produtos, digamos A e B, em uma área (galpão) restrita a 100 ares (10.000 m²), sendo que cada espaço (are) destinado ao produto A tem um retorno de 8 unidades, enquanto que cada espaço (are) destinado ao produto B tem um retorno de 10 unidades. Na linha de produção, cada espaço destinado ao produto A precisa de 3 homens-hora de trabalho, e cada espaço destinado ao produto B precisa de 2 homens-hora, sendo que se dispõe de até 240 homens-hora de trabalho para a produção. O custo da mão-de-obra é de 200 u.m. (unidades monetárias) por homem-hora. A demanda máxima é limitada pelo mercado consumidor a 480 produtos tipo A, vendido a 150 u.m. por unidade, e 800 produtos do tipo B, vendido a 120 u.m. por unidade. O gestor da empresa, deseja planejar a sua produção de forma a maximizar o seu lucro.

Modelagem Matemática:

Passo 1. Variáveis do Problema.

x

x

1

2

Quantidade de espaços (ares) destinados ao produto tipo A.

Quantidade de espaços (ares) destinados ao produto tipo B.

Passo 2. Função Objetivo

Maximização do lucrodestinados ao produto tipo B. Passo 2. Função Objetivo Lucro = (receitas menos os custos) Receitas

Lucro = (receitas menos os custos)tipo B. Passo 2. Função Objetivo Maximização do lucro Receitas Custos Portanto Temos o   R

Receitas

Custos

Portanto Temos o

 

R

R

.150 .

8.

1200.

x

1

x

1

u m

./

1200.

s

x

2

10.

x

2

.120 .

u m

./

s

 

C

C

h h

.

.200 .

3.

600.

x

1

x

1

u m

./

400.

x

2

.

2.

x

2

.200 .

u m

./

h

.

h .

Lucro

Lucro

1200. 1200.

600.

1 2

x

1

800.

x

2

x

x

600.

x

1

400.

x

2

Logo para a Função Objetivo teremos

MaxZ 600.x 800.x

1

2

Passo 3. Restrições

MaxZ  600. x  800. x 1 2 Passo 3. Restrições Limitações. Obs.: 1 hectare

Limitações.

Obs.: 1 hectare equivale 100 ares

Área disponível

 

x

1

x

2

100

 

Consumo de homens-hora

3.

x

1

2.

x

2

240

 

Demanda do mercado

Tipo A

:

8.

x

1

480

ou

 

x 1 60

 

Tipo B

 

:

10.

x

2

800

ou

 

x

2

80

 

Modelo Matemático Completo

 
 

Max Z

 

600.

x

1

800.

x

2

 

s

.

a

.

:

 

x

1

x

2

100

 

3.

x

1

2.

x

2

240

 

x

1

 

60

 

x

2

80

 

x 1 2

,

x

0

 

3. Resolução Gráfica

 

Max Z

 

600.

x

1

800.

x

2

 

s

.

a

.

:

 

x

1

x

2

100

 

3.

x

1

2.

x

2

240

 

x

1

 

60

 

x

2

80

 

x 1 x

,

2

0

 

Para a primeira restrição temos

x 1 x

2

100

para x

1

0

0

x

2

100

 

x

2

100

 

x 1 x

2

100

para x

2

0

x

1

0

100

 

x

1 100

 

Condição: Desigualdade (<)

Semi-plano
Semi-plano
100 Semi-plano 100
100
Semi-plano
100
: Desigualdade (<) Semi-plano 100 Semi-plano 100 Reta Vale a mesma resolução para as demais restrições
: Desigualdade (<) Semi-plano 100 Semi-plano 100 Reta Vale a mesma resolução para as demais restrições
Reta
Reta

Vale a mesma resolução para as demais restrições

Objetivo: Ponto que maximiza a função

restrições  Objetivo: Ponto que maximiza a função O Vetor Gradiente indica a direção do máximo

O Vetor Gradiente indica a direção do máximo crescimento de uma função.

Função Objetivo

MaxZ 600.x 800.x

1

2

  (

Z

derivadas

parciais

)

  (600,800)

Z

  (60,80)

Z

Vértice da solução ótima Direção do vetor gradiente . 80 20 60
Vértice da solução ótima
Direção do vetor gradiente
.
80
20 60

Ponto Extremo x

1

,

x 20,80

2

Z

Z

Z

* 600.

x



1

* 600. 20

800.

x

2

800. 80

*

76000 .

u m

.

Existe uma solução ótima limitada, se e somente se, ela sempre poderá ser encontrada em um ponto extremo do conjunto de soluções compatíveis.

Dar o exemplo não é a melhor maneira de influenciar os outros. - É a única. Albert Schweitzer

compatíveis. Dar o exemplo não é a melhor maneira de influenciar os outros. - É a
compatíveis. Dar o exemplo não é a melhor maneira de influenciar os outros. - É a
Tomador de Decisão: O Modelo de Transportes (Logística) Dentro da Programação Linear o modelo de

Tomador de Decisão:

O Modelo de Transportes (Logística)

Dentro da Programação Linear o modelo de transportes merece uma atenção especial. Ele possui suas características próprias possuindo um modelo geral de P.L

Modelo Geral

Min

s a

.

x ij

.

:

C

0 ,

i

m n



i

1

n

j

1

j

1

x

ij

c

m

i

1

1,

x

ij

,

m

ij

.

x

ij

e

a

b

j

j

i

1,

,

n

,

i

1,

,

m

,

j

1,

,

n

(

(

oferta

)

demanda

)

Observação: Nos modelos de transportes a “oferta” deve ser igual a “demanda”.

Se oferta > Demanda

Cria-se um depósito fictício com a demanda igual a diferença da oferta pela demanda

onde os custos de transporte das fábricas ao depósito fictício são iguais a zero.

* Na solução ótima, se algo for destinado ao depósito fictício representam excedentes de produção. (sobra de produção)

Se oferta < Demanda

Cria-se uma fábrica fictícia com a oferta igual a diferença da demanda pela oferta, onde

os custos de transporte da fábrica fictícia a qualquer depósito são iguais a zero.

* Na solução ótima, se algo da fábrica fictícia for destinado a qualquer depósito, significa demanda não satisfeita.

Exemplo:

Três fábricas de automóveis, F1, F2 e F3, devem suprir a demanda de 4 centros de distribuição, denominados por C1, C2, C3 e C4. Os automóveis são transportados em números inteiros de caminhões (comumente referidos como cegonhas). Assim o custo de transporte entre uma fábrica dependerá da distância rodoviária entre cada fábrica e o centro de distribuição.

Para simplificar, as rotas mais curtas foram determinadas e os custos de transporte foram calculados, e encontram-se resumidos no quadro a seguir. Este quadro também apresenta as ofertas e demandas das fábricas e centros de consumo.

 

C1

C2

C3

C4

oferta

F1

5,5

4,5

9,9

2,7

10

F2

6,4

2,5

3,3

4,2

9

F3

2,5

4,9

4,6

4,7

9

demanda

4

7

5

12

 

Construa um modelo de Programação Linear que representa o problema descrito.

Modelagem:

Passo 1: Variáveis

x

11

x

12

x

13

x

14

x

x

21

24

x

31

x

34

transporte da fábrica

(

F

1)

para o centro

(

C

1)

transporte da fábrica

(

F

1)

para o centro

(

C

2)

transporte da fábrica

(

F

1)

para o centro

(

C

3)

transporte da fábrica

(

F

1)

para o centro

(

C

4)

transporte da fábrica

(

F

2)

para o centro

(

C

1)

transporte da fábrica

(

F

2)

para o centro

(

C

4)

transporte da fábrica

(

F

3)

para o centro

(

C

1)

transporte da fábrica

(

F

3)

para o centro

(

C

4)

Passo 2: Função Objetivo Minimizar os custos com transportes

Min C

5,5

x

11

6,4

2,5

x

x

21

31

4,5

x

12

2,5

4,9

x

x

22

32

Passo 3: Restrições

Oferta da Fábrica 1

9,9

3,3

4,6

x

x

x

13

23

33

2,7

x

14

4,2

4,7

x

x

24

34

x

11

x x x 10

12

13

14

Oferta da Fábrica 2

x

21

x x x 9