Sie sind auf Seite 1von 10

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

Modelo de Regresso Linear aplicado previso de desempenho de estudantes em ambiente de aprendizagem


Rodrigo Lins Rodrigues1,3, Francisco P. A. de Medeiros2, Alex Sandro Gomes3
1

Universidade Federal Rural de Pernambuco, Instituto Federal da Paraba2, Universidade Federal de Pernambuco3

rlr@ded.ufrpe.br, fcopetroniomedeiros@gmail.com, asg@cin.ufpe.br

Abstract. Extracting relevant information in collaborative supported computer learning to enable an effective monitoring of students and fostering learning management is a challenge. Several works have been developed from data mining techniques for the purpose of educational decision making. The main objective of this study was to investigate the feasibility of using the linear regression model to obtain inferences in the early stages of conducting online courses as a way to support decision making by teachers and administrators. We propose the use of linear regression to estimate the performance of students based on their interactions within the learning management system, taking into account behavioral variables. The results showed that its possible to use the linear regression technique to obtain inferences with good accuracy rates. Resumo. Extrair informaes relevantes que auxiliem a gesto da aprendizagem e viabilizem o acompanhamento efetivo de estudantes em cursos mediados por tecnologia um desafio. Diversos trabalhos vem sendo desenvolvidos a partir de tcnicas de minerao de dados educacionais para fins de tomada de deciso. O objetivo principal deste trabalho foi investigar a viabilidade da utilizao do modelo de regresso linear para a obteno de inferncias em etapas iniciais da realizao de cursos online, como forma de apoiar a tomada de deciso por parte de professores e gestores. Propomos a utilizao da tcnica de regresso linear para estimar o desempenho de alunos baseados em suas interaes dentro da plataforma virtual de aprendizagem, levando em considerao variveis comportamentais. Os resultados obtidos demonstraram que possvel utilizar a tcnica de regresso linear para obter inferncias com boas taxas de preciso.

1. Introduo
Interao um conceito complexo e multifacetado em todas as formas de educao. Diversas taxonomias foram propostas ao longo das ltimas dcadas. Moore (1989) descreveu trs formas de interao em educao distncia: interao entre o professor e o estudante, interao entre os estudantes e interao entre o estudante e o contedo. Anderson e Garrison (1998) expandiram a taxonomia proposta por Moore acrescentando trs novas formas de interao: interao entre os professores, interao entre o professor e o contedo e interao entre os contedos. Hirumi (2006)

DOI: 10.5753/CBIE.SBIE.2013.607

607

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

complementou as taxonomias anteriores, considerando as interaes entre o professor e o aprendiz com as ferramentas. Conforme apresentado nas taxonomias, h inmeras possibilidades de interao nos AVAs que suportam o processo de aprendizagem online. H na literatura trabalhos que associam a relao entre o nvel de interao dos participantes de cursos online com indicadores de desempenho acadmico. Picciano (2002) observou uma correlao entre interaes e aprendizagem e concluiu que esse desempenho e o sucesso de um curso dependem da habilidade de interagir dos participantes. Russo e Benson (2004) encontraram uma correlao significativa entre o desempenho dos estudantes e a percepo da prpria presena social online, a qual depende das interaes estabelecidas entre os participantes do curso. Watson (2008) associa s interaes em ferramentas assncronas de comunicao - como fruns de discusso - com a maneira como os estudantes experimentam um maior sentido de engajamento. Johnson et al. (2010) enfatiza a importncia das interaes online na melhoria dos resultados de aprendizagem. Trabalhos que objetivam mediar as relaes entre os nveis de colaborao e engajamento com o desempenho acadmico utilizam, em sua maioria, a tcnica de anlise de correlao; muito til em trabalhos exploratrios, quando o interesse est no grau ou fora do relacionamento. Neste estudo utilizamos uma anlise de regresso, cujo foco principal est na busca da natureza do relacionamento entre interao e desempenho. De acordo com Souza (2001) a anlise de regresso compreende analisar dados amostrais para saber se e como duas ou mais variveis relacionam-se umas com as outras. A anlise de regresso tem como resultado uma equao matemtica que descreve o relacionamento entre essas variveis e pode ser usada para estimar ou predizer, valores futuros de uma varivel quando se conhecem ou se supem conhecidos valores da outra varivel. Nosso trabalho apresenta um estudo preliminar do uso de algumas tcnicas de Minerao de Dados Educacionais (MDE), especificamente a Anlise de Regresso Linear, em uma base de dados do AVA Moodle1. O objetivo principal a obteno de um modelo de previso de desempenho de estudantes a partir de dados de interao durante o perodo de realizao de um curso na modalidade distncia. Este artigo est organizado da seguinte forma. Na seo 2 apresentada a reviso da literatura sobre a rea de minerao de dados educacionais, em particular a tcnica de regresso linear. Na seo 3 apresenta-se o experimento realizado, objetivos e procedimentos. A seo 4 mostra os resultados. A seo 5 mostra as discusses e contribuies e por fim a seo 6 apresenta as concluses do trabalho.

2. Reviso da Literatura
Nesta seo iniciamos a reviso de literatura na qual so apresentados os conceitos necessrios fundamentao deste trabalho. Entre os conceitos a serem explorados esto: Minerao de dados educacionais (EDM) e Regresso Linear simples. 2.1 Minerao de dados educacionais (MDE, do Ingls EDM)
1

www.moodle.org

608

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

A Minerao de dados tem sido aplicada em diversas reas do conhecimento. Recentemente, com a expanso dos cursos distncia e com suporte computacional, muitos pesquisadores da rea de Informtica na Educao (em particular, Inteligncia Artificial Aplicada Educao) tm mostrado interesse em utilizar minerao de dados para investigar perguntas cientficas na rea de educao (e.g., quais so os fatores que afetam a aprendizagem? Ou como desenvolver sistemas educacionais mais eficazes?). Dentro deste contexto, surgiu uma nova rea de pesquisa conhecida como Minerao de Dados Educacionais. A EDM definida como a rea de pesquisa que tem como principal foco o desenvolvimento de mtodos para explorar conjuntos de dados coletados em ambientes educacionais. Assim, possvel compreender de forma mais eficaz e adequada os alunos, como eles aprendem, o papel do contexto na qual a aprendizagem ocorre, alm de outros fatores que influenciam a aprendizagem [GOTTARDO, 2012]. Por exemplo, possvel identificar em que situao um tipo de abordagem instrucional (e.g., aprendizagem individual ou colaborativa) proporciona melhores benefcios educacionais ao aluno. Atualmente, as tendncias na rea indicam um grande crescimento de pesquisas em EDM no cenrio internacional. Este grande crescimento resultado direto de fatores como, a difuso e utilizao de softwares educacionais que produzem grande quantidade de dados educacionais bem estruturados [Baker, 2011]. Um dos fatores que vem promovendo o crescimento da EDM o uso de ambientes virtuais de aprendizagem (AVA). Esses ambientes vm sendo adotados por muitos professores, escolas e universidades em todo mundo e permitem que pesquisadores possam obter grandes quantidades de dados reais e relevantes para realizar anlises utilizando tcnicas provindas da rea de EDM. 2.1.1 Regresso Linear Simples A regresso linear uma tentativa de modelar uma equao matemtica linear que descreva o relacionamento entre duas variveis [CURRAL, 1994]. H diversas maneiras de uso dessas equaes de regresso, em situaes envolvendo duas variveis. Por exemplo, um pesquisador em EDM pode tentar explicar as variaes do desempenho de alunos em funo do aumento da carga horria diria de estudos. Deve-se notar, entretanto, que a lgica de uma relao causal deve advir de fenmenos externos ao mbito da estatstica. A anlise estatstica de regresso apenas modela qual relacionamento matemtico pode existir, se existir algum [HOFFMANN, 2006]. Ainda como aplicao da regresso pode-se estar interessado em predizer valores futuros de uma varivel. Por exemplo, costuma-se aplicar testes a empregados ou estudantes potenciais, para avaliar o potencial de sucesso na escola ou no emprego. de presumir que haja um relacionamento matemtico entre o resultado do teste e o potencial futuro. Embora tais relaes possam assumir uma grande diversidade de formas, discutiremos apenas as equaes lineares. As equaes lineares so importantes porque servem para aproximar muitas relaes da vida real, e porque so relativamente fceis de lidar e de interpretar. Outras formas da anlise de regresso, tais como regresso mltipla (mais de duas variveis) e regresso curvilnica (no-linear) envolvem extenses dos mesmos conceitos usados na regresso linear simples.

609

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

2.1.2 Equao Linear Duas importantes caractersticas da equao linear so: o coeficiente angular e o coeficiente linear da reta em determinado ponto. Uma equao linear tem a forma:

i = + xi + i,

i=1,2,...,n

coeficiente linear da reta, o coeficiente angular e n o tamanho da amostra. A varivel a varivel que deve ser predita (varivel resposta ou dependente), e x o
valor preditor (varivel independente ou explicativa) isto , preferencialmente deve-se utilizar x como a varivel mais acessvel (mais fcil de ser obtida) e Y a varivel menos acessvel (mais difcil de ser obtida). importante ter em mente que nem todas as situaes so bem aproximadas por uma equao linear [HOFFMANN, 2006]. Por isso, em geral necessrio desenvolver um trabalho preliminar para determinar se um modelo linear adequado. O processo mais simples consiste em fazer o diagrama de disperso dos dados, isto , verificar se os valores de x e de , mostram uma tendncia visual linear.

3. Realizao do experimento
3.1 Objetivo O objetivo deste experimento foi estimar a relao existente entre a quantidade de interaes com os artefatos educacionais disponibilizados na disciplina (vdeo, frum, textos, slides) com o desempenho acadmico (mdia final) dos alunos a partir da abordagem de anlise de regresso linear. 3.2 Procedimentos A realizao do experimento se deu atravs da disciplina de Jogos Educacionais da graduao em Licenciatura em Computao da Universidade Federal Rural de Pernambuco. O curso contou com a participao de 98 alunos do stimo perodo na modalidade de EAD. A disciplina teve durao de dois meses durante o primeiro semestre de 2013, divididos em seis mdulos de contedos. Dentre os mdulos que foram abordados, tivemos: Semana 1 (27 a 31/05) - Nativos digitais, Gerao Y e imigrantes digitais, Semana 2 (03 a 07/06) - Estilos de aprendizagem, Semana 3 (10 a 14/06) - Design de jogos educacionais, Semana 4 (17 a 28/06) - Projeto conceitual e fundamentos de Game Design e por fim nas Semanas 5 e 6 (01 a 12/07) - Tcnicas e Ferramentas de Implementao de jogos. Durante a disciplina diversos artefatos de interao foram utilizados, tais como: utilizao de fruns, vdeo-aulas, material em texto, disponibilizao de slides e envio de atividades. As avaliaes da disciplina foram compostas por duas unidades, a primeira unidade foi composta por trs atividades virtuais e uma prova escrita presencial. A segunda unidade foi composta por duas atividades virtuais e uma prova escrita, ao final o aluno teve seu desempenho calculado atravs da mdia das duas unidades.

610

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

3.3 Coleta e tratamento dos dados Para a construo do banco de dados, utilizou-se a base de dados do AVA Moodle com informaes sobre a interao dos participantes com os diversos artefatos educacionais disponibilizados durante o curso. Durante o experimento no foram considerados estudantes desistentes, tendo em vista a indisponibilidade de resultado ou nota final nesses casos. A Tabela 1 a seguir exibe as principais variveis coletadas para realizar a aplicao da tcnica de regresso:
Tabela 1. variveis de interao coletadas

Variveis Desemp_final

Sobre Esta varivel foi composta por dados das 5 atividades virtuais e das duas provas presenciais, totalizando uma mdia representativa do desempenho final do aluno.

Int_forum_sem1, Int_forum_sem2, Int_forum_sem5, Vdeo_sem1, Vdeo_sem3 Vdeo_sem5,

Int_forum_sem2, Esta varivel foi composta pelo somatrio das Int_forum_sem4, quantidades de interaes nos seis fruns disponibilizados na disciplina durante todo o curso. Vdeo_sem2, Essa varivel foi composta pelo somatrio das Vdeo_sem4, quantidades de interaes nas vdeo aulas Vdeo_sem6 disponibilizadas pelo professor da disciplina.

Mat_sem1, Mat_sem2, Mat_sem3, Esta varivel foi composta atravs dos dados de Mat_sem4, Mat_sem5, Mat_sem6 acesso dos materiais em formato de textos, apostilas disponibilizadas para leitura. Ppt_sem1, Ppt_sem2, Ppt_sem3, Varivel que mostra a quantidade de acesso ao Ppt_sem4, Ppt_sem5, Ppt_sem6 material do tipo slide. Media_horas_acesso Esta varivel foi composta pela hora mdia que os alunos costumam acessar o ambiente virtual.

Estas variveis foram coletadas atravs do prprio painel de logs do Moodle, no qual foi possvel extrair dados no formato .xls que serviram pra quantificar o nmero de acessos para cada artefato disponibilizado durante a disciplina. Estes dados passaram por um processo de tratamento para posteriormente ser feito as possveis anlises.

4. Resultados
Os resultados obtidos na construo deste experimento foram realizados atravs do software estatstico R2, modelos lineares podem ser acessados no ambiente R a partir da funo lm(), que gera um objeto correspondente a uma lista com vrios componentes do modelo linear em questo (coeficientes, resduos, valores preditos, dentre outros). A estes objetos encontram-se associados tambm modos especficos das funes plot() e summary(), mostrando tabelas de anlise de varincia para o modelo linear. Nas sees seguintes veremos com mais detalhes cada uma das anlises realizadas.

http://www.r-project.org/

611

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

4.1 Anlise descritiva Antes da aplicao da anlise de regresso, foi necessrio realizar algumas estatsticas descritivas com o intuito de ter uma viso mais ampla sobre o comportamento dos dados coletados. A primeira anlise realizada foi com relao s mdias de acesso por artefatos durante os dois meses de curso, verificou-se que os alunos utilizaram a ferramenta frum em uma mdia de 24,6 vezes durante todo o curso e com uma mdia de 11 interaes por frum semanalmente. Com relao ao artefato vdeo-aula verificou-se que a mdia de interao foi de 5,6 acessos nos 6 vdeos disponibilizados. Em relao aos textos disponibilizados, obtivemos uma mdia de 7,3 acessos nos seis textos disponibilizados. Os materiais em formatos de slides, tiveram uma mdia de 6,5 acessos, e por fim tivemos uma mdia de horrios que os alunos mais acessam o ambiente, e obtivemos uma valor mdio em horas de 12:26 h. A prxima seo aborda a parte inferencial do trabalhando, modelando uma regresso linear de acordo com os dados de interao dos alunos. 4.2 Estimando o modelo linear e aplicando a tcnica de regresso Para ajustar um modelo de regresso a um conjunto de dados, antes necessrio fazer a verificao dos pressupostos do modelo tais como: (1) A relao entre x e deve ser linear, (2) Os valores de x so fixos, isto , x no uma varivel aleatria, (3) A mdia dos erros nula, isto , E(ei)=0, i=1,2,...,n; (4) O erro em uma observao no correlacionado com o erro em qualquer outra observao e por fim (5) os erros devem seguir uma distribuio normal. 4.3 Teste de normalidade e pressupostos do modelo Na seo anterior verificamos que um dos pressupostos a normalidade dos resduos das variveis. No nosso estudo temos como varivel dependente o desempenho final do aluno na disciplina (mdia final) e como variveis independentes: (1) media da quantidade de interaes em fruns (MediaIntForum), (2) Mdia das interaes com vdeo-aulas (MediaIntVideo), (3) Mdia das interaes com textos (MediaIntMat) e por fim a (4) mdia das interaes com slides em formato .ppt (MediaIntPtt). Ao aplicarmos os testes de normalidade foi verificado que apenas a varivel MediaIntForum segue uma distribuio normal. A anlise do modelo quanto a normalidade dos termos do erro geralmente mais difcil do que outras pressuposies. Em primeiro lugar variaes do acaso pode levar a concluses erradas quando estudado a natureza da distribuio de probabilidade, especialmente no caso de pequenas amostras. Vrios testes estatsticos so encontrados na literatura para testar a normalidade de variveis, como os testes de aderncia de Qui-quadrado, KolmogorovSmirnov e Lilifors. Outros testes para normalidade so o Shapiro-Wilks e ShapiroFrancia. No nosso estudo utilizamos o teste de Shapiro-Wilks. A Tabela 2 mostra os resultados do teste.
Tabela 2. Testes de normalidade. Varivel MediaIntForum MediaIntVideo Resultado do teste Shapiro-Wilks p-value = 0.1886 p-value = 0.0003031

612

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

MediaIntMat MediaIntPtt

p-value = 0.000419 p-value = 0.01826

Como podemos observar, apenas a varivel MediaIntForum obteve um resultado satisfatrio quanto ao teste de normalidade, desta forma nosso modelo de regresso se tornou um modelo de regresso linear simples, como tendo a varivel dependente Desemp_Final e a varivel MediaIntForum como sendo a varivel independente. Abaixo temos o modelo de regresso simples que mostra a inclinao da reta de regresso ajustada na relao entre as duas variveis.
> dados <- lm(Desemp_Final~MediaIntForum) > dadosReg Call: lm(formula = Desemp_Final ~ MediaIntForum) Coefficients: (Intercept) MediaIntForum 13.110 3.626

O coeficiente chamado Intercept corresponde ao da reta de regresso, ao passo que o coeficiente identificado como MediaIntForum corresponde ao ou coeficiente angular. 4.4 Plotando o grfico de disperso Grficos de disperso mostram as relaes entre os valores numricos em varias sequencias de dados ou plotam dois grupos de nmeros como uma sequencia de coordenadas XY. Neste experimento plotamos as variveis Desemp_Final contra MediaIntForum, atravs do grfico podemos verificar visualmente que existe uma relao de linearidade entre as duas variveis.
> plot <- (Desemp_Final~MediaIntForum)

Figura 1: plotagem do grfico de disperso

No entanto o grfico apenas uma medida descritiva, o que no nos permite confirmar uma afirmao concreta, logo se utilizou medidas de inferncia para comprovar os resultados explicitados pelo grfico. 4.5 Teste de significncia A partir da decomposio da soma de quadrados total, definimos o coeficiente de determinao, ou explicao do modelo, que dado por:

613

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

Este valor de R2 nos indica a proporo da variao de i que explicada pela regresso, no caso deste experimento, o valor que indica a proporo do desempenho dos alunos, em funo da quantidade de interaes via frum no ambiente de aprendizagem. A funo abaixo gera o teste de significncia, bem como nos mostra o valor do R2 atravs do (R-squared).
> summary(dadosReg) Call: lm(formula = Desemp_Final ~ MediaIntForum) Residuals: Min 1Q Median 3Q Max -38.491 -10.284 2.693 10.095 25.416 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 13.1097 3.3396 3.926 0.000179 *** MediaIntForum 3.6259 0.2653 13.668 < 2e-16 *** --Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 14.04 on 82 degrees of freedom Multiple R-squared: 0.795, Adjusted R-squared: 0.7912 F-statistic: 186.8 on 1 and 82 DF, p-value: < 2.2e-16

O valor do coeficiente de determinao (Adjusted R-squared) encontrado no nosso caso correspondeu a 0.7912. uma medida que d indcios sobre a qualidade do ajuste do modelo obtido. 4.6 Anlise de resduos e testes de diagnsticos A anlise de resduos de extrema importncia para subsidiar a confiana no ajuste do modelo encontrado. Na Figura 2 temos quatro grficos que nos possibilite a verificao das premissas do modelo.

Figura 2. Grficos de testes de diagnsticos

O grfico do canto superior esquerdo (Residuals vs Fitted) corresponde aos resduos comparados aos valores preditos pelo modelo. Neste experimento, no encontramos nenhuma tendncia clara e a distribuio dos resduos parece simtrica em torno da

614

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

linha. O segundo grfico (normal Q-Q plot) mostrou o grfico de quantis para os resduos, no qual foi possvel verificar a normalidade dos resduos. Os pontos se mostraram distribudos seguindo uma tendncia de linearidade, dando indcios que os resduos apresentam uma distribuio normal. O terceiro grfico (Scale-Location Plot) mostra a distribuio da raiz do mdulo dos resduos em comparao aos valores preditos. Este grfico permite a verificao da tendncia de heteroscedasticidade em que a magnitude da variao dos resduos est correlacionada com os valores preditos.

5. Discusso
Alguns pontos importantes a destacar na fase de anlise descritiva foram os indcios de que em relao aos materiais didticos, os alunos costumam acessar apenas uma vez, tendo em vista a possibilidade de baixar para si o material e no mais ser necessrio participar de interao com esses artefatos. Ao contrrio da ferramenta frum, nela obteve-se uma mdia de 11 interaes semanais por aluno. Com relao ao valor mdio de acesso ao ambiente, foi possvel justificar que existe um pico de acesso nos horrios prximos ao meio dia, devido a grande quantidade de alunos que trabalham e cursam graduao na modalidade a distncia, sendo este um horrio de disponibilidade para a realizao das atividades e acesso ao ambiente. Sobre a parte inferencial do experimento, podemos afirmar que o modelo linear simples explicou a relao entre dados de interao via frum e o desempenho dos alunos. Este modelo linear foi considerado um bom modelo para explicar que existe uma relao entre a quantidade de interaes via frum de discusso e o desempenho dos alunos. Podemos ainda afirmar, com uma confiana de 95%, que 79,12% dos alunos que interagem via frum de discusso, a medida que aumenta a quantidade de interao, tende a aumentar o despenho acadmico. Este resultado satisfatrio, se pensarmos que podemos aplicar modelos desta natureza para tentar prever a proporo de alunos que tero desempenhos satisfatrios em um curso, baseado nas suas interaes iniciais.

6. Consideraes finais e trabalhos futuros


Diante deste trabalho pode-se concluir que a anlise de regresso til em reas nas quais atividades de planejamento do futuro fundamental. Esse tipo de condio ocorre em cursos distncia, nos quais a tomada de decises durante o curso por parte de tutores, professores e gestores um desafio. Neste trabalho investigou-se a viabilidade da aplicao de tcnicas de modelagem de regreso linear para realizar inferncias. Os resultados obtidos com o experimento confirmam a viabilidade de se realizar inferncias relativas ao desempenho de estudantes. Isso indica que a proporo da variao da varivel desempenho, pode ser inferida em funo da quantidade de interaes via frum no ambiente de aprendizagem. Desta forma podemos afirmar que possvel estimar o desempenho de alunos baseado na quantidade de interaes em ferramentas do tipo frum de discusso. Como trabalhos futuros pretendemos aplicar uma modelagem envolvendo mais de uma varivel independente e modelos no lineares, utilizando a anlise de regresso linear generalizada, por ser uma tecnica mais robusta e levar em considerao diversas

615

II Congresso Brasileiro de Informtica na Educao (CBIE 2013) XXIV Simpsio Brasileiro de Informtica na Educao (SBIE 2013)

variveis que afetam direta ou indiretamente o desempenho de alunos em ambientes de cursos online.

7. Referncias
Anderson, T. e Garrison, D. Learning in a networked world: New roles and responsibilities. In C. Gibson (Ed.), Distance Learners in Higher Education. p. 97112. Madison, WI.: Atwood Publishing, 1998. Baker, R.S.J.d. Data Mining for Education. McGaw, B., Peterson, P., Baker, E. (Eds.) International Encyclopedia of Education (3rd edition). Oxford, UK: Elsevier. 2010. Baker, R.S.J.d., Isotani, S., de Carvalho, A. (2011) Minerao de Dados Educacionais: Oportunidades para o Brasil. Revista Brasileira de Informtica na Educao, 19 (2), 3-13. Curral, J. Statistics Packages: A General Overview. Universidade de Glasgow, 1994. Gottardo, E., Kaestner, C., Noronha, R.V. Previso de Desempenho de Estudantes em Cursos EAD Utilizando Minerao de Dados: uma Estratgia Baseada em Sries Temporais. In Proceedings of Simpsio Brasileiro de Informtica na Educao SBIE 2012, 26 a 30 de novembro de 2012. Rio de Janeiro, RJ. Hoffmann, R. Anlise de Regresso: Uma Introduo a Econometria. Editora Hucitec, 2006. Hirumi, A. Analyzing and designing e-learning interactions. In Charles Juwah (Ed.), Interactions in online education implications for theory e practice, 46 71, New York: Routledge Publishing, 2006. Johnson, G. M. e Johnson, J. A. Dimensions of Online Behavior: Implications for Engineering E-Learning. In: Magued, I.; Vikram, K.; Mohammed, K. (Org.), Technological Developments in Education and Automation, Springer, 2010. Kear, K. Social presence in online learning communities. Proceedings of the 7th International Conference on Networked Learning, Aalborg, Denmark, 2010. Moore, M. Three types of interaction. American Journal of Distance Education, 3(2), 1 6, 1989. Picciano, A. G. "Beyond student perceptions: Issues of interaction, presence, and performance in an online course." Journal of Asynchronous learning networks, 2140, 2002. Russo, T. C. e Scott C. Perceptions of mediated presence in an asynchronous onlinecourse: Interplay of communication behaviors and medium. Distance Education, 25(2), 215-232, 2004. Souza, S.G.; Introduo aos Modelos de Regresso Linear e No-Linear. Embrapa Produo de Informao, 2001. Watson, A. Developing teaching practice for more effective use of synchronous discussion: A preliminary investigation. In Hello! Where are you in the landscape of educational technology? Proceedings ascilite, Melbourne, 2008.

616