Sie sind auf Seite 1von 9

IDENTIFICAODEGRUPOSDEALUNOSEMAMBIENTE

VIRTUALDEAPRENDIZAGEMUTILIZANDOANLISEDELOG
BASEADAEMCLUSTERIZAO


MrciaFontesPinheiroeng.marciafontes@gmail.com

LuizCortinhasFerreiraNetoluizcf14@gmail.com

HaroldoNazardeSJuniorhnsj86@gmail.com

EulliaC.daMataeucmata@gmail.com

AntonioF.L.JacobJr.jacobjr@ufpa.br

damodeLimaSantanaadamo@ufpa.br

UniversidadeFederaldoParUFPA
LaboratriodePlanejamentodeRedesdeAltoDesempenhoLPRAD
RuaAugustoCorra,01,Guam,Caixapostal479
CEP:66075110BelmPA



Resumo: Este trabalho prope uma metodologia de pesquisa para avaliao de desempenho
acadmico dos alunos de um programa educacional de larga escala, no curso de incluso
digital ministrados semipresencialmente pela plataforma Moodle, utilizando clusterizao
para separao dos alunos em quatro nveis (Exelente, Bom, Regular, Insuficiente) . Assim
obtendo o caminho comum dentro da plataforma para os cinco clusteres (um cluster
formado por alunos que no se enquadram nos nveis descritos). Esta pesquisa foi motivada
pela incerteza do aproveitamento dos alunos na plataforma de acordo com o perfil do aluno.
O estudo de caso consiste na formao de agentes de incluso digital, com nfase na
utilizao de redes sociais online. No curso ministrado, as redes sociais so planejadas para
funcionar como espao de articulao de projetos comunitrios envolvendo agentes de
incluso digital e comunidades e compartilhar solues para problemas tcnicos do diaa
dia,indicandoapropriaoeenvolvimentodacomunidadenessesespaos.

Palavraschave: Incluso Digital, Kmeans, Avaliao de Desempenho, Educao, Perfil do


aluno.


1.INTRODUO

1



Com o advento das Tecnologias da Informao e Comunicao (TICs), Internet, dos
sistemas de informao para Web e dos recursos multimdia, surgiram diversas ferramentas e
plataformascomapropostadeWeb2.0.
No campo da educao, a utilizao desses sistemas de ensino eletrnico elearning
proporcionam novas possibilidades de aprendizagem na metodologia de ensino. Esses sistemas so
denominados como Ambientes Virtuais de Aprendizagem (AVAs) por serem plataformas que
centralizam ferramentas, mas que permitem interao entre os usurios de forma assncrona e
sncronaatravsdeWiki,chat,frum,etc.
Os AVAs armazenam todas as interaes dos usurios dentro da plataforma, informaes
do desempenho do aluno, podendo guardar informaes como quais atividades um estudante
participou, materiais que foram lidos e escritos, testes ao qual foi submetido, chats que o mesmo
participou, pginas acessadas na plataforma, etc. (MOSTOW et al., 2005), assim como
informaespessoaissobreusurio,taiscomoperfil,emsuabasededados.
Dentre os AVAs, temos o Moodle, que um sistema open source desenvolvido pelo
australiano Martin Dougiamas para uso acadmico. Engloba diversas ferramentas web 2.0 para
facilitarem a interao entre os usurios (MATA et al., 2010) e a plataforma mais utilizada no
mundoemeducaoadistncia(CAPTERRA,2014).
De maneira geral, os AVAs armazenam uma grande quantidade de informao o qual
muito valiosa para analisar o comportamento dos estudantes (MOSTOW & BECK, 2006) e que
pode ser obtida atravs de Descoberta do Conhecimento em Base de Dados (DCBD), da
expresso em ingls Knowledge Discovery in Databases (KDD), que a extrao automtica de
padres implcitos e interessantes a partir de grandes volumes de dados (KLOSGEN &
ZYTKOW, 2002). Para encontrar padres nesses dados so envolvidos a minerao de dados
(Data Mining), extrao do conhecimento, descoberta da informao e padro de processamento
dosdados(FAYYAD,1996).
KDD uma rea multidisciplinar o qual vrias tcnicas computacionais de aprendizado de
mquina podem ser aplicadas, tais como rvores de deciso, redes neurais artificiais, redes
bayesianas, etc. As tarefas de KDD mais utilizadas so mtodos estatsticos, visualizao,
clusterizao, classificao e regras de associao. Estes mtodos podem descobrir novos
conhecimentos interessantes e teis com base em dados de uso dos alunos, podendo ser til no
somente para os educadores, mas tambm aos prprios alunos, uma vez que pode ser orientada
paradiferentesfinspordiferentesparticipantesnoprocesso.
Este trabalho apresenta a categorizao do caminho na plataforma Moodle que melhor
representeosalunoscommaioraproveitamentodocursodeinclusodigital.
Nos cursos oferecidos no existe mtrica para avaliao de desempenho que seja
satisfatria em tentativa de solucionar neste trabalho proposto como metodologia aprendizagem
de log (JANSEN, 2006) adaptada para plataforma Moodle utilizada em grande escala, cursos de
incentivos pblicos e privados semipresenciais brasileiros, basicamente definida em 3 etapas a
metodologia utilizada classifica os alunos em trs nveis de aproveitamento: BOM,REGULAR e
INSUFICIENTE, pela abordagem de log, citada detalhadamente na sesso 3, a partir das classes
serfeitaaanalisedepadresprocurandoocaminhomdiorealizadopelosclustersnaplataforma.

2.REDETELECENTROS.BR

2



No Brasil, dentre as polticas pblicas para favorecimento da incluso digital, tmse
investido na criao e na utilizao de centros tecnolgicos comunitrios, ou telecentros, onde o
acesso pblico s TICs disponibilizado para as comunidades menos privilegiadas a um custo
mnimo ou isento de custos. Neste contexto, alm da implantao dos telecentros para acesso
Internet, tmse a formao de agentes para incluso digital como aspecto crtico. A proposta
envolveu um programa de formao em larga escala que requereu mecanismos de controle e
monitoramento para gestores e beneficiadores desse programa, a Rede Nacional de Formao para
InclusoDigitalRedeTelecentrosBR(SILVA,2013).
A Rede Telecentros BR at o ano de 2011 contava com a participao de cinco polos
regionais (um polo para cada regio do Pas), dois polos estaduais (nos estados de So Paulo e
Cear) e um polo nacional. Sob a responsabilidade dos polos regionais estava a formao dos
agentes de incluso digital (que so os monitores dos telecentros), gestores de telecentros
(responsveis pela administrao do telecentro), tutores (que atuavam na formao dos monitores) e
supervisores de tutoria (responsveis pela superviso e acompanhamento do trabalho dos tutores)
(SILVA,2013).
No perodo de fev/2010 a dez/2012, os membros dos polos de formao se articularam
para construir e aplicar o Curso de Formao de Monitores dos Telecentros e a ativao das redes
sociais de agentes de incluso social atuantes nas comunidades. O projeto de formao dos agentes
de incluso digital (monitores) contemplou a oferta de um curso de 480 horas, disponibilizado na
plataforma Moodle (Rede Telecentros.BR, 2013) e dividido em dois mdulos: 80 horas para um
uma breve apresentao dos contedos da formao e 400 horas com foco especfico no
desenvolvimento de projetos comunitrios e aprofundamento dos contedos. Para o
desenvolvimento dos projetos comunitrios, os agentes de incluso digital percorreram de acordo
com seus interesses e necessidade, sem percurso prdefinido, diferentes temas: comunicao
comunitria, redes, cultura digital, comunidade, telecentros. No desenvolvimento do curso, os
agentes de incluso digital contaram com o apoio de tutores e supervisores de tutores dos diversos
polosregionais(SILVA,2013).
A formao contribuiu para que os agentes de incluso digital usassem as TIC como
ferramentas para alavancar transformaes sociais na comunidade em que estavam inseridos. Neste
contexto, os agentes de incluso digital deveriam alcanar domnio tcnico e instrumental das
ferramentas relacionadas s tecnologias da informao e comunicao, atuando de forma solidria,
cooperativa e interativa com os seus colegas de formao e de trabalho, com condies de se
reconhecer e de atuar como agente de transformao social na comunidade os quais estavam
inseridos(SILVA,2013).

2.1PlataformaMoodle

O Moodle o Ambiente Virtual de Aprendizagem (AVA) selecionado para o


desenvolvimento do Curso de Formao de Monitores do Telecentros.BR. A Rede Nacional de
Formao para Incluso Digital produziu o curso de formao de monitores do Telecentros.BR com
objetivo de propiciar o desenvolvimento de habilidades no uso de tecnologias da informao e
comunicao para dar condies de transformaes sociais na comunidade. O curso foi estruturado
em dois eixos pedaggicos: acessos a contedos e atividades formativas elaborao e
implementao de projetos comunitrios. Ofertado em duas fases: a primeira englobava conhecer o
ambiente virtual e abordagem prvia do contedo que ser aprofundado na fase dois que aborda
3



principalmente o projeto comunitrio, onde cada tema estudado poder servir de apoio para
realizao de aes com a comunidade. Entre os temas abordados: telecentros, comunidade,
comunicaocomunitria,inclusodigital,redeseculturadigital.
No ambiente virtual de aprendizagem moodle foi organizado o curso para formao dos
monitores em: Fase 1: Ambientao e Voo Rasante, como mostram respectivamente as Figuras 1 e
2 Fase 2: Projeto Comunitrio, como mostra a Figura 3. Mas tambm foi necessrio realizar um
curso para formao de tutores que atuaram auxiliando e orientando os monitores durante a
formao do telecentros.br. No curso dos tutores foi abordado educao a distncia, articulao
social e incluso digital. Os tutores foram selecionados com base no conhecimento sobre tecnologia,
valorizandoaexperinciaeminclusodigital.

Figura1.Fase1:AmbientaoFigura2.Fase1:Voorasante

Figura3.Fase2:ProjetoComunitrio

O processo de formao foi realizado em grupo de n monitores para um tutor, que fizeram
o acompanhamento para o primeiro acesso a plataforma, incentivaram a participao no ambiente
virtual e no desenvolvimento do projeto comunitrio, assim como realizaram a avaliao dos
monitores mensalmente. Os tutores tiveram o acompanhamento e auxilio dos supervisores de tutoria
no processo de formao. Os supervisores eram pessoas que fizeram parte dos polos regionais,
facilitadores da formao, acompanhavam os tutores e monitores no processo de formao,
4



realizaram tambm avaliao das turmas com base nas informaes levantadas na plataforma
Moodle e com as informaes repassadas pelos tutores. A coordenao pedaggica realizou
acompanhamento dos supervisores e tutores com base em informaes obtidas na plataforma e no
sistemadeavaliao.

3.KMEANS

Kmeans um mtodo de clusterizao (organizao dos objetos similares, em algum


aspecto, em um grupo) pertencente a classe dos algoritmos de aprendizados de mquina. Tem
como finalidade dividir um determinado nmero de objetos em reas chamadas de cluster. Estas
reas so constitudas por uma coleo de objetos que so similares entre si e diferentes dos
objetos pertencentes aos outros clusters. A distncia de cada objeto para cada cluster vai
determinar em que cluster o objeto ficar alocado. Cada objeto pertence ao cluster no qual possui o
elementocentral(centride)maisprximodesteobjeto.
O primeiro uso do termo kmeans foi empregado por James MacQueen no ano de 1967
em seu artigo Some Methods for Classification and Analisys of Multivariate Observations.
(MACQUEEN, 1967) explica em seu artigo como o Kmeans funciona e demonstra que este
algoritmo facilmente programvel e computacionalmente econmico, sendo possvel processar
grandesamostrasemumcomputadordigital.
Afiguraaseguirilustraospassosdofuncionamentodoalgoritmokmeans:
5


Figura2.PassosdoalgoritmoKmeans.

No primeiro passo, atribuise valores aos k primeiros centrides seguindo algum critrio.
Geralmente escolhido os k primeiros pontos da tabela para cada centride. No entanto, estes
valores tambm podem ser gerados aleatoriamente. Aps atribudo os valores, h o clculo da
distncia de cada objeto para cada centride. O total de distncias corresponde ao produto de N
objetos por k centriodes ( N * k). Tendo a distncia dos pontos para os centrides, os objetos
so classificados de acordo com a classe a qual o objeto est mais perto do centride, formando os
clusters. Com os grupos formados, calculase novamente o valor do centride, de acordo com a
posio dos objetos pertencentes ao grupo. O novo centride calculado atravs da mdia de cada
atributo de todos os pontos pertencentes a classe. Ao final deste processo, o algoritmo volta ao
passo 2, repetindo os passos iterativamente at o ponto em que os centrides no mudem de
posio.
Este algoritmo pode ser usado em diversas situaes. (MACQUEEN, 1967) afirma que as
possveis aplicaes do kmeans esto includas em mtodos para agrupamentos por similaridade,
previso nolinear, aproximao de distribuies multivariadas e testes noparamtricos de
independnciaentrevriasvariveis.
6




4.METODOLOGIA

Para a realizao deste trabalho foi utilizada a base de dados do Moodle utilizado na Rede
Telecentros BR por aproximadamente mil e quatrocentos alunos (monitores) no curso de formao
para incluso digital promovido pela Rede Nacional de Formao para Incluso Digital, a qual foi
responsvel pela construo, manuteno e aplicao do referido curso. A coleta de dados ocorreu
de maneira implcita atravs do uso e interao dos monitores na plataforma Moodle e
armazenamento na base de dados da plataforma. O Moodle armazena todas as interaes dos
usurios na plataforma em forma de logs: cada clique que o usurio realiza na plataforma para fins
denavegao,bemcomodetalhesdasatividadesqueosestudantesparticiparam.
O Moodle armazena os logs em uma base de dados relacional, com cerca de 145 tabelas
interrelacionadas, porm neste trabalho as informaes utilizadas encontravamse somente na
tabela mdl_log responsvel pelo armazenamento de eventos do sistema. O prprocessamento
consistiu na limpeza das informaes das demais tabelas do Moodle em conjunto com o filtro para
eliminar alunos excludos e administradores do sistema procurando mitigar a interferncia destes
gruposdeusurios.
Apartir da etapa de preprocessamento a clusterizao permitida usando o algortimo
Kmeans para duas dimenses onde so tratadas as colunas: course e userid, contando o
nmero de acessos de cada usurio para cada curso, tambm so filtrados smente eventos dentro
da categoria course.Aps a composio do dataset para o algoritimo de clusterizao o mesmo
sra executado para: k=5 pois so estabelecidos pelo programa quatro niveis de avaliaes
qualitativas: Excelente, Bom, Regular e Insuficiente, contudo foi acrescentada uma classe para que
outliers (valores fora do esperado) possam ser minimizados nas outras classes (FAYYAD, U et al,
1996).
Os resultados do Kmeans so grupos definidos que passam pela analise de quantitativos de
alunos,acessosecursos.
Apartir do mesmo possivel inferir caracteristicas comuns entre grande numero de usuarios
no mesmo grupo e ate mesmo o grupo dos usuarios mais experientes na plataforma, chamados
monitores.

5.RESULTADOS

Para o prprocessamento os numero de linhas da base foram resumidas para 13283 linhas,
poisaslinhasdelogficaramrestritasascaracterisitcascitadasnametodologia.
ParaoKmeansforamencontradosos5clusterescomasseguintescaracteristicas:
No cluster 1 foram contados 200848 acessos em 19 cursos distintos e 4046 alunos, cerca
de49,64acessosporalunoe2,61acessosporalunoeporcurso
No cluster 2 foram contados 69544 acessos em 2 cursos para 7 alunos, cerca de 9934,85
acessosporalunoe4967,42acessosporalunoeporcurso
No cluster 3 foram contados 562578 acessos em 40 cursos e 1488 alunos, cerca de
378,07acessosporalunoe9,45acessosporalunoeporcurso
No cluster 4 foram contabilizados 349423 acessos em 30 cursos e 7603 alunos, cerca de
45,958acessosporalunoe1,53acessosporalunoeporcurso
7



No cluster 5 foram contados 179516 acessos em 24 cursos e 140 alunos, cerca de
1282,25acessosporalunoe53,42acessosporalunoeporcurso.
importante ressaltar o tempo de execuo em 15.69 segundos, para o prprocessamento e
kmeans. Todos os procedimentos foram executados no mesmo computador com os seguintes
requisitos de hardware: Processador Core i73632QM @ 2.20Ghz, Memoria de 4GB @1333Mhz
esistemaoperacionalLinuxdistribuioUbuntu14.04.

6. CONSIDERAESFINAIS

Como objetivado neste trabalho os resultados demonstraram grupos distintos de usurios


apartir da clusterizao do log da plataforma Moodle, mais detalhadamente possivel reconhecer
com base nos resultados a distancia entre o maior e menor cluster isso ocorre pois no caso do
cluster 2, pelo pequeno numero de usurios e grande numero de acessos o grupo demonstra ser
formado provavelmente por usurios que administram o sistema, chamados Monitores, facilmente
identificado nos clusteres: 1,3 e 4 nmeros prximos porem diferenciados pelo numero de acesso
aos cursos no grupo 4 possvel inferir que esto localizados alunos com acesso regular ao sistema,
j nos grupos: 3 e 1, respectivamente possuem crescimento de numero de acessos por aluno e por
curso:maiorparaoprimeiroemenorparaosegundo.
Estes resultados so de extrema importancia para o gerenciamento dos cursos no moodle e
analisequantitativadaanalisequalitativafeitanoprogramaTelecentrosBR.

7.REFERNCIASBIBLIOGRFICAS

CAPTERRA (2014). The top 20 most popular LMS Soft ware solutions.
http://www.capterra.com/top20lmssoftwaresolutions.UZJRP7WnCSp.

FAYYAD, U. PiatetskyShapiro, G. Smyth, P. From Data Mining to Knowledge Discovery: An


Overview, in Advances in Knowledge Discovery and Data Mining, R. Uthurusamy, eds., MIT
Press,Cambridge,Mass.,1996,pp.136.

KATYAL, V. AVIRAL SRIVASTAVA, D. Elimination of Glass Artifacts and Object


Segmentation.InternationalJournalOfComputerApplications.[s.i.],abr.2012.

KLSGEN, W., & Zytkow, J. Handbook of data mining and knowledge discovery. New York:
OxfordUniversityPress,2002

MACQUEEN, J. B. Some Methods for classification and Analysis of Multivariate Observations.


Proceedingsof5thBerkeleySymposiumonMathematicalStatisticsandProbability,1967.

MOSTOW, J., et al. An educational data mining tool to browse tutorstudent interactions: Time will
tell!InProceedingsoftheworkshoponeducationaldatamining,2005,pp.1522.

8



MOSTOW, J. Beck, J. Some useful tactics to modify, map and mine data from intelligent tutors.
JournalNaturalLanguageEngineering,vol.12,2006,pp.195208

PICHILIANI, Mauro. Data Mining na Prtica: Algoritmo KMeans. 2006. Disponvel em:
http://imasters.com.br/artigo/4709/sqlserver/dataminingnapraticaalgoritmokmeans. Acesso
em:14jun.2014.

SILVA, A., et al. Anlise de Redes Sociais para avaliao e monitoramento de programas de
treinamento em larga escala baseados no uso de ambientes de aprendizagem e redes sociais online.
IIBrazilianWorkshoponSocialNetworkAnalysisandMining,2013.


IDENTIFICATIONOFSTUDENTGROUPSINAVIRTUAL
LEARNINGENVIRONMENTUSINGLOGANALYSISBASEDIN
CLUSTERING



Abstract: This paper proposes a research methodology for the new evaluation of student
academic performance from an web based educational program on a large scale, in the
course of digital inclusion offered in Moodle platform, using clustering for separation of
students into three levels. So obtaining the common path on the platform for the three
clusters. This research was motivated by the uncertain performance of the students on the
platform in according to student profile. The case study consists in the formation of digital
inclusion agents, with emphasis on the utilization online social networks. In the ministered
course, social networks are designed to operate as a place of articulating community projects
involving digital inclusion agents and communities and share solutions to technical problems
ofdaytodaystatingappropriationandcommunityinvolvementintheseplaces.

Keywords:DigitalInclusion,Kmeans,PerformanceEvaluation,Education,StudentProfile.


9

Das könnte Ihnen auch gefallen