Beruflich Dokumente
Kultur Dokumente
VIRTUALDEAPRENDIZAGEMUTILIZANDOANLISEDELOG
BASEADAEMCLUSTERIZAO
MrciaFontesPinheiroeng.marciafontes@gmail.com
LuizCortinhasFerreiraNetoluizcf14@gmail.com
HaroldoNazardeSJuniorhnsj86@gmail.com
EulliaC.daMataeucmata@gmail.com
AntonioF.L.JacobJr.jacobjr@ufpa.br
damodeLimaSantanaadamo@ufpa.br
UniversidadeFederaldoParUFPA
LaboratriodePlanejamentodeRedesdeAltoDesempenhoLPRAD
RuaAugustoCorra,01,Guam,Caixapostal479
CEP:66075110BelmPA
Resumo: Este trabalho prope uma metodologia de pesquisa para avaliao de desempenho
acadmico dos alunos de um programa educacional de larga escala, no curso de incluso
digital ministrados semipresencialmente pela plataforma Moodle, utilizando clusterizao
para separao dos alunos em quatro nveis (Exelente, Bom, Regular, Insuficiente) . Assim
obtendo o caminho comum dentro da plataforma para os cinco clusteres (um cluster
formado por alunos que no se enquadram nos nveis descritos). Esta pesquisa foi motivada
pela incerteza do aproveitamento dos alunos na plataforma de acordo com o perfil do aluno.
O estudo de caso consiste na formao de agentes de incluso digital, com nfase na
utilizao de redes sociais online. No curso ministrado, as redes sociais so planejadas para
funcionar como espao de articulao de projetos comunitrios envolvendo agentes de
incluso digital e comunidades e compartilhar solues para problemas tcnicos do diaa
dia,indicandoapropriaoeenvolvimentodacomunidadenessesespaos.
2.REDETELECENTROS.BR
2
No Brasil, dentre as polticas pblicas para favorecimento da incluso digital, tmse
investido na criao e na utilizao de centros tecnolgicos comunitrios, ou telecentros, onde o
acesso pblico s TICs disponibilizado para as comunidades menos privilegiadas a um custo
mnimo ou isento de custos. Neste contexto, alm da implantao dos telecentros para acesso
Internet, tmse a formao de agentes para incluso digital como aspecto crtico. A proposta
envolveu um programa de formao em larga escala que requereu mecanismos de controle e
monitoramento para gestores e beneficiadores desse programa, a Rede Nacional de Formao para
InclusoDigitalRedeTelecentrosBR(SILVA,2013).
A Rede Telecentros BR at o ano de 2011 contava com a participao de cinco polos
regionais (um polo para cada regio do Pas), dois polos estaduais (nos estados de So Paulo e
Cear) e um polo nacional. Sob a responsabilidade dos polos regionais estava a formao dos
agentes de incluso digital (que so os monitores dos telecentros), gestores de telecentros
(responsveis pela administrao do telecentro), tutores (que atuavam na formao dos monitores) e
supervisores de tutoria (responsveis pela superviso e acompanhamento do trabalho dos tutores)
(SILVA,2013).
No perodo de fev/2010 a dez/2012, os membros dos polos de formao se articularam
para construir e aplicar o Curso de Formao de Monitores dos Telecentros e a ativao das redes
sociais de agentes de incluso social atuantes nas comunidades. O projeto de formao dos agentes
de incluso digital (monitores) contemplou a oferta de um curso de 480 horas, disponibilizado na
plataforma Moodle (Rede Telecentros.BR, 2013) e dividido em dois mdulos: 80 horas para um
uma breve apresentao dos contedos da formao e 400 horas com foco especfico no
desenvolvimento de projetos comunitrios e aprofundamento dos contedos. Para o
desenvolvimento dos projetos comunitrios, os agentes de incluso digital percorreram de acordo
com seus interesses e necessidade, sem percurso prdefinido, diferentes temas: comunicao
comunitria, redes, cultura digital, comunidade, telecentros. No desenvolvimento do curso, os
agentes de incluso digital contaram com o apoio de tutores e supervisores de tutores dos diversos
polosregionais(SILVA,2013).
A formao contribuiu para que os agentes de incluso digital usassem as TIC como
ferramentas para alavancar transformaes sociais na comunidade em que estavam inseridos. Neste
contexto, os agentes de incluso digital deveriam alcanar domnio tcnico e instrumental das
ferramentas relacionadas s tecnologias da informao e comunicao, atuando de forma solidria,
cooperativa e interativa com os seus colegas de formao e de trabalho, com condies de se
reconhecer e de atuar como agente de transformao social na comunidade os quais estavam
inseridos(SILVA,2013).
2.1PlataformaMoodle
Figura3.Fase2:ProjetoComunitrio
O processo de formao foi realizado em grupo de n monitores para um tutor, que fizeram
o acompanhamento para o primeiro acesso a plataforma, incentivaram a participao no ambiente
virtual e no desenvolvimento do projeto comunitrio, assim como realizaram a avaliao dos
monitores mensalmente. Os tutores tiveram o acompanhamento e auxilio dos supervisores de tutoria
no processo de formao. Os supervisores eram pessoas que fizeram parte dos polos regionais,
facilitadores da formao, acompanhavam os tutores e monitores no processo de formao,
4
realizaram tambm avaliao das turmas com base nas informaes levantadas na plataforma
Moodle e com as informaes repassadas pelos tutores. A coordenao pedaggica realizou
acompanhamento dos supervisores e tutores com base em informaes obtidas na plataforma e no
sistemadeavaliao.
3.KMEANS
Figura2.PassosdoalgoritmoKmeans.
No primeiro passo, atribuise valores aos k primeiros centrides seguindo algum critrio.
Geralmente escolhido os k primeiros pontos da tabela para cada centride. No entanto, estes
valores tambm podem ser gerados aleatoriamente. Aps atribudo os valores, h o clculo da
distncia de cada objeto para cada centride. O total de distncias corresponde ao produto de N
objetos por k centriodes ( N * k). Tendo a distncia dos pontos para os centrides, os objetos
so classificados de acordo com a classe a qual o objeto est mais perto do centride, formando os
clusters. Com os grupos formados, calculase novamente o valor do centride, de acordo com a
posio dos objetos pertencentes ao grupo. O novo centride calculado atravs da mdia de cada
atributo de todos os pontos pertencentes a classe. Ao final deste processo, o algoritmo volta ao
passo 2, repetindo os passos iterativamente at o ponto em que os centrides no mudem de
posio.
Este algoritmo pode ser usado em diversas situaes. (MACQUEEN, 1967) afirma que as
possveis aplicaes do kmeans esto includas em mtodos para agrupamentos por similaridade,
previso nolinear, aproximao de distribuies multivariadas e testes noparamtricos de
independnciaentrevriasvariveis.
6
4.METODOLOGIA
Para a realizao deste trabalho foi utilizada a base de dados do Moodle utilizado na Rede
Telecentros BR por aproximadamente mil e quatrocentos alunos (monitores) no curso de formao
para incluso digital promovido pela Rede Nacional de Formao para Incluso Digital, a qual foi
responsvel pela construo, manuteno e aplicao do referido curso. A coleta de dados ocorreu
de maneira implcita atravs do uso e interao dos monitores na plataforma Moodle e
armazenamento na base de dados da plataforma. O Moodle armazena todas as interaes dos
usurios na plataforma em forma de logs: cada clique que o usurio realiza na plataforma para fins
denavegao,bemcomodetalhesdasatividadesqueosestudantesparticiparam.
O Moodle armazena os logs em uma base de dados relacional, com cerca de 145 tabelas
interrelacionadas, porm neste trabalho as informaes utilizadas encontravamse somente na
tabela mdl_log responsvel pelo armazenamento de eventos do sistema. O prprocessamento
consistiu na limpeza das informaes das demais tabelas do Moodle em conjunto com o filtro para
eliminar alunos excludos e administradores do sistema procurando mitigar a interferncia destes
gruposdeusurios.
Apartir da etapa de preprocessamento a clusterizao permitida usando o algortimo
Kmeans para duas dimenses onde so tratadas as colunas: course e userid, contando o
nmero de acessos de cada usurio para cada curso, tambm so filtrados smente eventos dentro
da categoria course.Aps a composio do dataset para o algoritimo de clusterizao o mesmo
sra executado para: k=5 pois so estabelecidos pelo programa quatro niveis de avaliaes
qualitativas: Excelente, Bom, Regular e Insuficiente, contudo foi acrescentada uma classe para que
outliers (valores fora do esperado) possam ser minimizados nas outras classes (FAYYAD, U et al,
1996).
Os resultados do Kmeans so grupos definidos que passam pela analise de quantitativos de
alunos,acessosecursos.
Apartir do mesmo possivel inferir caracteristicas comuns entre grande numero de usuarios
no mesmo grupo e ate mesmo o grupo dos usuarios mais experientes na plataforma, chamados
monitores.
5.RESULTADOS
Para o prprocessamento os numero de linhas da base foram resumidas para 13283 linhas,
poisaslinhasdelogficaramrestritasascaracterisitcascitadasnametodologia.
ParaoKmeansforamencontradosos5clusterescomasseguintescaracteristicas:
No cluster 1 foram contados 200848 acessos em 19 cursos distintos e 4046 alunos, cerca
de49,64acessosporalunoe2,61acessosporalunoeporcurso
No cluster 2 foram contados 69544 acessos em 2 cursos para 7 alunos, cerca de 9934,85
acessosporalunoe4967,42acessosporalunoeporcurso
No cluster 3 foram contados 562578 acessos em 40 cursos e 1488 alunos, cerca de
378,07acessosporalunoe9,45acessosporalunoeporcurso
No cluster 4 foram contabilizados 349423 acessos em 30 cursos e 7603 alunos, cerca de
45,958acessosporalunoe1,53acessosporalunoeporcurso
7
No cluster 5 foram contados 179516 acessos em 24 cursos e 140 alunos, cerca de
1282,25acessosporalunoe53,42acessosporalunoeporcurso.
importante ressaltar o tempo de execuo em 15.69 segundos, para o prprocessamento e
kmeans. Todos os procedimentos foram executados no mesmo computador com os seguintes
requisitos de hardware: Processador Core i73632QM @ 2.20Ghz, Memoria de 4GB @1333Mhz
esistemaoperacionalLinuxdistribuioUbuntu14.04.
6. CONSIDERAESFINAIS
7.REFERNCIASBIBLIOGRFICAS
CAPTERRA (2014). The top 20 most popular LMS Soft ware solutions.
http://www.capterra.com/top20lmssoftwaresolutions.UZJRP7WnCSp.
KLSGEN, W., & Zytkow, J. Handbook of data mining and knowledge discovery. New York:
OxfordUniversityPress,2002
8
MOSTOW, J. Beck, J. Some useful tactics to modify, map and mine data from intelligent tutors.
JournalNaturalLanguageEngineering,vol.12,2006,pp.195208
PICHILIANI, Mauro. Data Mining na Prtica: Algoritmo KMeans. 2006. Disponvel em:
http://imasters.com.br/artigo/4709/sqlserver/dataminingnapraticaalgoritmokmeans. Acesso
em:14jun.2014.
SILVA, A., et al. Anlise de Redes Sociais para avaliao e monitoramento de programas de
treinamento em larga escala baseados no uso de ambientes de aprendizagem e redes sociais online.
IIBrazilianWorkshoponSocialNetworkAnalysisandMining,2013.
IDENTIFICATIONOFSTUDENTGROUPSINAVIRTUAL
LEARNINGENVIRONMENTUSINGLOGANALYSISBASEDIN
CLUSTERING
Abstract: This paper proposes a research methodology for the new evaluation of student
academic performance from an web based educational program on a large scale, in the
course of digital inclusion offered in Moodle platform, using clustering for separation of
students into three levels. So obtaining the common path on the platform for the three
clusters. This research was motivated by the uncertain performance of the students on the
platform in according to student profile. The case study consists in the formation of digital
inclusion agents, with emphasis on the utilization online social networks. In the ministered
course, social networks are designed to operate as a place of articulating community projects
involving digital inclusion agents and communities and share solutions to technical problems
ofdaytodaystatingappropriationandcommunityinvolvementintheseplaces.
Keywords:DigitalInclusion,Kmeans,PerformanceEvaluation,Education,StudentProfile.
9