Beruflich Dokumente
Kultur Dokumente
ABSTRACT
Development of Information Technology (IT) has provided the means for universities to improve the quality of
service to its academic community. IT supported information system that can provide added value to each college if
it is designed to be an information system that is effective and efficient. Effective use of information systems and
efficient indicates that the system can support the achievement of the vision and mission of the college [1].
Classification technique is one of data mining techniques including supervised learning. Supervised learning means
the process of establishing a correspondence (function) using a training dataset, seen as a "past experience" from a
model. The goal is to predict from a value (output) of a function to each new object (input) after completing the
training process [2].
C4.5 is one method used to induce a decision tree that was discovered by J. Ross Quinlan. This algorithm is derived
from the popular ID3 algorithm used in making the decision tree. C4.5 is suitable algorithms used to classify large
amounts of data into a certain class of classes based on the pattern of the existing data [3].
From the results of tests performed, both confusion matrix and ROC Curve proven that the results of tests performed
C4.5 algorithm has an accuracy value of 98.18%.
From the research that the role of the C4.5 algorithm is able to predict the level of student satisfaction of the
Academic Information Systems College of Teacher Training and Education Hamzanwadi Selong.
Keywords: The information system, Academic Information System (SIAKAD), Algorithms C.45
PENDAHULUAN
Seiring dengan perkembangan teknologi informasi yang semakin pesat, keberadaan sistem
informasi untuk mendukung kegiatan operasional suatu organisasi baik didalam organisasi
bisnis, institusi pendidikan maupun institusi pemerintahan berkembang menjadi kebutuhan yang
mendasar dan memegang peranan penting. Dalam dunia usaha, sistem informasi tersebut sudah
menjadi hal umum untuk dipergunakan sebagai penunjang bisnis dalam kegiatan operasional
maupun kegiatan yang bersifat strategis [4].
Dalam dunia pendidikan, keberadaan sistem informasi merupakan salah satu komponen
yang tidak dapat dipisahkan dari aktivitas pendidikan itu sendiri. Keterbukaan pendidikan dan
permintaan mahasiswa atau orang tua untuk mendapatkan pelayanan yang lebih baik,
menyebabkan pihak manajemen perguruan tinggi berusaha terus meningkatkan efisiensi dan
48
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
efektifitas pengelolaan perguruan tinggi, baik dengan jalan pengembangan SDM, manajemen
mutu (ISO) ataupun pengembangan sistem informasi [4].
Perkembangan Teknologi Informasi (TI) telah memberikan berbagai sarana bagi perguruan
tinggi untuk meningkatkan kualitas pelayanan terhadap sivitas akademiknya. Sistem informasi
yang didukung TI dapat memberikan nilai tambah bagi setiap perguruan tinggi jika didesain
menjadi suatu sistem informasi yang efektif dan efisien. Penggunaan sistem informasi yang
efektif dan efisien menandakan bahwa sistem tersebut dapat mendukung tercapainya Visi dan
Misi perguruan tinggi tersebut [1].
Perguruan tinggi swasta yang cukup tua di Indonesia bagian timur ini adalah Sekolah
Tinggi Keguruan dan Ilmu Pendidikan (STKIP) Hamzanwadi Selong yang telah berdiri sejak
tahun 1972. Saat ini STKIP Hamzanwadi Selong terdiri dari 15 program studi dengan 11
program studi sudah terakreditasi dan empat program studi mendapatkan izin penyelenggaran
dengan jumlah mahasiswa yang aktif sekitar 5000 orang. Sistem informasi yang dimiliki saat ini
masih dirasakan belum optimal meskipun sudah terintegrasi dengan beberapa departemen yang
ada. Sudah saatnya perguruan tinggi tersebut memiliki penataan sistem informasi terintegrasi
yang baik agar proses bisnis yang ada tetap berjalan dengan mengedepankan pelayanan yang
optimal kepada mahasiswa.
Sistem informasi yang dimiliki oleh STKIP Hamzanwadi Selong saat ini yaitu Sistem
Informasi Akademik (SIAKAD) dengan aplikasi yang terdiri atas Sistem Informasi Akademik
Mahasiswa (SIAM), Sistem Informasi Monitoring Akademik (SIMA), Sistem Registrasi
Akademik (SIRAK), perpustakaan digital (Digital Library), Sistem Penerimaan Mahasiswa Baru
(SPMB), Sistem Informasi Keuangan (SIMKEU), Sistem Informasi Wisuda dan sistem lainnya
yang belum pernah di lakukan evaluasi, sehingga belum dapat di ketahui sejauh mana sistem-
sistem tersebut sudah berjalan dan memberikan kontribusi terhadap lembaga. Permasalahan
tersebut dapat diselesaikan dengan menggunakan metode data mining.
Teknik klasifikasi adalah salah satu dari teknik data mining yang termasuk supervised
learning. Supervised learning artinya proses pembentukan sebuah korespondensi (fungsi)
menggunakan sebuah training dataset, dilihat sebagai sebuah "pengalaman masa lalu" dari
sebuah model. Tujuannya adalah untuk memprediksi dari sebuah nilai (output) dari sebuah
fungsi untuk setiap objek baru (input) setelah menyelesaikan proses training [2].
49
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya kedalam
kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan utama yang
dilakukan yaitu pembangunan model sebagai prototype untuk disimpan sebagai memori dan
penggunaan model tersebut untuk melakukan pengenalan/klasifikasi/prediksi pada unsur objek
data lain agar diketahui di kelas mana objek data tersebut dalam model yang sudah disimpannya
[5]. Ada beberapa algoritma klasifikasi data mining yang dapat digunakan untuk strategi dalam
pengajaran seperti yang ditulis oleh Sergio Moro dan Raul M.S. Laureano diantaranya Naïve
Bayes (NB), Decision Trees (DT) dan Support Vector Machines (SVM) [6]. C4.5 merupakan
salah satu metode yang digunakan untuk menginduksi pohon keputusan yang ditemukan oleh J.
Ross Quinlan. Algoritma ini diturunkan dari algoritma ID3 yang populer digunakan dalam
membuat pohon keputusan. C4.5 merupakan algoritma yang cocok digunakan untuk
mengklasifikasi data dalam jumlah besar kedalam kelas kelas tertentu berdasarkan pola data
yang ada [3]. Di dalam data mining dan machine learning C4.5 digunakan untuk mempelajari
data dalam jumlah besar, membuat model pembelajaran berupa pohon keputusan yang dapat
diterapkan untuk memprediksi data yang belum muncul.
Mengklasifikasikan data kuesioner evaluasi Sistem Informasi Akademik secara cepat,
tepat, dan komperhensip, serta Algoritma c4.5 merupakan suatu metode pengolahan data yang
dapat dapat memberikan pemahaman kepada pimpinan tentang kualitas Sistem Informasi
Akademik Sekolah Tinggi Keguruan dan Ilmu Pendidikan Hamzanwadi Selong.
Hasil dari pengolahan data menggunakan c4.5 dan dijadikan penilaian dan pengukuran
tingkat kepuasan mahasiswa terhadap Sistem Informasi Akademik yang ada. Berdasarkan uraian
tersebut di atas, maka penelitian diberi judul “Prediksi Tingkat Kepuasan Mahasiswa Terhadap
Sistem Informasi Akademik Sekolah Tinggi Keguruan dan Ilmu Pendidikan Hamzanwadi Selong
Menggunakan Algoritma C.45”.
50
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
kebijakan dari lembaga. Efisiensi, efektifitas dan persaingan untuk memberikan pelayanan yang
baik kebapada seluruh civitas akademik merupakan salah satu alasan SIAKAD di kembangkan,
hingga saat ini SIAKAD sudah memiliki 8 aplikasi diantaranya sebagai berikut.
1. Super User
Sistem informasi Super User merupakan sistem informasi yang hanya dapat di akses oleh
administrator lembaga. Sistem ini memiliki fungsi yang sangat vital terhadap sistem yang
lainnya. Segala kegiatan yang didasarkan pada kalender akademik diatur pada sistem ini,
selain itu sistem ini juga mengatur penggunaan sistem yang lain di SIAKAD.
Pengelolaan Super User oleh Administrator harus mendapatkan ijin oleh kepala pusat
Teknologi Informasi dan Komunikasi (TIK) lembaga, mengingat sistem ini memegang
kendali seluruh sistem yang ada.
2. Sistem Informasi Penerimaan Mahasiswa Baru (SPMB)
Sistem Informasi Penerimaan Mahasiswa Baru (SPMB) merupakan sistem seleksi penerimaan
mahasiswa. Sistem ini mengelompokkan mahasiswa melalui beberapa jalur penerimaan yaitu,
jalur undangan dan jalur tes
3. Sistem Informasi Keuangan (SIKU)
Sistem Informasi Keuangan (SIKU) merupakan sistem informasi menghubungkan sistem
keuangan lembaga, Bank dan Mahasiswa. SIKU memiliki berbagai fitur di antaranya adalah,
Neraca (Master Biaya, Paket Tagihan dan pengiriman tagihan), Tagihan (Data Tagihan dan
Validasi Tagihan Lainnya), Validasi (Tagihan Mahasiswa, Status Mahasiswa), Laporan
(Status Tagihan, Laporan Transaksi, Neraca, Lihat Tagihan Belum Bayar, Total Master
Biaya) dan Koreksi. Sistem keuangan merupakan kunci utama mahasiswa untuk dapat
melakukan kegiatan selama studi, jika mahasiswa memiliki status registrasi tidak aktif, maka
mahasiswa tidak dapat menginputkan KRS dan lain sebagainya. Hal ini akan menyebabkan
mahasiswa dianggap tidak menempuh kegiatan akademik dan akan di masukkan dalam
kategori cuti.
4. Sistem Informasi Registrasi Akademik (SIRAK)
Sistem Registrasi Akademik (SIRAK) merupakan cerminan dari manajemen akademik dalam
lembaga, hal itu sebabkan karena segala sesuatu yang menjadi inti pelayanan ada pada bagian
SIRAK seperti kurikulum yang diterapkan, penerapan kalender akademik, penilaian dan lain
sebagainya. SIRAK dikelola oleh bagian akademik dan program studi, pengelolaan tersebut
51
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
dipisahkan karena masing-masing memiliki tugas dan fungsi yang berbeda sesui dengan
Tugas Pokok dan Fungsi (TUPOKSI) yang telah disahkan oleh lembaga.
5. Sistem Informasi Pelaporan (SIMPEL)
Penerapan sistem informasi yang baik dan dapat dikatakan tidak gagal adalah dapat dilihat
dari pejabat (Decision Maker) yang membuat kewanangan dapat membuat keputusan yang
tepat berdasarkan sistem informasi. Sistem Informasi Pelaporan (SIMPEL) dalam hal ini
memegang fungsi kearah yang telah ditetapkan yaitu, menyajikan data kepada pejabat baik
tentang kemahasiswaan, keuangan maupun kepegawaian, sehingga para pembuat keputusan
dapat mengambil kebijakan yang tepat sesuai dengan data yang disajikan.
6. Sistem Informasi Perpustakaan Digital (Digital Library)
Kemudahan pencarian sumber pustaka merupakan salah satu kebutuhan mahasiswa yang
harus dipenuhi oleh setiap lembaga pendidikan. Meskipun saat ini pencarian sumber pustaka
dapat melalui berbagai media, namun pencarian dalam sumber pustakan dalam lingkup
internal dengan informasi yang spesifik seperti jumlah buku yang tersedia, letak buku, dan
informasi rinci lainnya dapat sangat membantu mahasiswa. Untuk memenuhi kebutuhan ini,
sistem informasi perpustakaan digital (Digital Library) mampu menyediakan informasi
kepada mahasiswa secara akurat dan cepat.
7. Sistem Informasi Wisuda (SIDA)
Sistem Informasi Wisuda (SIDA), dikelola oleh bagian akademik. Sistem ini menyajikan data
mahasiswa yang sudah melengkapi syarat untuk diwisuda. Kelengkapan data ini nantinya
akan di unduh untuk kemudian di buatkan buku wisuda atau dalam bentuk Compact Disk
(CD) sesuai dengan kepentingan lembaga, yang akan diserahkan pada saat mahasiswa di
wisuda.
8. Sistem Informasi Akademik Mahasiswa (SIAM)
Sistem ini merupakan sistem informasi yang kelola langsung oleh mahasiswa, sistem ini
sangat penting bagi mahasiswa untuk mengetahui segala transaksi akademik selama
mahasiswa melakukan studi. Selain itu sistem ini juga memberikan informasi kepada
mahasiswa mengenai biaya studi yang akan dikenakan setiap semesternya. Uraian secara jelas
mengenai SIAM adalah sebagai berikut.
SIAKAD dapat diakses dengan alamat http://siakad.hamzanwadi.ac.id/ sehingga akan muncul
tampilan seperti pada Gambar 2.1.
52
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
Algoritma C.45
C4.5 merupakan salah satu metode yang digunakan untuk menginduksi pohon keputusan yang
ditemukan oleh J. Ross Quinlan. Algoritma ini diturunkan dari algoritma ID3 yang populer
digunakan dalam membuat pohon keputusan. C4.5 merupakan algoritma yang cocok digunakan
untuk mengklasifikasi data dalam jumlah besar kedalam kelas kelas tertentu berdasarkan pola
data yang ada [17]. Di dalam data mining dan machine learning C4.5 digunakan untuk
mempelajari data dalam jumlah besar, membuat model pembelajaran berupa pohon keputusan
yang dapat diterapkan untuk memprediksi data yang belum muncul. Beberapa kelebihan dari
pohon keputusan [16]:
1. Hasil analisa berupa diagram pohon yang sangat mudah dimengerti.
2. Mudah untuk dibangun, serta membutuhkan data percobaan yang lebih sedikit
dibandingkan algoritma klasifikasi lainnya.
3. Mampu mengolah data nominal dan kontinyu.
4. Model yang dihasilkan dapat dengan mudah dimengeri, beberapa teknik klasifikasi yang
berbeda seperti neural network menyajikan model dengan informasi logis yang tersirat,
sehingga perlu dipelajari.
5. Menggunakan teknik statistik sehingga dapat divalidasikan.
6. Cepat dan handal dalam mengolah dataset besar.
7. Akurasi yang dihasilkan mampu menandingi teknik klasifikasi yang lainnya.
53
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
C4.5 adalah bagian dari algoritma untuk klasifikasi dalam pembelajaran machine learningdan
data mining. C4.5 merupakan algoritma yang cocok digunakan untuk masalah klasifikasi pada
machine learning dan data mining [17]. C4.5 memetakan atribut dari kelas sehingga dapat
digunakan untuk menemukan prediksi terhadap data yang belum muncul. Algoritma C4.5 dan
pohon keputusan merupakan dua model yang tak terpisahkan, karena untuk membangun sebuah
pohon keputusan, dibutuhan algoritma C4.5. Di akhir tahun 1970 hingga di awal tahun 1980-an,
J. Ross Quinlan seorang peneliti di bidang mesin pembelajaran mengembangkan sebuah model
pohon keputusan yang dinamakan ID3 (Iterative Dichotomiser), walaupun sebenarnya proyek ini
telah dibuat sebelumnya oleh E.B. Hunt, J. Marin, dan P.T. Stone. Kemudian Quinlan membuat
algoritma dari pengembangan ID3 yang dinamakan C4.5 yang berbasis supervised learning.
(2.1)
Keterangan:i = himpunan m = jumlah partisi i f(i,j) = proposi j terhadap i
kasus
3. Hitung nilai gain dengan rumus:
(2.1)
54
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
Keterangan:
P = jumlah partisi atribut ni = proporsi ni terhadap i n = jumlah kasus dalam n
Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus
yang dituangkan dalam Tabel 1:
Tabel 1. Keputusan Bermain Tenis
Dalam kasus yang tertera pada Tabel 1, akan dibuat pohon keputusan untuk menentukan main
tenis atau tidak dengan melihat keadaan cuaca (outlook), temperatur, kelembaban (humidity) dan
keadaan angin (windy). Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera dalam
Rumus 2.1. Sedangkan perhitungan nilai entropy dapat dilihat pada rumus 2.2. Berikut ini adalah
penjelasan lebih rinci mengenai masing-masing langkah dalam pembentukanpohon keputusan
dengan menggunakan algoritma C4.5 untuk menyelesaikan permasalahan. Menghitung jumlah
kasus, jumlah kasus untuk keputusan Yes, jumlah kasus untuk keputusan No,dan Entropy dari
semua kasus dan kasus yang dibagi berdasarkan atribut OUTLOOK,TEMPERATURE,
HUMIDITY dan WINDY.
55
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
Kerangka Pemikiran
Kerangka Teori dapat dilihat pada Gambar dibawah ini
Indicator Propoced Model Objective Measurement
Dataset
C 45 Model Acuracy
Information Confusion Matrix
Gain (Accuracy)
K-fold Validation
METODE
Desain Penelitian
Dalam sebuah penelitian, metode yang digunakan untuk memecahkan masalah, diantaranya:
mengumpulkan data, merumuskan hipotesis atau proposisi, menguji hipotesis, hasil penafsiran,
dan kesimpulan yang dapat dievaluasi secara independen oleh orang lain . Ada empat metode
penelitian yang umum digunakan yaitu : Pengumpulan data, pengolahan data, model yang
diusulkan, eksperimen dan pengujian, evaluasi dan validasi hasil.
Dalam penelitian ini ada beberapa tahapan yang dilakukan seperti pada gambar 3.1.
56
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
Pengumpulan
Data
Pengolahan Awal
Data
Model/Metode Yang
Eksperimen dan
57
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
58
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
59
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
60
Muhammad Khairul Rizal, Suhartini, Jagat Sugiantara
DAFTAR PUSTAKA
[1] I. A. Mastan and W. W. Winarno, “EVALUASI TINGKAT KEPUASAN PENGGUNA
SISTEM INFORMASI CYBER CAMPUS (SICYCA) DENGAN MODEL DELONE
DAN MCLEAN (STUDI KASUS: STIKOM SURABAYA),” 2013.
[2] Y. S. Nugroho, “DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES
UNTUK KLASIFIKASI KELULUSAN MAHASISWA UNIVERSITAS DIAN
NUSWANTORO,” 2009.
[3] N. Padhy, P. Mishra, and R. Panigrahi, “The Survey of Data Mining Applications And
Feature Scope,” 2012.
[4] Y. Dwitayanti, “DAMPAK IMPELEMENTASI SISTEM INFORMASI AKADEMIK
TERHADAP KEPUASAN MAHASISWA,” 2011.
[5] G. Fiastantyo, “PERBANDINGAN KINERJA METODE KLASIFIKASI DATA
MINING MENGGUNAKAN NAÏVE BAYES DAN ALGORITMA C4.5 UNTUK
PREDIKSI KETEPATAN WAKTU KELULUSAN MAHASISWA,” 2009.
[6] K. Hastuti, “Analisis komparasi algoritma klasifikasi data mining untuk prediksi
mahasiswa non aktif,” vol. 2012, no. Semantik, pp. 241–249, 2012.
[7] N. M. Wasilah, PENERAPAN DATA MINING UNTUK MENGANALISIS KEPUASAN
KONSUMEN MENGGUNAKAN METODE C4.5, vol. 5. 2013.
61
PENERAPAN ALGORITMA C4.5 UNTUK PREDIKSI TINGKAT KEPUASAN MAHASISWA TERHADAP SISTEM …
62