Transcription

KLASIFIKASI KREDITMENGGUNAKAN METODE DECISION TREE PADANASABAH PD BPR BKK GABUSSusantiA11.2010.04582Fakultas Ilmu Komputer, Universitas Dian Nuswantoro, Semarang 50131ABSTRAKBank adalah salah satu lembaga keuangan yang berperan penting dalamperekonomian di Indonesia. Bank menghimpun dana dari masyarakat yaituberupa simpanan tabungan yang dilakukan oleh masyarakat, kemudian bankmelakukan peranan bank yang lain yaitu memberikan jasa keuangan berupakredit. Bank PD BPR BKK Gabus merupakan salah satu perbankan yangmelayani perkreditan di desa. Adanya PD BPR BKK Gabus memudahkanbagi rakyat pedesaan untuk meminjam dana . Kebutuhan masyarakatpedesaan yang semakin meningkat menyebabkan tidak sedikitnya yangmelakukan kredit di PD BPR BKK Gabus. Pada penelitian ini digunakanteknik data mining klasifikasi dengan metode algoritma C4.5 untukmengetahui apakah nasabah tergolong nasabah lancar ataupun tidal lancar.Dari hasil pengujian data menghasilkan akurasi sebesar 33,33% yangtergolong Failure dan menghasilkan rule dari pohon keputusan yangditerapkan pada implementasi sistem klasifikasi data nasabah kredit di PDBPR BKK Gabus. Model ini berhasil diterapkan sistem untuk mengetahuinasabah yang tergolong lancar ataupun tidak lancar.Kata kunci : klaifikasi, kredit, decision tree1. PENDAHULUANBank adalah lembaga keuangan yang usaha pokoknya adalahmenghimpun dana dan menyalurkan kembali dana tersebut ke masyarakatdalam bentuk kredit serta memberikan jasa-jasa dalam lalu lintaspembayaran dan peredaran uang. Oleh karena itu, dalam melakukankegiatan usahanya sehari-hari bank harus mempunyai dana agar dapat

memberikan kredit kepada masyarakat. Dana tersebut dapat diperoleh daripemilik bank (pemegang saham), pemerintah, bank Indonesia, pihak-pihakdi luar negeri, maupun masyarakat dalam negeri. Dana dari pemilik bankberupa setoran modal yang dilakukan pada saat pendirian bank[1].Menurut SK Direksi Bank Indonesia No 31/KEP/DIR/ tanggal sespembentukan asset bank sehingga kredit merupakan asset bank yangmemiliki risiko risk asset karena asset tersebut dikuasai oleh pihak luaryaitu debitur. Bank harus berusaha mengelola asset tersebut agar kualitasrisk asset tersebut menjadi sehat dalam arti produktif sehingga dapatmemberikan kontribusi pendapatan yang besar bagi bank.Perusahaan Daerah Bank Perkreditan Rakyat Kabupaten Pati CabangGabus (PD BPR BKK Gabus) merupakan salah satu cabang dari PD BPRBKK Kabupaten Pati yang dikelola secara khusus oleh pemerintahKabupaten Pati. Salah satu bagian dari struktur organisasi bank ini adalahbagian dana. Bagian dana ini bertugas untuk mencari nasabah dan ataupenghimpun dana masyarakat berupa kredit, dana tabungan, deposito,simpanan, dan pinjaman lainnya.Dengan perkembangan teknologi sekarang ini yang sudah maju danpemikiran setiap individu yang sedikit lebih maju,tidak memungkinkansemua orang saat ini sudah memanfaatkan layanan dari PD BPR BKKGabus dan sebagai salah satu layanan dari PD BPR BKK Gabus yang palingdiminati adalah kredit, karena pengajuannya mudah serta angsuranbervariasi menurut kemampuan nasabah tersebut.Didalam menyalurkan dana kredit bank mendapati ada beberapakredit yang dikatakan kurang lancar atau kredit macet yang kemudian akanberpengaruh kepada pemberian kredit selanjutnya atau juga bisamempengaruhi kemampuan bank didalam menyalurkan kredit[1]. Salahsatu cara yang bisa dilakukan oleh pihak PD BPR BKK Gabus untukmencegah terjadinya kredit macet adalah dengan mengetahui kualitas kreditsejak dini.

Dalam penelitian ini, penulis melakukan analisa kredit denganmenggali data-data yang sudah ada terhadap data nasabah kreditberdasarkan atribut-atributnya dengan teknik data mining menggunakanalgoritma C 4.5. Data mining adalah proses menganalisa data dari perspektifyang berbeda dan menyimpulkannya menjadi informasi - informasi tungan,memperkecil biaya pengeluaran atau keduanya[2]. Algoritma C4.5merupakan kelompok algoritma decision tree. Algoritma ini mempunyaiinput berupa training samples dan samples [3]. Dengan menggunakanalgoritma C4.5 untuk klasifikasi data nasabah kredit diharapkan lahkreditmacet.Sehingga hasil penelitian ini dapat dimanfaatkan PD BPR BKKGabus untuk mengetahui klasifikasi data nasabah yang tergolong lancarmaupun tidak dan mengurangi jumlah kredit macet.Penelitian sebelumnya dilakukan oleh Fitri Nuraeni, Rahadi DeliSaputra dan Neneng Sri Uryani “ Algoritma C 4.5 Untuk Klasifikasi PolaPembayaran Kredit Motor Pada Perusahaan Pembiayaan (Leasing). Padatahun 2012, Angga Ginanjar Mabrur dan Riani Lubis “ Penerapan nelitianbeberapaalgoritma data mining seperti regresi linier, neural network, dan decisiontree.Semua model algoritma digunakan untuk menganalisa persetujuanpinjaman dalam bentuk kredit.Dari hasil penelitian yang didapat bahwadecision tree dengan algoritma C4.5 terbukti mempunyai akurasi tertinggidalam menentukan keputusan dibandingkan dengan algoritma yang lain [4].Berdasarkan latar belakang permasalahan tersebut, maka penulismemilih judul “Klasifikasi Pemberian Kredit Nasabah MenggunakanMetode Decision Tree Pada PD BPR BKK Gabus”.Adanya penilitian inidiharapkan untuk menunjang meminimalisir kemungkinan kredit yangbermasalah lebih dini dan akurat.

2. LANDASAN TEORI2.1 KreditKredit berasal dari bahasa Yunani, creader, yang berartikepercayaan. Dengan demikian istilah kredit memiliki arti khusus, yaitumeminjamkan uang(penundaan pembayaran) [1].Menurut Undang –Undang Perbankan Nomor 7 tahun 1998 kreditadalah penyediaan uang atau tagihan yang dapat dipersamakan dengan itu,berdasarkan persetujuan atau kesepakatan pinjam meminjam antara bankdengan pihak lain yang mewajibkan pihak peminjam melunasi utangnyasetelah jangka waktu tertentu dengan pemberian bunga.Dalam pemberian kredit, unsur kepercayaan adalah hal yang sangatmendasar yang menciptakan kesepakatan antara pihak yang memberikankredit dan pihak yang menerima kredit untuk dapat melaksanakan hak dankewajiban yang telah disepakati, baik dari jangka waktu peminjamansampai masa pengembalian kredit serta balas jasa yang diperoleh [1].Dari beberapa pengertian tentang kredit yang telah dikemukakandiatas, maka dapat disimpulkan bahwa kredit adalah penyediaan uang yangdipinjamkanoleh pihak bank kepada pihak peminjam dengan suatu janjibahwa pembayarannya akan dilunasi oleh pihak peminjam sesuai denganjangka waktu yang telah disepakati beserta besarnya bunga yang telahditetapkan.2.2 KlasifikasiKlasifikasi merupakan suatu pekerjaan menilai objek data untukmemasukkannya ke dalam kelas dari sejumlah kelas yang tersedia. Dalamklasifikasi ada dua pekerjaan utama yang dilakukan, yaitu (1) pembangunanmodel sebagai prototype untuk disimpan sebagai memori dan (2) pengunaanmodel tersebut untuk melakukan pengenalan/klasifikasi/prediksi/ pada suatu

objek data lain agar diketahui dikelas mana objek data tersebut dalam modelyang sudah disimpannya[6].2.3 Decision TreeDecision tree merupakan metode yang ada pada teknik klasifikasidalam data mining.Metode pohon keputusan mengubah fakta yang sangatbesar menjadi pohon pohon keputusan yang mempresentasikan aturan.Pohon keputusan juga berguna untuk mengeksplorasi data, menemukanhubungan tersembunyi antara jumlah calon variable input dengan sebuahvariabel target [7].Metode ini digunakan untuk memprediksi nilai diskrit dari fungsitarget, yang mana fungsi pembelajaran dipresentasikan oleh sebuah decisiontree [10].Decision tree merupakan himpunan IF THEN.Setiap path dalamtree dihubungkan sebuah aturan, dimana presi terdiri dari sekumpulan nodenodeyang ditemui, dan kesimpulan dari aturan terdiri atas kelas yangterhubung dengan leaf dari path [11].Terdapat 3 jenis node yang terdapat pada decision tree [12], yaitu:a. Root node, merupakan node paling atas, padanode initidak ada input dan bisa tidak mempunyai output ataumempunyai output lebih dari satu.b. Internal Node, merupakan node percabangan. Pada nodeini terdapat percabangan. Pada node ini terdapat satu inputdan memiliki output mininmal dua.c. Leaf node atau terminal node, merupakan node akhir. Padanode ini terdapat satu input dan tidak mempunyai output.Contoh decision tree yang dihasilkan dari Tabel 2.1 Dataset Play Golfsebagai beikut :

Gambar 1.2 Decision tree dari data set play golf3. METODE PENELITIANBerikut ini sistematika tahapan dalam mengolah data kredit sesuaidengan:1. WawancaraPada tahap ini penulis mewawancarai beberapa pihak awancara mengenai data kredit nasabah seperti pendapatan,pinjaman, angsuran, waktu, kategori.2. Pengumpulan DataDalam tahap ini penulis mencari bahan-bahan dasar yaitu datadata kredit nasabah berupa data nasabah dan data-data yangberkaitan dengan kredit.3. Jurnal dan Studi PustakaTahap ini merupakan landasan awal dalam penelitian ini. Daristudi pustaka ini didapatkan banyak referensi yang akan mendukungpenelitian ini, sekaligus untuk memperkuat pengetahuan dasar danteori yang digunakan pada penelitian ini.

Tabel 3.3 Contoh Data Sampel gSedangTidak Lancar8KecilKecilPendekTidak Lancar9KecilSedangSedangTidak Lancar10KecilKecilPendekTidak LancarPada tahap pengujian model ini data yang digunakan telah melewatitahap preposesing. Sebelum dilakukan pengujian terlebih dahulu datadiimport lalu di tentukan kategorinya dan mana yang akan dijadikan atributdan mana yang akan dijadikan label, seperti gambar 4.1:

Gambar 4.1 Import DataSetelah diimport lalu data diuji dengan algoritma C4.5 padarapidminer, digunakan cross validation untuk pengujian model.Desainalgoritma C4.5 pada rapidminer seperti pada gambar 4.2.Gambar 4.2 Pemodelan Algoritma C4.5 dan Cross ValidationPada gambar 4.2 dataset nasabah kredit PD BPR BKK Gabusdihubungkan dengan operator cross validation yang didalamnya terdapatproses seperti gambar 4.3.Gambar 4.3 Pengujian Algoritma C4.5 oleh Cross ValidationAlgoritma C4.5 melakukan training terhadap data-data yang telahdibagi oleh cross validation menjadi dua kotak yaitu training dan testing.Training terdiri dari decision tree, sedangkan testing terdiri dari apply modeldan performance.

Berdasarkan gambar 4.2 dan 4.3 dapat dijelaskan mengenaiparameter dan operator yang digunakan pada model algoritma C4.5 sebagaiberikut:1. import dataset yang akan digunakan, pada penelitian ini datadiimport dari file excel.2. Validation operator yang digunakan dalam penelitian ini splitvalidation, validation ini hanya membagi total dari keseluruhandataset menjadi data training dan data testing berdasarkan ratioyang telah digunakan.3. Decision tree adalah metode klasifikasi yang digunakan dalampenelitian ini.4. Apply Model adalah operator yang digunakan dalam penelitianini Algoritma C4.5.5. Performance adalah operator yang digunakan untuk mengukurperforma akurasi dari model.Hasil PercobaanPengujian ini dilakukan untuk mengetahui kinerja dari metodealgoritma C4.5 dalam melakukan klasifikasi terhadap kelas yang telahditentukan dalam ujicoba ini. Kemudian diberikan rasio data training padasplit validation, sehingga menghasilkan akurasi.Hasil akurasi confusion matrix pada percobaan ini sebagai berikut:

Gambar 4.4 Confusion MatrixJumlah true positif (tp) sebanyak 293 record, false positif (fp)sebanyak 2 record, jumlah true negatif (tn) sebanyak 14 record dan jumlahfalse negatif (fn) sebanyak 21 record.Akurasi yang dihasilkan dari dataset PD BPR BKK Gabus padaconfusion matrix dengan pengujian metode algoritma C4.5 pada rapid minersebesar 33,33%. Akurasi tersebut tergolong dalam good classification.Berikut adalah perhitungan akurasi, sensitivity, specifity, ppv, dannpv:Decision TreeSetelah dilakukan pengujian metode algoritma C4.5 pada rapidMiner, maka terbentuk pohon keputusan seperti gambar 4.5.

Gambar 4.5 Pohon Keputusan Algoritma C4.5Pada gambar 4.5 yang menjadi akar dari pohon keputusan yaituwaktu. Pohon keputusan diatas menghasilkan rule yang yang akandiimplementasikan pada program. Rules tersebut sebagai berikut:Gambar 4.6 Rule yang Terbentuk Dari Decision TreeRule pada gambar 4.6 yang nantinya akan digunakan padaimplementasi program. Berikut ini penjelasan rule yang terbentuk daripemodelan algoritma C4.5 pada gambar 4.6.1.Jika waktu “pendek” dan pendapatan “besar”, maka keterangan Lancar.

2.Jika waktu “pendek”, pendapatan “kecil” dan pinjaman “kecil”,maka keterangan Lancar.3.Jika waktu “pendek”, pendapatan“kecil” dan pinjaman “sedang”,maka keterangan Lancar.4.Jika waktu “pendek”, pendapatan “sedang” ”, maka keterangan Lancar.5.Jika waktu “sedang”, maka keterangan Tidak Lancar.4. KesimpulanDari permasalahan di atas dapat disimpulkan bahwa klasifikasidata nasabah kredit di PD BPR BKK Gabus dapat diselesaikanmenggunakan teknik data mining, yaitu dengan mengunakan algoritmaC4.5, karena rules yang terbentuk sederhana. Akurasi yang dihasilkandari pemodelan algoritma C4.5 sebesar 33,33% yang tergolong Failure.DAFTAR PUSTAKA[1] Nurul Fitria and Raina Linda Sari, "Analisis Kebijakan PemberianKredit dan Pengaruh Non Performing Loan Terhadap Loan To DepositRatio Pada PT. Bank Rakyat Indonesia (Persero), Tbk Cabang RantauAceh Tamiang (Periode 2007-2011)," Ekonomi dan Keuangan, vol. 1,no. 1, pp. 88-101, Desember 2012.[2] Angga Ginanjar Mabrur and Riani Lubis, "Penerapan Data MiningUntuk Memprediksi Kriteria Nasabah Kredit," Komputer danInformatika (KOMPUTA), vol. 1, pp. 53-57, Maret 2012.[3] Sunjana , "Klasifikasi Data Nasabah Sebuah Asuransi MenggunakanAlgoritma C 4.5," Seminar Nasional Aplikasi Teknologi Informasi 2010(SNATI 2010), pp. 31-34, Juni 2010.

[4] Fitri Nuraeni, Rahadi Deli Saputra, and Neneng Sri Uryani, "AlgoritmaC4.5 Untuk Klasifikasi Pola Pembayaran Kredit Motor PadaPerusahaan Pembiayaan (Leasing)," Seminar Nasional Informatika , pp.245-250, 2013.[5] satriawahono.net [Accesed 15 Mei 2014][6] Eko Prasetyo, Data Mining Konsep dan Aplikasi Menggunakan Matlab.Yogyakarta: Andi, 2012.[7] Bundanis Dwi Meilani Achmad, "Klasifikasi Data Karyawan UntukMenentukan Jadwal Kerja Menggunakan Metode Decision Tree,"IPTEK , vol. 16, no. 1, pp. 17-23, Mei 2012.[8] Ian H.Witten, Frank Eibe, and Mark A.Hall, Data Mining : PraticalMachine Learning Tools and Techniques. USA: Morgan Kaufman, 3rded.[9] Irwan Budiman, "Data Clustering Menggunakan CRISP-DM untukPengenalan Pola Proporsi Pelaksanaan Tridharma," Universitas,Diponegoro, Thesis Sistem Informasi 2012.[10] G.Liang , "A Comparative Study of Three Decision Tree Algoritms :ID3, Fuzzy ID3 and Probabilistic Fuzzy ID3," Rotterdam University ,Netherlands, 2005.[11] C.Marsala , "Application of Fuzzy Rule Induction to Data Mining,"PiereeUniversity, 1998.[12] Joko Lianto, Umi Hanik, and Ahmad Saikhu, "Fuzzy Decision Treedengan Algoritma C4.5 Pada data Diabetes Indian Pima," Sistem dan

Informatika, pp. 1-3, 2011.[13] Sardiarinto , "Aplikasi Sistem Pendukung Keputusan KelayakanPeminjaman Kredit Nasabah Koperasi Berbasis Android," BianglalaInformatika, vol. 1, no. 1, September 2013.[14] ConfusionMatrix.www.cs.uregina.ca/ sed21 Mei 2014][15] Anik Andriani, "Penerapan Algoritma C 4.5 Pada Program KlasifikasiMahasiswa Dropout," Seminar Nasional Matematika, pp. 139-147,2012.

decision tree dengan algoritma C4.5 terbukti mempunyai akurasi tertinggi dalam menentukan keputusan dibandingkan dengan algoritma yang lain [4]. . rapidminer, digunakan cross