Cegah Plagiarism dengan Algoritma Levenshtein Distance (Article Review from B.P. Pratama dan S.A. Pamungkas)


 
Algoritma Levenshtein Distance
Sumber: Google Images
Kehidupan sehari-hari kita saat ini tidak lepas dari tindakan plagiarisme khususnya dalam dunia penulisan karya ilmiah. Tindakan tersebut masih sering terjadi karena kurangnya penegtahuan masyarakat terhadap menghargai hak cipta, kemampuan bahasa dan tata bahasa yang kurang sehingga mengambil jalan pintas untuk menyalin tulisan orang lain. Namun, masih banyak juga yang sadar akan buruknya tindakan plagiarisme sehingga lebih waspada dalam menulis seperti melakukan parafrase dalam mengutip karya orang lain namun masih mencantumkan footnote/bodynote dari sumber informasi lain serta mencantumkan daftar pustaka dalam tulisannya. Maka dari itu, dibutuhkan alat untuk mendeteksi apakah tulisan kita terindikasi plagiarisme atau tidak.
Secara umum, tindak plagiarisme dilakukan dengan mengubah struktur kata dalam kalimat dan struktur kalimat dalam paragraf, serta melakukan penyisipan, penghapusan, atau penggantian kata. Pada penelitian yang dilakukan oleh B.P. Pratama dan S.A. Pamungkas dari Fakultas Sains dan Teknologi UIN Syarif Hidayatullah Jakarta, meneliti sebuah sistem yang mampu mendeteksi tingkat kemiripan antar dokumen teks menggunakan algoritma Levenshtein distance dengan menambahkan proses case folding, tokenizing, stopword removal, stemming, dan sorting. Proses pencocokan string pada algoritma ini dapat menghasilkan nilai distance yang menjadi penentu persentase bobot similarity.
Analisa penggunaan stopword removal, stemming, dan sorting dilakukan untuk melihat pengaruhnya terhadap kinerja algoritma Levenshtein distance. Simulasi algoritma ini dilakukan terhadap dua data set dan satu data real. Pada data set 1 dilakukan pengubahan struktur kata dalam kalimat, pada data set 2 pengubahan struktur kalimat dalam paragraf, dan pada data real tidak dilakukan pengubahan apapun karena data real merupakan dokumen abstrak dari jurnal penelitian.
Hasil simulasi menunjukkan bahwa penggunaan sorting sangat berpengaruh bagi algoritma Levenshtein distance. Hasil terbaik pada data set 1 ditunjukan pada proses yang menggunakan stopword removal, stemming, dan sorting sekaligus. Hasil terbaik pada data set 2 diperlihatkan pada proses yang menggunakan stopword dan stemming yang digabungkan dengan sorting. Hasil terbaik pada data real diperlihatkan pada proses stemming-sorting. 

Untuk mengetahui dan memahami lebih lanjut bagaimana cara pengaplikasian sistem tersebut, Anda dapat mengunjungi http://journal.uinjkt.ac.id/index.php/logika/article/view/3917


Semoga Bermanfaat

2 comments:

  1. Terima Kasih sudah berbagi informasi yang sangat bermanfaat

    ReplyDelete
  2. The best way to write a non plagiarized research paper is to give credit to the original author whenever they use their work by citing them through parenthetical citations and an accurate works cited. Students can also avoid plagiarism by giving credit to another person's ideas and opinions, to facts, statistics and drawings, proper paraphrasing of another person's words, and quotations whenever something is directly written in the paper. 抄襲比對

    ReplyDelete