Cegah Plagiarism dengan Algoritma Levenshtein Distance (Article Review from B.P. Pratama dan S.A. Pamungkas)
Kehidupan sehari-hari kita saat ini
tidak lepas dari tindakan plagiarisme khususnya dalam dunia penulisan karya
ilmiah. Tindakan tersebut masih sering terjadi karena kurangnya penegtahuan
masyarakat terhadap menghargai hak cipta, kemampuan bahasa dan tata bahasa yang
kurang sehingga mengambil jalan pintas untuk menyalin tulisan orang lain.
Namun, masih banyak juga yang sadar akan buruknya tindakan plagiarisme sehingga
lebih waspada dalam menulis seperti melakukan parafrase dalam mengutip
karya orang lain namun masih mencantumkan footnote/bodynote dari sumber
informasi lain serta mencantumkan daftar pustaka dalam tulisannya. Maka dari
itu, dibutuhkan alat untuk mendeteksi apakah tulisan kita terindikasi
plagiarisme atau tidak.
Secara umum, tindak plagiarisme dilakukan
dengan mengubah struktur kata dalam kalimat dan struktur kalimat dalam
paragraf, serta melakukan penyisipan, penghapusan, atau penggantian kata. Pada
penelitian yang dilakukan oleh B.P. Pratama dan S.A. Pamungkas dari Fakultas
Sains dan Teknologi UIN Syarif Hidayatullah Jakarta, meneliti sebuah sistem
yang mampu mendeteksi tingkat kemiripan antar dokumen teks menggunakan
algoritma Levenshtein distance dengan menambahkan proses case folding,
tokenizing, stopword removal, stemming, dan sorting. Proses pencocokan string
pada algoritma ini dapat menghasilkan nilai distance yang menjadi penentu
persentase bobot similarity.
Analisa penggunaan stopword removal, stemming,
dan sorting dilakukan untuk melihat pengaruhnya terhadap kinerja algoritma
Levenshtein distance. Simulasi algoritma ini dilakukan terhadap dua data set
dan satu data real. Pada data set 1 dilakukan pengubahan struktur kata dalam
kalimat, pada data set 2 pengubahan struktur kalimat dalam paragraf, dan pada
data real tidak dilakukan pengubahan apapun karena data real merupakan dokumen
abstrak dari jurnal penelitian.
Hasil simulasi menunjukkan bahwa penggunaan
sorting sangat berpengaruh bagi algoritma Levenshtein distance. Hasil terbaik
pada data set 1 ditunjukan pada proses yang menggunakan stopword removal,
stemming, dan sorting sekaligus. Hasil terbaik pada data set 2 diperlihatkan
pada proses yang menggunakan stopword dan stemming yang digabungkan dengan
sorting. Hasil terbaik pada data real diperlihatkan pada proses
stemming-sorting.
Untuk mengetahui dan memahami lebih
lanjut bagaimana cara pengaplikasian sistem tersebut, Anda dapat mengunjungi http://journal.uinjkt.ac.id/index.php/logika/article/view/3917
Semoga Bermanfaat
Terima Kasih sudah berbagi informasi yang sangat bermanfaat
ReplyDeleteThe best way to write a non plagiarized research paper is to give credit to the original author whenever they use their work by citing them through parenthetical citations and an accurate works cited. Students can also avoid plagiarism by giving credit to another person's ideas and opinions, to facts, statistics and drawings, proper paraphrasing of another person's words, and quotations whenever something is directly written in the paper. 抄襲比對
ReplyDelete