Deteksi Sentimen Ujaran Kebencian dalam Tweet Media Sosial X dalam Konteks RKUHP Menggunakan Algoritma KNN
DOI:
https://doi.org/10.51158/0ha06920Keywords:
K-Nearest Neighbor, Hate Speech, Sentiment Analysis, RKUHP, XAbstract
Penyebaran ujaran kebencian di platform media sosial, terutama dalam konteks undang-undang kontroversial seperti Rancangan Kitab Undang-Undang Hukum Pidana (RKUHP), menimbulkan tantangan kritis dalam menjaga diskursus publik yang konstruktif. Studi ini bertujuan untuk mengidentifikasi dan mengklasifikasikan sentimen dalam tweet yang berkaitan dengan RKUHP menggunakan algoritma K-Nearest Neighbor (KNN). Sebuah dataset berisi 703 tweet dikumpulkan melalui API X dengan kata kunci “RKUHP”, mencerminkan puncak percakapan online pada Juni 2023. Setelah disaring untuk konten Bahasa Indonesia, tweet diproses melalui pembersihan (penghapusan tanda baca, tag, URL), normalisasi, dan terjemahan ke dalam Bahasa Inggris. Penandaan sentimen dilakukan menggunakan TextBlob, dan kemudian diverifikasi oleh ahli linguistik untuk meningkatkan akurasi label. Term Frequency–Inverse Document Frequency (TF–IDF) diterapkan untuk ekstraksi fitur, dan cosine similarity digunakan sebagai metrik jarak. Beberapa nilai K (3, 5, 7, 9) diuji, dengan K = 3 menghasilkan akurasi tertinggi sebesar 56,74%. Evaluasi menunjukkan bahwa KNN dapat mendeteksi sentimen terkait ujaran kebencian dalam tweet Indonesia secara moderat, meskipun masih ada keterbatasan dalam menangani sarkasme, netralitas, dan ambiguitas terjemahan. Hasil ini mendukung upaya untuk meningkatkan deteksi ujaran kebencian otomatis dengan mengintegrasikan embeddings kontekstual, mengatasi ketidakseimbangan kelas, dan memanfaatkan pembelajaran ensembel.
 
						 
							

