PIPI

JOISIE (Journal Of Information Systems And Informatics Engineering)JOISIE (Journal Of Information Systems And Informatics Engineering)

Seiring berkembangnya teknologi yang begitu pesat dalam melakukan pengumpulan data mengakibatkan sebuah tumpukan data yang sangat banyak. Melalui banyaknya data tersebut, sehingga menjadi suatu kebutuhan untuk memanfaatkan data tersebut. Pemanfaatan data tentunya bertujuan agar menerima berita yang krusial dari pola-pola data yang terbentuk. Data yang bisa digunakan dapat diperoleh dari media sosial, salah satunya twitter. Twitter merupakan media sosial yang tercatat kurang lebih 50 juta orang pengguna di Indonesia. Dengan banyaknya pengguna di Indonesia, maka dapat dimanfaatkan dalam penggunaan data yang banyak. Untuk mendapatkan data tersebut yaitu dengan salah satu algoritma K-Nearest Neighbor. Algoritma KNN merupakan klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumnya. Hasil klasifikasi dari Algoritma KK yaitu data yang sudah diolah masuk ke dalam kelas B karena dari tiga tetangga terdekat, ada dua yang masuk kelas B, sementara hanya satu yang masuk kelas A. Akurasi yang dihasilkan oleh Algoritma KNN juga cukup baik yaitu di atas 80%. Model ini memberikan sensitivity yang lebih baik dalam proses klasifikasi data.

Berdasarkan data sebelumnya, kita dapat menyimpulkan bahwa dari tiga tetangga terdekat, dua jatuh ke kelas B sementara yang tersisa tetap di kelas A, menempatkan data baru di kelas B.Algoritma KNN menghitung KNN dengan menemukan sampel pelatihan yang paling dekat dengan sampel uji.Setelah KNN informasi dikumpulkan, sebagian besar digunakan untuk membuat prediksi berdasarkan sampel uji.

Penelitian selanjutnya dapat berfokus pada pengembangan model klasifikasi yang lebih adaptif terhadap perubahan tren percakapan di Twitter, misalnya dengan menggabungkan algoritma KNN dengan teknik deep learning untuk menangkap konteks semantik yang lebih kompleks. Selain itu, penelitian dapat dilakukan untuk mengidentifikasi dan mengatasi bias dalam data Twitter, seperti bias geografis atau demografis, agar hasil klasifikasi lebih representatif dan akurat. Terakhir, eksplorasi penggunaan fitur-fitur non-teksual, seperti emoji atau gambar, dalam proses klasifikasi dapat meningkatkan kinerja model dan memberikan wawasan yang lebih kaya tentang sentimen dan opini pengguna.

  1. PENERAPAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) DAN COSINE SIMILARITY PADA SISTEM... journal.uinjkt.ac.id/index.php/ti/article/view/8623PENERAPAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY TF IDF DAN COSINE SIMILARITY PADA SISTEM journal uinjkt ac index php ti article view 8623
Read online
File size236.64 KB
Pages6
DMCAReport

Related /

ads-block-test