UNIDHAUNIDHA
Jurnal Sistem Informasi Dan InformatikaJurnal Sistem Informasi Dan InformatikaPertumbuhan data secara eksponensial dalam era digital telah mendorong kebutuhan akan metode analisis yang mampu menangani volume, kecepatan, dan keragaman data dalam lingkungan Big Data. Penelitian ini mengkaji penerapan metode Agglomerative Hierarchical Clustering (AHC) sebagai pendekatan segmentasi data tidak terstruktur. Eksperimen dilaksanakan menggunakan dua dataset: (1) dataset Iris sebanyak 24 sampel dengan 8 atribut morfologi bunga, dan (2) dataset transaksi e-commerce sebanyak 10 record pelanggan dengan 5 atribut perilaku. Metode Ward linkage dipilih berdasarkan kajian literatur yang konsisten menunjukkan keunggulannya. Hasil eksperimen pada dataset Iris membentuk 3 cluster optimal dengan Silhouette Score 0,4196 dan Adjusted Rand Index 0,3635, dengan akurasi pengelompokan 70,83%. Cluster 1 seluruhnya berisi Setosa (6 sampel), Cluster 2 didominasi Versicolor (8 sampel), dan Cluster 3 didominasi Virginica (10 sampel). Pada dataset e-commerce, terbentuk 3 segmen pelanggan: pelanggan premium (frekuensi tinggi, belanja besar), pelanggan menengah, dan pelanggan pasif. Temuan ini konsisten dengan penelitian terdahulu dan memvalidasi efektivitas AHC sebagai metode segmentasi data multidimensi.
Penelitian ini berhasil mengimplementasikan metode Agglomerative Hierarchical Clustering (AHC) dengan Ward linkage untuk segmentasi data pada dua dataset berbeda dalam konteks Big Data.Beberapa kesimpulan utama dapat ditarik dari hasil penelitian ini.Pertama, AHC Ward linkage berhasil membentuk 3 cluster optimal pada dataset Iris (n=24, 8 fitur) dengan Silhouette Score 0,4196 dan Adjusted Rand Index 0,3635.Cluster 1 sepenuhnya berisi spesies Setosa (presisi 100%), sementara Cluster 2 dan Cluster 3 berbagi sampel Versicolor dan Virginica akibat kemiripan morfologi kedua spesies tersebut.Akurasi keseluruhan pengelompokan mencapai 70,83% (17/24 sampel benar).Kedua, implementasi AHC pada dataset e-commerce (n=10, 5 fitur) menghasilkan 3 segmen pelanggan yang terdefinisi jelas tanpa overlap.pelanggan premium dengan rata-rata belanja Rp 5.000 dan frekuensi 13–15 transaksi/bulan, pelanggan menengah dengan belanja Rp 1.000 dan frekuensi 2–4 transaksi/bulan, serta pelanggan pasif dengan belanja di bawah Rp 200.Ketiga, perbandingan dengan 20 referensi menunjukkan bahwa efektivitas AHC dipengaruhi oleh tiga faktor utama.(1) pemilihan metode linkage, di mana Ward linkage secara konsisten unggul.(2) karakteristik intrinsik data, khususnya tingkat separasi antar kelompok.
Berdasarkan hasil penelitian, disarankan untuk melakukan implementasi AHC pada dataset berskala Big Data yang lebih besar (> 100.000 record) menggunakan Apache Spark. Selain itu, penelitian lanjutan dapat dilakukan dengan membandingkan secara sistematis empat metode linkage pada dataset yang sama, serta menambahkan metrik evaluasi Davies-Bouldin Index dan Calinski-Harabasz Index. Terakhir, mengeksplorasi metode hybrid AHC-K-Means dapat menjadi arah penelitian yang menarik untuk memaksimalkan efektivitas segmentasi data dalam lingkungan Big Data.
| File size | 673.63 KB |
| Pages | 9 |
| DMCA | Report |
Related /
INSURIPONOROGOINSURIPONOROGO Model Pengembangan Nilai Agama Islam PAI- Visual, Interaktif, dan Kinestetik terbukti efektif dalam menanamkan dan memperkuat nilai-nilai moderasi beragamaModel Pengembangan Nilai Agama Islam PAI- Visual, Interaktif, dan Kinestetik terbukti efektif dalam menanamkan dan memperkuat nilai-nilai moderasi beragama
UNIDHAUNIDHA Penelitian ini bertujuan untuk menganalisis segmentasi pelanggan menggunakan metode Hierarchical Clustering pada dataset Mall Customers. Tujuan utama penelitianPenelitian ini bertujuan untuk menganalisis segmentasi pelanggan menggunakan metode Hierarchical Clustering pada dataset Mall Customers. Tujuan utama penelitian
UNIDHAUNIDHA Penelitian ini berhasil merancang dan membangun sistem toko online berbasis web untuk Destys Pastry menggunakan PHP 8. 5, dan MySQL dengan pendekatan modelPenelitian ini berhasil merancang dan membangun sistem toko online berbasis web untuk Destys Pastry menggunakan PHP 8. 5, dan MySQL dengan pendekatan model
UNIDHAUNIDHA Penelitian ini mengimplementasikan mekanisme Redis Publish/Subscribe (Pub/Sub) menggunakan bahasa pemrograman Python untuk pengiriman data suhu sensorPenelitian ini mengimplementasikan mekanisme Redis Publish/Subscribe (Pub/Sub) menggunakan bahasa pemrograman Python untuk pengiriman data suhu sensor
MEDIAPUBLIKASIMEDIAPUBLIKASI Model struktural yang diestimasi untuk masing-masing industri dan telah di uji secara signifikan adalah REM. Hasil estimasi memperlihatkan bahwa upah minimumModel struktural yang diestimasi untuk masing-masing industri dan telah di uji secara signifikan adalah REM. Hasil estimasi memperlihatkan bahwa upah minimum
MEDIAPUBLIKASIMEDIAPUBLIKASI Data diambil dari lirik lagu Olivia Rodrigo, teori Knickerbocker dan Reninger (1963) digunakan untuk menganalisis data, sedangkan teori Leech (1981) danData diambil dari lirik lagu Olivia Rodrigo, teori Knickerbocker dan Reninger (1963) digunakan untuk menganalisis data, sedangkan teori Leech (1981) dan
POLTEKBAPOLTEKBA Frekuensi yang dihasilkan sama dengan frekuensi masukan yang diharapkan, dengan mengamati lebarnya pulsa dalam satu perioda yang ditampilkan dengan grafik.Frekuensi yang dihasilkan sama dengan frekuensi masukan yang diharapkan, dengan mengamati lebarnya pulsa dalam satu perioda yang ditampilkan dengan grafik.
POLTEKBAPOLTEKBA Hal ini terbukti dari adanya peningkatan skor motivasi belajar matematika mahasiswa dari 2,919 menjadi 3,193 pada siklus pertama dan dari 3,193 menjadiHal ini terbukti dari adanya peningkatan skor motivasi belajar matematika mahasiswa dari 2,919 menjadi 3,193 pada siklus pertama dan dari 3,193 menjadi
Useful /
INSURIPONOROGOINSURIPONOROGO co, framing moderat dan rasional pada Mediaindonesia.com, serta framing normatif berbasis nilai pada Republika. co.id. Ketiga, produksi makna dalam diskursusco, framing moderat dan rasional pada Mediaindonesia.com, serta framing normatif berbasis nilai pada Republika. co.id. Ketiga, produksi makna dalam diskursus
UNIDHAUNIDHA Penelitian ini mengimplementasikan algoritma Random Forest untuk mengklasifikasikan diagnosis kanker payudara menggunakan dataset Wisconsin Breast CancerPenelitian ini mengimplementasikan algoritma Random Forest untuk mengklasifikasikan diagnosis kanker payudara menggunakan dataset Wisconsin Breast Cancer
MEDIAPUBLIKASIMEDIAPUBLIKASI Berdasarankan rangkaian penjelasan diatas maka dapat disimpulkan bahwasannya peranan pemimpin dan lingkungan kerja dalam suatu organisasi bisnis/perusahaanBerdasarankan rangkaian penjelasan diatas maka dapat disimpulkan bahwasannya peranan pemimpin dan lingkungan kerja dalam suatu organisasi bisnis/perusahaan
MEDIAPUBLIKASIMEDIAPUBLIKASI Gunungsewu merupakan salahsatu wilayah yang memiliki landscape karst terluas kedua di Indonesia. Keberagaman morfologi di wilayah perbukitan karst menjadikanGunungsewu merupakan salahsatu wilayah yang memiliki landscape karst terluas kedua di Indonesia. Keberagaman morfologi di wilayah perbukitan karst menjadikan