AZ -ZAHRA, FADHILAH, B2A017055 (2021) ANALISIS SENTIMEN PADA TWITTER SHOPEE INDONESIA MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN PEMBOBOT TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF). Sarjana / Sarjana Terapan (S1/D4) thesis, ["eprint_fieldopt_institution_Muhammadiyah University, Semarang" not defined].
|
Text
0. Cover.pdf Download (504kB) | Preview |
|
|
Text
2. Lembar Pengesahan Pembimbing (SCAN).pdf Download (517kB) | Preview |
|
|
Text
3. Lembar Pengesahan Skripsi (SCAN).pdf Download (533kB) | Preview |
|
|
Text
6. ABSTRAK.pdf Download (597kB) | Preview |
|
|
Text
BAB I.pdf Download (718kB) | Preview |
|
|
Text
BAB II.pdf Download (991kB) | Preview |
|
Text
BAB III.pdf Restricted to Repository staff only Download (533kB) | Request a copy |
||
Text
BAB IV.pdf Restricted to Repository staff only Download (1MB) | Request a copy |
||
|
Text
BAB V.pdf Download (502kB) | Preview |
|
|
Text
DAFTAR PUSTAKA.pdf Download (614kB) | Preview |
|
Text
LAMPIRAN.pdf Restricted to Repository staff only Download (567kB) | Request a copy |
||
|
Text
Manuscript Indonesia.pdf Download (894kB) | Preview |
Abstract
Twitter termasuk media sosial yang diminati oleh banyak masyarakat dan menjelma menjadi penyiar informasi yang amat cepat saat ini. Informasi yang dikeluarkan serta bersirkulasi via media ini amat bebas serta banyak ragam, layaknya berita, pendapat, pertanyaan, kritikan, komentar baik bersifat positif ataupun negative Shopee merupakan E-commerce yang saat ini masih diminati masyarakat.. Klasifikasi ialah kaidah di teks mining yang menghimpunkan muatan mengacu pada kesamaan skripnya. Lewat kaidah ini membolehkan tweets yang tersedia di Twitter digolongkan jadi satu bersandarkan jenisnya. Misalkan, substansi sepakbola, voli, serta tenis diguguskan pada kategori olahraga. Prosedur pada klasifikasi dimulai memakai preprocessing, selanjutnya dilakukan pembobotan kata, lalu kategorisasi yang terdiri dari Preprocessing dan beberapa tahapan, yaitu pembersihan dokumen, tokenizing, stopword removal, serta stemming. Metode pembobotan kata yang dipergunakan dalam skripsi ini ialah Term Frequency–Inverse Document Frequency (TF-IDF) & memakai K-Nearest Neighbor (KNN)dengan data latih 80:20. Metode KNN merupakan klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Pengujian akurasi dari klasifikasi tweets pada Twitter dengan memakai metode K-Nearest Neighbor (K-NN) menghasilkan akurasi dimana total data berjumlah 1300, dengan angka k yang dimasukkan ialah 1, 3, 5, serta 7 dan 9 masing-masing hasilnya k = 1, akurasi sebesar 77,31%; k = 3, ketepatan 75,38%; k = 5, ketepatan 75,38%; k = 7, ketepatan 75,38% dan k=9 ketepatan 75,38%. Kata Kunci : :Preprocessing, K- Nearest Neighbor, Term frequency-inverse document frequency
Item Type: | Thesis (Sarjana / Sarjana Terapan (S1/D4) ) |
---|---|
Call Number: | 007/Statistika/VI/2021 |
Subjects: | L Education > Statistics |
Divisions: | Faculty of Agricultural Science and Technology > S1 Statistics |
Depositing User: | perpus unimus |
Date Deposited: | 17 Sep 2021 07:41 |
Last Modified: | 17 Sep 2021 07:41 |
URI: | http://repository.unimus.ac.id/id/eprint/4815 |
Actions (login required)
View Item |