ANALISIS SENTIMEN PADA TWITTER SHOPEE INDONESIA MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN PEMBOBOT TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF)

AZ -ZAHRA, FADHILAH, B2A017055 (2021) ANALISIS SENTIMEN PADA TWITTER SHOPEE INDONESIA MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN PEMBOBOT TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF). Sarjana / Sarjana Terapan (S1/D4) thesis, ["eprint_fieldopt_institution_Muhammadiyah University, Semarang" not defined].

[img]
Preview
Text
0. Cover.pdf

Download (504kB) | Preview
[img]
Preview
Text
2. Lembar Pengesahan Pembimbing (SCAN).pdf

Download (517kB) | Preview
[img]
Preview
Text
3. Lembar Pengesahan Skripsi (SCAN).pdf

Download (533kB) | Preview
[img]
Preview
Text
6. ABSTRAK.pdf

Download (597kB) | Preview
[img]
Preview
Text
BAB I.pdf

Download (718kB) | Preview
[img]
Preview
Text
BAB II.pdf

Download (991kB) | Preview
[img] Text
BAB III.pdf
Restricted to Repository staff only

Download (533kB) | Request a copy
[img] Text
BAB IV.pdf
Restricted to Repository staff only

Download (1MB) | Request a copy
[img]
Preview
Text
BAB V.pdf

Download (502kB) | Preview
[img]
Preview
Text
DAFTAR PUSTAKA.pdf

Download (614kB) | Preview
[img] Text
LAMPIRAN.pdf
Restricted to Repository staff only

Download (567kB) | Request a copy
[img]
Preview
Text
Manuscript Indonesia.pdf

Download (894kB) | Preview

Abstract

Twitter termasuk media sosial yang diminati oleh banyak masyarakat dan menjelma menjadi penyiar informasi yang amat cepat saat ini. Informasi yang dikeluarkan serta bersirkulasi via media ini amat bebas serta banyak ragam, layaknya berita, pendapat, pertanyaan, kritikan, komentar baik bersifat positif ataupun negative Shopee merupakan E-commerce yang saat ini masih diminati masyarakat.. Klasifikasi ialah kaidah di teks mining yang menghimpunkan muatan mengacu pada kesamaan skripnya. Lewat kaidah ini membolehkan tweets yang tersedia di Twitter digolongkan jadi satu bersandarkan jenisnya. Misalkan, substansi sepakbola, voli, serta tenis diguguskan pada kategori olahraga. Prosedur pada klasifikasi dimulai memakai preprocessing, selanjutnya dilakukan pembobotan kata, lalu kategorisasi yang terdiri dari Preprocessing dan beberapa tahapan, yaitu pembersihan dokumen, tokenizing, stopword removal, serta stemming. Metode pembobotan kata yang dipergunakan dalam skripsi ini ialah Term Frequency–Inverse Document Frequency (TF-IDF) & memakai K-Nearest Neighbor (KNN)dengan data latih 80:20. Metode KNN merupakan klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Pengujian akurasi dari klasifikasi tweets pada Twitter dengan memakai metode K-Nearest Neighbor (K-NN) menghasilkan akurasi dimana total data berjumlah 1300, dengan angka k yang dimasukkan ialah 1, 3, 5, serta 7 dan 9 masing-masing hasilnya k = 1, akurasi sebesar 77,31%; k = 3, ketepatan 75,38%; k = 5, ketepatan 75,38%; k = 7, ketepatan 75,38% dan k=9 ketepatan 75,38%. Kata Kunci : :Preprocessing, K- Nearest Neighbor, Term frequency-inverse document frequency

Item Type: Thesis (Sarjana / Sarjana Terapan (S1/D4) )
Call Number: 007/Statistika/VI/2021
Subjects: L Education > Statistics
Divisions: Faculty of Agricultural Science and Technology > S1 Statistics
Depositing User: perpus unimus
Date Deposited: 17 Sep 2021 07:41
Last Modified: 17 Sep 2021 07:41
URI: http://repository.unimus.ac.id/id/eprint/4815

Actions (login required)

View Item View Item