ANALISIS SENTIMEN PADA TWITTER SHOPEE INDONESIA MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN PEMBOBOT TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF)

AZ -ZAHRA, FADHILAH, B2A017055 (2021) ANALISIS SENTIMEN PADA TWITTER SHOPEE INDONESIA MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN PEMBOBOT TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF). Sarjana / Sarjana Terapan (S1/D4) thesis, ["eprint_fieldopt_institution_Muhammadiyah University, Semarang" not defined].

Baca Full Teks

Preview

Text
0. Cover.pdf
Download (504kB) | Preview

Preview

Text
2. Lembar Pengesahan Pembimbing (SCAN).pdf
Download (517kB) | Preview

Preview

Text
3. Lembar Pengesahan Skripsi (SCAN).pdf
Download (533kB) | Preview

Preview

Text
6. ABSTRAK.pdf
Download (597kB) | Preview

Preview

Text
BAB I.pdf
Download (718kB) | Preview

Preview

Text
BAB II.pdf
Download (991kB) | Preview

Text
BAB III.pdf
Restricted to Repository staff only
Download (533kB) | Request a copy

Text
BAB IV.pdf
Restricted to Repository staff only
Download (1MB) | Request a copy

Preview

Text
BAB V.pdf
Download (502kB) | Preview

Preview

Text
DAFTAR PUSTAKA.pdf
Download (614kB) | Preview

Text
LAMPIRAN.pdf
Restricted to Repository staff only
Download (567kB) | Request a copy

Preview

Text
Manuscript Indonesia.pdf
Download (894kB) | Preview

Abstract

Twitter termasuk media sosial yang diminati oleh banyak masyarakat dan menjelma menjadi penyiar informasi yang amat cepat saat ini. Informasi yang dikeluarkan serta bersirkulasi via media ini amat bebas serta banyak ragam, layaknya berita, pendapat, pertanyaan, kritikan, komentar baik bersifat positif ataupun negative Shopee merupakan E-commerce yang saat ini masih diminati masyarakat.. Klasifikasi ialah kaidah di teks mining yang menghimpunkan muatan mengacu pada kesamaan skripnya. Lewat kaidah ini membolehkan tweets yang tersedia di Twitter digolongkan jadi satu bersandarkan jenisnya. Misalkan, substansi sepakbola, voli, serta tenis diguguskan pada kategori olahraga. Prosedur pada klasifikasi dimulai memakai preprocessing, selanjutnya dilakukan pembobotan kata, lalu kategorisasi yang terdiri dari Preprocessing dan beberapa tahapan, yaitu pembersihan dokumen, tokenizing, stopword removal, serta stemming. Metode pembobotan kata yang dipergunakan dalam skripsi ini ialah Term Frequency–Inverse Document Frequency (TF-IDF) & memakai K-Nearest Neighbor (KNN)dengan data latih 80:20. Metode KNN merupakan klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Pengujian akurasi dari klasifikasi tweets pada Twitter dengan memakai metode K-Nearest Neighbor (K-NN) menghasilkan akurasi dimana total data berjumlah 1300, dengan angka k yang dimasukkan ialah 1, 3, 5, serta 7 dan 9 masing-masing hasilnya k = 1, akurasi sebesar 77,31%; k = 3, ketepatan 75,38%; k = 5, ketepatan 75,38%; k = 7, ketepatan 75,38% dan k=9 ketepatan 75,38%. Kata Kunci : :Preprocessing, K- Nearest Neighbor, Term frequency-inverse document frequency

Item Type:	Thesis (Sarjana / Sarjana Terapan (S1/D4) )
Call Number:	007/Statistika/VI/2021
Subjects:	L Education > Statistics
Divisions:	Faculty of Agricultural Science and Technology > S1 Statistics
Depositing User:	perpus unimus
URI:	http://repository.unimus.ac.id/id/eprint/4815

Actions (login required)

View Item