SENTIMEN ANALYSIS ONLINE SHOP ON THE PLAY STORE USING METHOD SUPPORT VECTOR MACHINE (svm)
Di era 4.0 iniperkembanganteknologitelahmengubahcaramanusiauntukmelakukanaktifitasnya, melaluipenggunaan gadget dan internet. aktifitasmanusiasepertikomunikasimenggunakan media sosial, belajarsecara online, danberbelanjasecara online pun dapat di aksesmelalui internet tanpaharuspergiketokosecaralangsung, proses transaksimenjadilebihmudahdenganadanya E-commerce.
Di Indonesia sendiribegitubanyak online marketplacesepertiLazada, Tokopedia, Shopee, JD.ID danmasihbanyaklagi, masing-masing online shop tersebutmempunyaikelebihandankekurangannyamasingmasing. Kekurangannyasepertibanyaknyapenipuanpadasaattransaksi, penjualtidakmengirimkanbarang yang sesuaidengankonsumen, sertakemasan yang sudahrusak. Masalahtersebutsangatberpenagruhpadakepuasanpelanggan yang seharusnyamenjaditolakukurkualitaspelayanandari online shop tersebut.
Dari latarbelakangdiatasterdapatbeberaparumusanmasalahnyayaitu :
- Aspek yang di ulasoleh para penggunadariberbagaiaplikasi online Marketplace.
- Pengkategorianaplikasi online marketplace yang ada di play store.
- Bagaimanamembangunsistemsentimenanalisisuntukmengetahuiaplikasi online marketplace mana yang terbaik di playstore.
Padapenelitianinipenulisakanmelakukanpengambilan data denganmenggunakan google playstore.Tugasdasardalamanalisisiniadalahmengelompokkansentimenpelangganmenjadipositifdannegatifberdasarkankomentar yang ditulisoleh para penggunaaplikasi, kemudianmembandingkanantarakelima online shop tersebutuntukmengetahuiposisiatautingkatandarimasing-masing online marketplace tersebut di gooleplaystore. Penelitianinimenggunakanmetode Support VectoreMesin (SVM) untukmembantumasyarakatuntukmengetahui online marketplace mana yang baik, amandannyamansaatmelakukantransaksi.
1. . METODE PENELITIAN
Padapenelitianinipenulismenggunakanmetode support vector machine untukmenghasilkantingkatakurasidalammenganalisa label sentimenpadaulasan yang sudah di ambildari google play store yang dimanaulasantersebutdiberikanolehpenggunaaplikasiterkaitsebagaipenggambarantingkatkepuasandalampenggunaanaplikasipembalanjaan online tersebut, adapun proses pengolahan data agar menghasilkanakurasisentimenaplikasiadalahsebagaiberikut :
1.1 Pengambilan data
Data yang diambilyaituulasan yang sudahdiberikanolehpenggunaaplikasiterkait di google play store, denganmenggunakanmetode web scraping (data miner yang disediakanoleh google crome) yaknisuatuteknikpengambilan data yang digunakanuntukmemecah data dalamjumlahbesar yang diambildari web, data yang sudahdipilihakan di rubahmenjadideretantabel (spreadsheet) yang di kumpulkan di dalammicrosoftaxcel, Untuktahapselanjutnyayaitutahap processing atau Proses data.
1.2 Proses data
Berikutadalahtahapan Proses data diantaranya :
a.Tokenization :Dalamtahapini data akandipecahmenjadibeberapabagiankarakteratau kata-kata yang sesuaidengankebutuhan
b.Transform case :Megubahsemuahuruf yang asalnyakapitalatauhurufbesarmenjadisebaliknyaatauhurufkecil agar dalamtahapselanjutnyaterdapatkeseragamanhurufdanakanmeminimalkankesalahan proses tokonize.
c.Filter tokens (by length) :Yaitutahapmenghapus kata-kata denganpanjanghuruftertentu. Disinipenulismemberikanbatasanyaitu minimal 2 karakter dam maksimal 25 karakter. Jadi kata-kata yang memiliki 1 karakterdanlebihdari 25 karakterakanotomatisdihilangkan.
d.Filter stopwords :Merupakantahappenghapusanterhadap kata-kata yang tidakmemilikiarti yang biasanyaberupa kata sambung, kata keterangan, dansebagainya. Kata kata yang tidakbergunanantinyaakan di buangdantidakakan di digunakanpadatahapselanjutnya
e.Stemming :Menghilangkanimbuhanpadamasingmasing kata sehinggamenjadi kata dasar, dandalamtahapini juga bertujuanuntukmembersihkansuatu kata daripengejaan yang kurangtepat.
f. . Labeling :Disini data yang sudah di proses akanmasukketahappelebelanyaitutahapmemberikanidentitasdandibagimenjadiduakategoriyaituulasanpositifatauulasannegatif.
1.3 Pemodelan data
selanjutnya data akanmasukketahapanalisis data menggunakanalgoritma yang telah di tentukanyaitu support vector machine. Dalamtahapiniakan di lakukan proses pengklasifikasian label positifdannegatifpadaulasansetiapaplikasipembelanjaan online di google play store menggunakanalgoritma support vector machine untukmendapatkantingkatanakurasiteratas. Di tahapini juga penulismenggunakan tools berupaaplikasipendukungyakniaplikasirepidminer.
1.4 Evaluasi
Dalamtahapini juga penulisdapatmembandingkantingkatakurasidantingkat AUC (Area Under Curve) aplikasi mana yang tertinggidanterendah.
2. HASIL DAN PEMBAHASAN
Untukhasildanpembahasaniniakanmenjelaskan proses yang di jalaniselamapenelitian. menggunakan tools yaknirepidminerdalammengolah data menggunakanmetodealgoritma Support Vector Machine. Berikutbeberapaproses :
2.1 Pengambilan data
gdiambiladalahulasan para penggunadaribeberapaaplikasi online marketplace adapunbeberapaaplikasi yang akandipilihuntukpenelitianiniadalahTokopedia, Shopee, Lazada, JD.ID, danBlibli. Data yang di ambilmenggunakanteknik Web Scrapping (add-on Google Cromeyaitu Data Miner). Jumlah data yang diambilyaitu 1500 ulasandenganperbandinganulasanpositifdannegatif 50 : 50, data tersebutakan di jadikan data latihuntuk data ulasandarisetiapaplikasi yang berjumlah 300 ulasan.
2.2 Proses data
Setelah data set sudah di dapatkanselanjutnyamasukketahap Proses data, yang dimanadisini data akan di persiapkanterlebihdahulusebelummasukketahappemodelan. adapuntahapinimencakupkegiatanpembangunan data danmembersihkan data agar `siap di proses. Dalam Proses data melewatibeberapalangkahdiantaranyaTokennize, Transform Case, Filter Tokenize (By Length), Filter Stopword, Stemming.
2.3 Pemodelan data
Dalampemodelan data akandilakukanpengklasifikasian label positifdannegatifpadasetiapulasanaplikasi Online shop mengguanakanmetode Support Vector Machine yang akanmengkasilkantingkatanakurasidaribeberapa Online Shop.
2.4 Evaluasi
selanjutnyamasukketahapevaluasiatashasildaritahapsebelumnya. Disinipenulisakanmembandingkantingkatakurasidantingkat Area Under Curve (AUC) dariulasansetiapaplikasi, dalamperbandinganakurasimemberikanindikator True Positive (TP), True Negative (TN), False Pesitive (FP), False Negative (TN). Yang disimpukanbahwa True Positive (TP) berada di kelaspositif yang diklasifikasikansebagaikelaspositif, True Negative (TN) berada di kelasnegatif yang diklasifikasikansebagaikelasnegatif, False Pesitive (FP) berada di kelaspositif yang diklasifikasikankedalamkelasnegatif, False Negative (TN) berada di kelasnegatif yang di klasifikasikankedalamkelaspositif.
Dalamhalini proses pengolahan data menggunakan Support Vector Machine (SVM) menghasilkantingkat Accuracy dan Area Under Curve (AUC).darikelimaaplikasi online shop penulismemilihTokopediasebagaicontohhasildari Proses data yang di lakukanoleh tool repidminerditampilkanpadagambar 4 untuktingkatakurasidanpadagambar 5 untuktingkat Area Under Curve (AUC).
Accuracy : 90,67%+/.3,66%(micro average:90.67)
|
|
True positive |
True negative |
Class precision |
|
Pred.positive |
270 |
27 |
90.91% |
|
Pred.negative |
1 |
2 |
66.67% |
|
Class recall |
99.63% |
6.90% |
|
Gambar 2.tingkat accuracy padaaplikasiTokopedia
tingkatakurasi yang didapatkandari Proses analisis sentiment menggunakanmetode Support Vectore Machine (SVM) adalah 90,67% denganjumlah True Positive 270 record yang di klasifikasikansebagaipositif, False Positive 1 record diklasifikasikansebagainegatif, True Negative 2 record diklasifikasikansebagainegatif, dan False Negative 27 record di klasifikasikansebagaipositif. bahwadapatdisimpulkannilai Area Under Curve (AUC) pada marketplace Tokopediasebesar 0,797 denganperforma yang cukupbaik.
KESIMPULAN
Berdasarkanhasildarikeseluruhananalisis sentiment online shop di google play store denganmetode Support Vector Machine menggunakan Tool Repidminermakahasilnyadapatdirangkumdalamtabeldangrafikberikutini :
Tabel 1.Confussion matrix setiap market place
|
Marketplace |
TP |
FP |
TN |
FN |
|
Tokopedia |
270 |
1 |
2 |
27 |
|
Shopee |
4 |
89 |
206 |
1 |
|
Lazada |
5 |
92 |
202 |
1 |
|
Jd.Id |
222 |
0 |
4 |
74 |
|
Blibli |
0 |
77 |
222 |
1 |
Keterangan
= Positif = Negatif
Tabel 2. Perbandingan Performance Algoritma
|
Marketplace |
Accuracy |
AUC |
|
Tokopedia |
90,67% |
0,797 |
|
Shopee |
70,00% |
0,784 |
|
Lazada |
68,00% |
0748 |
|
Jd.Id |
75,44% |
0,857 |
|
Blibli |
74,00% |
0,770 |

Tidak ada komentar:
Posting Komentar