Pro Evolution: SENTIMEN ANALYSIS ONLINE SHOP ON THE PLAY STORE USING METHOD SUPPORT VECTOR MACHINE (svm)

SENTIMEN ANALYSIS ONLINE SHOP ON THE PLAY STORE USING METHOD SUPPORT VECTOR MACHINE (svm)

 

Di era 4.0 iniperkembanganteknologitelahmengubahcaramanusiauntukmelakukanaktifitasnya, melaluipenggunaan gadget dan internet. aktifitasmanusiasepertikomunikasimenggunakan media sosial, belajarsecara online, danberbelanjasecara online pun dapat di aksesmelalui internet tanpaharuspergiketokosecaralangsung, proses transaksimenjadilebihmudahdenganadanya E-commerce.

Di Indonesia sendiribegitubanyak online marketplacesepertiLazada, Tokopedia, Shopee, JD.ID danmasihbanyaklagi, masing-masing online shop tersebutmempunyaikelebihandankekurangannyamasingmasing. Kekurangannyasepertibanyaknyapenipuanpadasaattransaksi, penjualtidakmengirimkanbarang yang sesuaidengankonsumen, sertakemasan yang sudahrusak. Masalahtersebutsangatberpenagruhpadakepuasanpelanggan yang seharusnyamenjaditolakukurkualitaspelayanandari online shop tersebut.

Dari latarbelakangdiatasterdapatbeberaparumusanmasalahnyayaitu :

 - Aspek yang di ulasoleh para penggunadariberbagaiaplikasi online Marketplace.

 - Pengkategorianaplikasi online marketplace yang ada di play store.

 - Bagaimanamembangunsistemsentimenanalisisuntukmengetahuiaplikasi online marketplace mana yang terbaik di playstore.

Padapenelitianinipenulisakanmelakukanpengambilan data denganmenggunakan google playstore.Tugasdasardalamanalisisiniadalahmengelompokkansentimenpelangganmenjadipositifdannegatifberdasarkankomentar yang ditulisoleh para penggunaaplikasi, kemudianmembandingkanantarakelima online shop tersebutuntukmengetahuiposisiatautingkatandarimasing-masing online marketplace tersebut di gooleplaystore. Penelitianinimenggunakanmetode Support VectoreMesin (SVM) untukmembantumasyarakatuntukmengetahui online marketplace mana yang baik, amandannyamansaatmelakukantransaksi.

1.       . METODE PENELITIAN

Padapenelitianinipenulismenggunakanmetode support vector machine untukmenghasilkantingkatakurasidalammenganalisa label sentimenpadaulasan yang sudah di ambildari google play store yang dimanaulasantersebutdiberikanolehpenggunaaplikasiterkaitsebagaipenggambarantingkatkepuasandalampenggunaanaplikasipembalanjaan online tersebut, adapun proses pengolahan data agar menghasilkanakurasisentimenaplikasiadalahsebagaiberikut :

1.1 Pengambilan data

Data yang diambilyaituulasan yang sudahdiberikanolehpenggunaaplikasiterkait di google play store, denganmenggunakanmetode web scraping (data miner yang disediakanoleh google crome) yaknisuatuteknikpengambilan data yang digunakanuntukmemecah data dalamjumlahbesar yang diambildari web, data yang sudahdipilihakan di rubahmenjadideretantabel (spreadsheet) yang di kumpulkan di dalammicrosoftaxcel, Untuktahapselanjutnyayaitutahap processing atau Proses data.

 

 

 

1.2 Proses data

Berikutadalahtahapan Proses data diantaranya :

a.Tokenization :Dalamtahapini data akandipecahmenjadibeberapabagiankarakteratau kata-kata yang sesuaidengankebutuhan

b.Transform case :Megubahsemuahuruf yang asalnyakapitalatauhurufbesarmenjadisebaliknyaatauhurufkecil agar dalamtahapselanjutnyaterdapatkeseragamanhurufdanakanmeminimalkankesalahan proses tokonize.

c.Filter tokens (by length) :Yaitutahapmenghapus kata-kata denganpanjanghuruftertentu. Disinipenulismemberikanbatasanyaitu minimal 2 karakter dam maksimal 25 karakter. Jadi kata-kata yang memiliki 1 karakterdanlebihdari 25 karakterakanotomatisdihilangkan.

d.Filter stopwords :Merupakantahappenghapusanterhadap kata-kata yang tidakmemilikiarti yang biasanyaberupa kata sambung, kata keterangan, dansebagainya. Kata kata yang tidakbergunanantinyaakan di buangdantidakakan di digunakanpadatahapselanjutnya

e.Stemming :Menghilangkanimbuhanpadamasingmasing kata sehinggamenjadi kata dasar, dandalamtahapini juga bertujuanuntukmembersihkansuatu kata daripengejaan yang kurangtepat.

f. . Labeling :Disini data yang sudah di proses akanmasukketahappelebelanyaitutahapmemberikanidentitasdandibagimenjadiduakategoriyaituulasanpositifatauulasannegatif.

                                                                                                                                                                                  

1.3 Pemodelan data

selanjutnya data akanmasukketahapanalisis data menggunakanalgoritma yang telah di tentukanyaitu support vector machine. Dalamtahapiniakan di lakukan proses pengklasifikasian label positifdannegatifpadaulasansetiapaplikasipembelanjaan online di google play store menggunakanalgoritma support vector machine untukmendapatkantingkatanakurasiteratas. Di tahapini juga penulismenggunakan tools berupaaplikasipendukungyakniaplikasirepidminer.

 

1.4 Evaluasi

Dalamtahapini juga penulisdapatmembandingkantingkatakurasidantingkat AUC (Area Under Curve) aplikasi mana yang tertinggidanterendah.

 

 

 

 

 

 

2. HASIL DAN PEMBAHASAN

Untukhasildanpembahasaniniakanmenjelaskan proses yang di jalaniselamapenelitian. menggunakan tools yaknirepidminerdalammengolah data menggunakanmetodealgoritma Support Vector Machine. Berikutbeberapaproses :

2.1 Pengambilan data

gdiambiladalahulasan para penggunadaribeberapaaplikasi online marketplace adapunbeberapaaplikasi yang akandipilihuntukpenelitianiniadalahTokopedia, Shopee, Lazada, JD.ID, danBlibli. Data yang di ambilmenggunakanteknik Web Scrapping (add-on Google Cromeyaitu Data Miner). Jumlah data yang diambilyaitu 1500 ulasandenganperbandinganulasanpositifdannegatif 50 : 50, data tersebutakan di jadikan data latihuntuk data ulasandarisetiapaplikasi yang berjumlah 300 ulasan.

2.2 Proses data

Setelah data set sudah di dapatkanselanjutnyamasukketahap Proses data, yang dimanadisini data akan di persiapkanterlebihdahulusebelummasukketahappemodelan. adapuntahapinimencakupkegiatanpembangunan data danmembersihkan data agar `siap di proses. Dalam Proses data melewatibeberapalangkahdiantaranyaTokennize, Transform Case, Filter Tokenize (By Length), Filter Stopword, Stemming.

2.3  Pemodelan data

Dalampemodelan data akandilakukanpengklasifikasian label positifdannegatifpadasetiapulasanaplikasi Online shop mengguanakanmetode Support Vector Machine yang akanmengkasilkantingkatanakurasidaribeberapa Online Shop.

2.4 Evaluasi

selanjutnyamasukketahapevaluasiatashasildaritahapsebelumnya. Disinipenulisakanmembandingkantingkatakurasidantingkat Area Under Curve (AUC) dariulasansetiapaplikasi, dalamperbandinganakurasimemberikanindikator True Positive (TP), True Negative (TN), False Pesitive (FP), False Negative (TN). Yang disimpukanbahwa True Positive (TP) berada di kelaspositif yang diklasifikasikansebagaikelaspositif, True Negative (TN) berada di kelasnegatif yang diklasifikasikansebagaikelasnegatif, False Pesitive (FP) berada di kelaspositif yang diklasifikasikankedalamkelasnegatif, False Negative (TN) berada di kelasnegatif yang di klasifikasikankedalamkelaspositif.

Dalamhalini proses pengolahan data menggunakan Support Vector Machine (SVM) menghasilkantingkat Accuracy dan Area Under Curve (AUC).darikelimaaplikasi online shop penulismemilihTokopediasebagaicontohhasildari Proses data yang di lakukanoleh tool repidminerditampilkanpadagambar 4 untuktingkatakurasidanpadagambar 5 untuktingkat Area Under Curve (AUC).

 

 

 

 

 

Accuracy : 90,67%+/.3,66%(micro average:90.67)

 

True positive

True negative

Class precision

Pred.positive

270

27

90.91%

Pred.negative

1

2

66.67%

Class recall

99.63%

6.90%

 

Gambar 2.tingkat accuracy padaaplikasiTokopedia

tingkatakurasi yang didapatkandari Proses analisis sentiment menggunakanmetode Support Vectore Machine (SVM) adalah 90,67% denganjumlah True Positive 270 record yang di klasifikasikansebagaipositif, False Positive 1 record diklasifikasikansebagainegatif, True Negative 2 record diklasifikasikansebagainegatif, dan False Negative 27 record di klasifikasikansebagaipositif. bahwadapatdisimpulkannilai Area Under Curve (AUC) pada marketplace Tokopediasebesar 0,797 denganperforma yang cukupbaik.

 

KESIMPULAN

Berdasarkanhasildarikeseluruhananalisis sentiment online shop di google play store denganmetode Support Vector Machine menggunakan Tool Repidminermakahasilnyadapatdirangkumdalamtabeldangrafikberikutini :

                Tabel 1.Confussion matrix setiap market place

Marketplace

TP

FP

TN

FN

Tokopedia

270

1

2

27

Shopee

4

89

206

1

Lazada

5

92

202

1

Jd.Id

222

0

4

74

Blibli

0

77

222

1

Keterangan

= Positif                                                = Negatif

Tabel 2. Perbandingan Performance Algoritma

Marketplace

Accuracy

AUC

Tokopedia

90,67%

0,797

Shopee

70,00%

0,784

Lazada

68,00%

0748

Jd.Id

75,44%

0,857

Blibli

74,00%

0,770

 

Tidak ada komentar:

Posting Komentar

Copyright © Pro Evolution Urang-kurai