Please use this identifier to cite or link to this item:
https://ptsldigital.ukm.my/jspui/handle/123456789/772415
Title: | Pemilihan fitur menggunakan algoritma pendebungan bunga bagi analisis sentimen data twitter |
Authors: | Muhammad Iqbal Abu Latiffi, P95662 |
Supervisor: | Mohd Ridzwan Yaakub, Prof. Madya Dr. |
Keywords: | Universiti Kebangsaan Malaysia -- Dissertations Dissertations, Academic -- Malaysia Electric filters, Digital Signal processing -- Digital techniques |
Issue Date: | 26-Jan-2022 |
Abstract: | Pemilihan fitur merupakan topik utama yang seringkali diperincikan oleh penyelidik dalam analisis sentimen. Ini adalah sejajar dengan kemajuan dalam dunia teknologi maklumat dan juga peningkatan penggunaan media sosial yang amat drastik. Masalah utama dalam proses pemilihan fitur bagi analisis sentimen ialah ia mempunyai ruang fitur yang berdimensi besar tambahan pula dengan data yang tidak berstruktur. Hal ini kerana, set data ulasan yang diperoleh daripada media sosial terutamanya di Twitter secara keseluruhannya mempunyai maklumat yang tidak relevan dan hingar untuk kegunaan pengelasan sentimen oleh kerana set data ulasan tersebut di tulis dalam bahasa pasar atau tidak formal seterusnya akan membawa kepada hasil prestasi pengelasan yang tidak memuaskan. Jadi keadaan ini telah memberi ruang kepada kajian untuk meningkatkan hasil prestasi pengelasan sentimen. Penemuan mendapati bahawa perlunya set data ulasan melalui proses pembersihan awal menggunakan kaedah prapemprosesan teks yang menggabungkan teknik pemprosesan bahasa tabii dengan teknik pemprosesan linguistik yang mana menghasilkan prestasi pengelasan yang tinggi. Selain itu, set data ulasan akan melalui proses pemilihan fitur yang berperanan penting dalam membantu mengurangkan saiz dimensi fitur dan juga berupaya memilih fitur-fitur yang bermakna sekaligus memberi hasil pengelasan yang tinggi. Antara teknik pemilihan fitur termasuklah teknik pembalut, teknik penapis dan juga teknik metaheuristik. Kelebihan pendekatan metaheuristik adalah berlakunya proses pencarian fitur secara menyeluruh dalam ruang untuk menghasilkan penyelesaian yang lebih baik dengan mengaplikasikan pengetahuan yang diperoleh daripada penyelesaian semula jadi terutamanya bagi data Twitter yang secara umumnya terkandung data teks yang tidak formal dan hingar. Oleh itu, kajian mencadangkan penggunaan Algoritma Pendebungaan Bunga (APB) sebagai algoritma pemilihan fitur yang berupaya memperoleh subset fitur optimum dan berkualiti. Keberkesanan kaedah yang telah dicadangkan diuji dengan menggunakan set data ulasan daripada Twitter dan bagi pengelasan sentiment pula menggunakan empat pengelas pembelajaran mesin iaitu Naïve Bayes, Mesin Vektor Sokongan, Pepohon Keputusan dan k-Jiran Terdekat. Hasil daripada eksperimen ini mendapati bahawa penggunaan teknik prapemprosesan teks serta teknik pemilihan fitur APB telah berjaya menghasilkan ketepatan prestasi pengelasan yang tertinggi iaitu 98.99% bagi pengelas Mesin Vektor Sokongan di mana terdapat kenaikan sebanyak 2.68% berbanding dengan teknik penanda aras iaitu algoritma Cuckoo Search. Kajian ini membuktikan penggabungan pada teknik prapemprosesan teks dan APB ini adalah lebih baik dan bermakna dalam penghasilan subset fitur yang optimum serta berkualiti bagi tujuan pengelasan sentimen. |
Description: | Full-text |
Pages: | 134 |
Publisher: | UKM, Bangi |
Appears in Collections: | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Pemilihan fitur menggunakan algoritma pendebungan bunga bagi analisis sentimen data twitter.pdf Restricted Access | Full-text | 2.25 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.