Please use this identifier to cite or link to this item: https://ptsldigital.ukm.my/jspui/handle/123456789/513260
Title: Penghibridan pendekatan pengoptimuman koloni semut dan k-jiran terdekat bagi pemilihan fitur dalam analisis sentimen
Authors: Siti Rohaidah Ahmad (P67401)
Supervisor: Azuraliza Abu Bakar, Prof. Dr.
Keywords: Fitur
Metaheuristik
Analisis sentimen
Ant algorithms
Issue Date: 3-Dec-2016
Description: Pemilihan fitur yang kurang efektif menimbulkan masalah kepada proses padanan fitur dan perkataan sentimen dalam ayat ulasan pengguna. Masalah utama dalam pemilihan fitur ialah mempunyai ruang yang berdimensi besar dan tidak berstruktur. Ini mewujudkan set vektor fitur yang bersaiz besar dan mengandungi fitur tidak relevan dan hingar. Masalah ini menyebabkan prestasi pengelasan sentimen berkurangan. Pemilihan fitur adalah merupakan masalah polinomial tidak berketentuan yang memerlukan penyelesaian optimum. Kelebihan metaheuristik melakukan proses pencarian fitur secara menyeluruh dalam ruang penyelesaian dapat mengatasi masalah ini. Antara teknik pemilihan fitur dalam pengelasan sentimen ialah teknik pemprosesan bahasa tabii, permodalan topik, penapis, pembalut ataupun metaheuristik. Kekurangan metaheuristik memerlukan pengiraan yang rumit apabila melibatkan data yang bersaiz besar. Teknik pembalut mempunyai kelebihan berinteraksi dengan algoritma pengelas serta saling berhubung dengan fitur-fitur lain. Oleh itu, kajian mencadangkan pendekatan metaheuristik iaitu pengoptimuman koloni semut (PKO) yang bertindak sebagai teknik pembalut dan k Jiran Terdekat (kJT) sebagai teknik pengelas berfungsi menilai dan menjana subset fitur optimum. Strategi ini membolehkan PKO mengawal proses pemilihan fitur dan mengaplikasikan fungsi kJT bagi menilai dan memilih kualiti fitur berdasarkan nilai heuristik yang dapat mengurangkan ruang carian. Kombinasi ini berupaya memperoleh subset fitur optimum dan berkualiti. Subset fitur yang diperoleh diguna bagi mengenal pasti perkataan sentimen yang terdapat dalam ayat menggunakan gabungan hubungan kebergantungan dan pelabelan nahu bahasa. Hubungan yang sepadan antara fitur dan perkataan sentimen mampu meningkatkan prestasi pengelasan sentimen. Model kedudukan fitur dicadangkan bagi menghasilkan senarai kedudukan fitur produk yang popular berdasarkan penilaian sentimen daripada pengguna sebenar. Terdapat tiga kriteria pengujian iaitu ketepatan, dapatan semula dan F-score digunakan bagi menguji keberkesanan algoritma yang dibangunkan. Keberkesanan kaedah cadangan diuji pada set data ulasan pengguna mengenai produk elektronik yang berbeza kategori dan mempunyai saiz dimensi yang tinggi. Keputusan eksperimen menunjukkan pendekatan hibrid PKO dan kJT lebih baik dan signifikan dalam penghasilan subset fitur optimum yang berkualiti bagi proses pengelasan seterusnya. Gabungan algoritma PKO-kJT dengan algoritma hubungan fitur dan perkataan sentimen mampu membantu mengenal pasti hubungan sepadan fitur dan perkataan sentimen dan membantu meningkatkan prestasi pengelasan sentimen. Manakala hasil daripada model kedudukan fitur dapat membantu dengan memberikan gambaran sebenar senarai fitur produk yang menjadi kesukaan atau sebaliknya daripada pengguna sebelum ini.,Tesis ini tidak ada Perakuan Tesis Sarjana/Doktor Falsafah"
Pages: 214
Call Number: QA402.5.S594 2016 3 tesis
Publisher: UKM, Bangi
Appears in Collections:Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat

Files in This Item:
File Description SizeFormat 
ukmvital_96522+SOURCE1+SOURCE1.0.PDF
  Restricted Access
473.5 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.