Perlombongan Pendapat Bahasa Rojak Menggunakan Pendekatan Pembelajaran Mesin

Norlela Samsudin (P53570)

Please use this identifier to cite or link to this item: https://ptsldigital.ukm.my/jspui/handle/123456789/513384

Title:	Perlombongan Pendapat Bahasa Rojak Menggunakan Pendekatan Pembelajaran Mesin
Authors:	Norlela Samsudin (P53570)
Supervisor:	Abdul Razak Hamdan, Prof. Dr.
Keywords:	Bahasa Rojak Pendekatan Pembelajaran Mesin Machine learning
Issue Date:	14-Jul-2013
Description:	Penyampaian pendapat dalam talian telah menjadi perkara lumrah pada masa kini. Di Malaysia, pendapat ini ditulis dalam bahasa rojak yang menggunakan perkataan atau singkatan dari bahasa Melayu, bahasa Inggeris dan bahasa daerah. Oleh yang demikian, perlombongan pendapat dengan menggunakan kaedah pemprosesan bahasa (NLP) sukar dilaksanakan. Manakala proses perlombongan teks menggunakan kaedah pembelajaran mesin pula, menganggap semua perkataan dalam sesuatu mesej sebagai fitur. Tanpa proses pemilihan fitur yang berkesan, proses perlombongan pendapat memerlukan sumber yang banyak dan masa yang lama. Pada masa ini, pemilihan fitur dalam kategori penapisan seperti kekerapan dalam mesej, CHI Square dan kebolehcapaian maklumat hanya menyusun fitur berdasarkan nilai pemberat. Terpulanglah kepada pengguna untuk memilih fitur yang bersesuaian. Justeru itu, objektif kajian ini adalah untuk mencadangkan satu kerangka perlombongan pendapat berorientasikan pembelajaran mesin yang berkesan untuk melombong pendapat mesej dalam talian di Malaysia. Kerangka perlombongan pendapat ini akan mengambil kira dua isu utama iaitu i) memperkenalkan kaedah yang bersesuaian bagi proses penormalan teks hingar yang dikenali sebagai MyTNA dan ii) memperkenalkan kaedah pemilihan fitur berinspirasi dari teori rangkaian dalam Sistem Imun Buatan yang dikenali sebagai FS-INS. Metodologi kajian ini dibahagikan kepada empat fasa iaitu i) analisis kerangka perlombongan pendapat bahasa rojak ii) pengumpulan dan penyediaan data, iii) pembangunan MyTNA serta FS-INS, dan iv) pengujian keberkesanan kaedah yang dicadangkan. Fasa (i) dilaksanakan menerusi kajian literasi. Dalam Fasa (ii), beberapa senarai rujukan bagi proses penormalan teks hingar diperkenalkan. Selain itu, teks eksperimen yang terdiri dari 1000 pendapat positif dan 1000 pendapat negatif mengenai tayangan wayang di Malaysia juga diekstrak dalam fasa ini. Algoritma yang berkesan dirangka dan dibangunkan dalam Fasa (iii). Akhir sekali, eksperimen yang membandingkan kaedah pemilihan fitur cadangan dengan beberapa kaedah pemilihan fitur sedia ada dilaksanakan dalam Fasa (iv). Eksperimen terhadap kerangka perlombongan pendapat ini menunjukkan pengurangan sehingga 90% bilangan fitur dan berjaya meningkatkan ketepatan perlombongan pendapat sehingga 14.9% apabila pengelasan k Jiran Terdekat digunakan sebagai model pengelasan. Keputusan perlombongan pendapat dengan menggunakan pengelasan Naïve Bayes dan Support Vector Machine juga meningkat antara 6% hingga 9%. Kajian ini juga menghasilkan sebuah korpus yang terdiri dari 20,100 mesej-mesej dalam talian yang diekstrak dari forum dalam talian, aplikasi Twitter dan aplikasi Facebook.,PhD
Pages:	178
Call Number:	Q325.5 .N647 2013 3
Publisher:	UKM, Bangi
URI:	https://ptsldigital.ukm.my/jspui/handle/123456789/513384
Appears in Collections:	Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat

Files in This Item:

File	Description	Size	Format
ukmvital_71383+Source01+Source010.PDF Restricted Access		2.32 MB	Adobe PDF	View/Open

Show full item record Recommend this item