Please use this identifier to cite or link to this item: https://ptsldigital.ukm.my/jspui/handle/123456789/476587
Title: Penjanaan leksikon sentimen dalam Bahasa Melayu berasaskan WordNet
Authors: Nur Sharmini Alexander (P83886)
Supervisor: Nazlia Omar, Prof. Madya Dr.
Keywords: Natural language processing (Computer science)
Semantics -- Data processing
Computational linguistics
Universiti Kebangsaan Malaysia -- Dissertations
Dissertations, Academic -- Malaysia
Issue Date: 7-Aug-2017
Description: Leksikon sentimen merupakan perbendaharaan kata yang mengandungi perkataan sama ada berunsur positif atau negatif. Dalam pelombongan pendapat, leksikon sentimen merupakan sumber utama yang digunakan dalam pengelasan polariti unit teks bagi menentukan sentimen sesebuah dokumen pendapat. Kajian model analisis sentimen dalam Bahasa Melayu (BM) semakin giat dijalankan. Dengan itu keperluan bagi sumber leksikon sentimen BM adalah tinggi. Namun pembangunan leksikon sentimen dalam BM merupakan proses yang sukar dan rumit. Ini adalah kerana sumber bahasa bagi keperluan pembangunan leksikon adalah terhad. Justeru pelbagai pendekatan dan kaedah yang digunakan untuk menjana leksikon sentimen. Selain daripada itu, kajian sedia ada tidak menjurus kepada pembangunan sentimen leksikon itu sendiri terutamanya dalam BM. Matlamat kajian ini ialah membangunkan algoritma bagi menjana leksikon sentimen dalam BM berasaskan WordNet. Seterusnya dengan menggunakan algoritma ini, leksikon sentimen dapat dihasilkan dan digunakan untuk menganalisa sentimen dalam BM. Secara umum, proses penjanaan sentimen leksikon dimulakan dengan pemilihan set perkataan awal positif dan negatif. Set perkataan awal yang dipilih seterusnya dikenal pasti dalam WordNet Bahasa yang mana dipadankan dengan WordNet Bahasa Inggeris melalui nilai ofset yang sama. Setelah itu penjanaan dilakukan dengan melalui perhubungan semantik sinonim dan antonim yang terdapat dalam WordNet Bahasa Inggeris. Akhir sekali, nilai ofset yang terdapat dalam hasil penjanaan sinonim dan antonim akan dipadankan semula dengan WordNet Bahasa bagi mendapatkan perkataan dalam BM. Penjanaan leksikon sentimen menghasilkan sebanyak 14337 lema iaitu sebanyak 6915 lema adalah positif dan 7422 lema adalah negatif. Terdapat tiga jenis eksperimen bagi menilai ketepatan leksikon sentimen iaitu penilaian piawai emas oleh penutur BM, penilaian polariti perkataan dengan persilangan kata leksikon General Inquirer (GI) dan penilaian pengelasan polariti perkataan. Peratusan persetujuan yang diberikan oleh penutur BM yang tertinggi ialah sebanyak 86.58%. Manakala ukuran ketepatan polariti perkataan dengan GI yang tertinggi adalah 0.906 dan peratusan ukuran-F1 bagi pengujian pengelasan polariti perkataan ke atas tiga data ulasan pelbagai domain yang tertinggi adalah 91.31%. Keputusan pengujian telah menunjukkan keberkesanan algoritma yang dicadangkan dalam penjanaan leksikon sentimen dalam Bahasa Melayu berasaskan WordNet. Namun begitu, hasil penjanaan perlu disemak bagi menghasilkan leksikon sentimen yang lebih mantap. Walau bagaimanapun, hasil kajian dapat membantu para penyelidik menggunakan leksikon sentimen dalam menjalankan analisis sentimen khususnya dalam BM.,Sarjana Teknologi Maklumat,Tesis ini tidak ada Perakuan Tesis Sarjana / Doktor Falsafah""
Pages: 119
Call Number: QA76.9.N38N8477 2017 3 tesis
Publisher: UKM, Bangi
Appears in Collections:Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat

Files in This Item:
File Description SizeFormat 
ukmvital_121710+SOURCE1+SOURCE1.0.PDF
  Restricted Access
15.7 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.