Please use this identifier to cite or link to this item:
https://ptsldigital.ukm.my/jspui/handle/123456789/476226
Title: | Ramalan pengelasan perkataan Bahasa Melayu kelantangan bunyi menggunakan kaedah mesin vektor sokongan (MVS) |
Authors: | Nur'Athifah binti Arifin (P63373) |
Supervisor: | Shereena Mohd Arif, Dr. |
Keywords: | Mesin vektor sokongan (MVS) |
Issue Date: | 6-Feb-2015 |
Description: | Ramalan prosodi bagi meramal tanda simbolik teks seperti sempadan frasa prosodi, aksen dan kelantangan bunyi adalah penting bagi membangunkan aplikasi teks-ke-pertuturan secara automatik berkualiti tinggi yang digunakan dalam pengecaman pertuturan dan sintesis pertuturan. Dalam bidang prosodi Bahasa Melayu, kajian lampau yang dilakukan adalah tertumpu kepada penggunaan parameter akustik seperti frekuensi, amplitud dan hentian puncak untuk meramal perkataan yang berkelantangan bunyi. Oleh itu, penyelidikan ini telah dijalankan untuk meluaskan lagi kajian ramalan prosodi perkataan Bahasa Melayu kelantangan bunyi terhadap penggunaan fitur struktur bentuk dan teknik pembelajaran mesin. Objektif utama kajian ini adalah untuk meramal dan mengelas perkataan bahasa Melayu kelantangan bunyi dengan menggunakan teknik Mesin Vektor Sokongan (MVS), seterusnya melakukan perbandingan dengan teknik Bayes Naif (BN) dan Pepohon Keputusan (PK). Dalam kajian ini, teknik MVS dipilih kerana ia berupaya dan berdaya saing dalam menghasilkan keputusan ramalan yang tepat dalam pengujian. Sebanyak 422 ayat dalam korpus pertuturan sintaks-prosodi bahasa Melayu dijadikan sebagai set data latihan dan data ujian. Beberapa proses penting yang terlibat ialah pra-pemprosesan, pemilihan fitur dan transformasi data. Pengiraan peratus ketepatan, nilai ketepatan, nilai dapatan semula dan nilai pengukuran F1 dengan menggunakan teknik MVS dilakukan untuk mengecam fitur yang paling mempengaruhi kelantangan bunyi pada perkataan Bahasa Melayu. Keputusan analisis mendapati kedudukan suku kata dalam perkataan merupakan fitur yang paling mempengaruhi kelantangan bunyi pada perkataan. Teknik ramalan yang terbaik juga ditentukan dalam kajian ini menerusi penilaian prestasi ketepatan ramalan dengan menggunakan kaedah pengukuran statistik dan teknik validasi silang k-lipatan. Hasil keputusan yang diperoleh menunjukkan bahawa teknik MVS lebih baik dalam mengklasifikasikan dan meramal perkataan Bahasa Melayu kelantangan bunyi dengan betul berbanding teknik BN serta PK. Hasil analisis mendapati bahawa MVS mampu memberikan prestasi yang lebih baik jika data yang digunakan adalah dari pelbagai kategori dan mempunyai jumlah yang besar. Kesimpulannya, fitur kedudukan suku kata dalam perkataan dan teknik pembelajaran mesin MVS boleh dijadikan sebagai titik asas dan rujukan dalam penyelidikan prosodi Bahasa Melayu lain seperti intonasi, hentian frasa dan irama untuk kajian akan datang.,Master/Sarjana |
Pages: | 99 |
Publisher: | UKM, Bangi |
URI: | https://ptsldigital.ukm.my/jspui/handle/123456789/476226 |
Appears in Collections: | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ukmvital_76522+SOURCE1+SOURCE1.0.PDF Restricted Access | 2.45 MB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.