Please use this identifier to cite or link to this item:
https://ptsldigital.ukm.my/jspui/handle/123456789/513476
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Khairuddin Omar, Prof. | - |
dc.contributor.author | Suliana binti Sulaiman (P47840) | - |
dc.date.accessioned | 2023-10-16T04:37:05Z | - |
dc.date.available | 2023-10-16T04:37:05Z | - |
dc.date.issued | 2013-08-01 | - |
dc.identifier.other | ukmvital:74689 | - |
dc.identifier.uri | https://ptsldigital.ukm.my/jspui/handle/123456789/513476 | - |
dc.description | Pencantas perkataan merupakan proses membuang imbuhan pada perkataan dan menghasilkan perkataan tercantas ataupun kata dasar. Pencantas perkataan boleh digunakan dalam capaian dokumen, transliterasi, pengkelasan teks dan penterjemahan mesin. Pencantas perkataan yang dihasilkan dalam kajian yang lepas bagi Bahasa Melayu lebih tertumpu kepada tulisan Rumi. Set petua yang dihasilkan untuk mencantas imbuhan tidak sesuai untuk kata terbitan Jawi. Perbezaan ketara boleh dilihat pada petua pembuangan akhiran '-an'. Contohnya, untuk tulisan Rumi, akhiran '-an' dieja dengan menggunakan satu cara manakala untuk tulisan Jawi ianya boleh dieja sebagai ‘أن‘,’ ان‘,’ ءن ‘dan ‘ن‘. Oleh yang demikian, set petua Jawi diperlukan untuk membuang imbuhan pada kata terbitan Jawi. Selain itu pencantas perkataan Bahasa Melayu yang menggunakan kamus kata dasar perlu sentiasa dikemas kini untuk memastikan setiap perkataan yang dicantas sama dengan perkataan di dalam kamus untuk mengurangkan ralat. Objektif bagi tesis ini adalah untuk menghasilkan petua cantasan serta membangun dan menilai pencantas perkataan Jawi yang digunakan untuk mencantas kata terbitan dan menghasilkan kata dasar yang merangkumi kata jati melibatkan satu, dua dan tiga suku kata. Set data yang digunakan dalam kajian ini telah ditransliterasi ke dalam Jawi dan dibahagi kepada dua set, iaitu artikel-artikel daripada Utusan Melayu dan Berita Harian yang dipilih secara rawak di antara September 2009 - November 2010. Pangkalan data yang digunakan juga termasuklah Al-Quran terjemahan Sheikh Abdullah Basmeih yang telah digunakan dalam kajian yang lepas. Dalam penghasilan algoritma pencantas perkataan ini, terdapat dua komponen penting telah dihasilkan iaitu petua nyah-imbuhan untuk mencantas imbuhan dan petua pengesanan kesalahan ejaan Jawi (SEDR) yang digunakan untuk menyemak perkataan yang dicantas. Petua nyah-imbuhan melibatkan beberapa proses yang memerlukan pembuangan, penggantian dan penambahan aksara dalam setiap kata terbitan Jawi. Petua SEDR pula melibatkan susunan corak ejaan untuk membentuk suku kata Jawi. Sebanyak enam eksperimen telah dilakukan bermula dengan pengiraan ketepatan petua SEDR, pengiraan ketepatan petua Rule Application Order dan Rule Frequency Order menggunakan data Jawi, turutan pembuangan imbuhan, pengiraan ketepatan pencantas berasaskan penilaian Frakes dan Paice serta penilaian algoritma signifikasi berasaskan statistik. Hasil keseluruhan daripada kajian mendapati bagi nilai min purata ketepatan (MPK) dokumen Jawi yang dicantas adalah 8.43% manakala nilai MPK dokumen Jawi yang tidak dicantas adalah 5.14%. Pencantas perkataan Melayu untuk aksara Jawi ini dapat membantu meningkatkan ketepatan dalam capaian dokumen Jawi.,Ph.D | - |
dc.language.iso | may | - |
dc.publisher | UKM, Bangi | - |
dc.relation | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat | - |
dc.rights | UKM | - |
dc.subject | Perkataan Melayu | - |
dc.subject | Aksara Jawi | - |
dc.subject | Information retrieval | - |
dc.title | Pencantas perkataan Melayu untuk aksara Jawi berasaskan petua | - |
dc.type | Theses | - |
dc.format.pages | 197 | - |
dc.identifier.callno | ZA3075.S836 2013 3 | - |
dc.identifier.barcode | 000731 | - |
Appears in Collections: | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ukmvital_74689+Source01+Source010.PDF Restricted Access | 3.18 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.