Please use this identifier to cite or link to this item:
https://ptsldigital.ukm.my/jspui/handle/123456789/476348
Title: | Keberkesanan teknik bawah-atas dengan sokongan pendekatan kebarangkalian untuk penghurai Bahasa Melayu |
Authors: | Muhammad Azhar Fairuzz Hiloh (P61064) |
Supervisor: | Mohd Juzaiddin Ab Aziz, Prof. Madya Dr. |
Keywords: | Penghurai Bahasa Melayu Teknik bawah-atas Dissertations, Academic -- Malaysia |
Issue Date: | 15-May-2015 |
Description: | Penghuraian (parsing) merupakan proses menganalisis rentetan input dalam sesuatu ayat untuk menentukan struktur sintaksisnya berdasarkan kepada petua tatabahasa. Tugas ini dilaksanakan oleh penghurai (parser) yang akan menghasilkan output dalam bentuk pohon hurai (parse tree). Sebagai output yang menerangkan binaan struktur sintaksis yang membentuk sesuatu ayat, pohon hurai tidak akan berjaya dibina sekiranya input sesuatu ayat mengandungi kesilapan tatabahasa. Penghuraian amat sesuai digunakan dalam pemprosesan bahasa tabii bagi bahasa yang mempunyai tatabahasa bebas-konteks (Context-free Grammar) kerana tatabahasa ini mengandungi set petua yang menerangkan bagaimana leksikon dan simbol dalam bahasa dikumpul dan disusun bersama-sama. Kaedah sistem matematik untuk memodelkan struktur konstituen dalam sesuatu bahasa menjadikan struktur tatabahasa bebas-konteks amat mudah difahami dan diwakilkan dengan pohon hurai. Walaubagaimanapun, penghurai akan menghadapi kekangan apabila hasil daripada proses penghuraian menghasilkan dua atau lebih pohon hurai. Hal yang sedemikian berlaku apabila terdapat kesamaran (ambiguity) dalam struktur ayat. Kesamaran berlaku apabila sesuatu perkataan digolongkan lebih daripada satu kategori sintaksis dan penggunaan perkataan tersebut akan mempengaruhi semantik dalam sesuatu ayat. Oleh yang demikian, penghurai perlu mempunyai satu pendekatan yang dapat menyelesaikan kesamaran dan memilih pohon hurai yang paling tepat untuk mewakili sesuatu ayat. Seperti bahasa-bahasa lain di dunia, bahasa Melayu juga tidak terkecuali daripada masalah kesamaran. Namun begitu, disebabkan nahu bahasa Melayu adalah tatabahasa bebas-konteks, kesamaran dalam bahasa ini dapat diatasi dengan mengadaptasi beberapa pendekatan yang pernah digunakan dalam bahasa Inggeris seperti pendekatan penghurai berstatistik. Penghurai ini menggunakan kebarangkalian tatabahasa bebas-konteks dalam mencadangkan pohon hurai yang lebih tepat. Pembinaan pohon hurai pula melibatkan strategi carian melalui teknik atas-bawah atau bawah-atas. Secara umumnya, terdapat beberapa kelemahan yang dikenalpasti dalam teknik atas-bawah berbanding bawah-atas seperti rekursif-kiri (left-recursion), kesamaran (ambiguity) dan penghuraian semula ke atas sub-pohon yang tidak cekap. Kajian ini tertumpu kepada menilai keberkesanan penghurai berstatistik dengan menggunakan teknik bawah-atas untuk bahasa Melayu. Data latihan berbentuk ayat-ayat bahasa Melayu diperoleh dari pelbagai sumber. Berdasarkan kepada data latihan ini juga, satu korpus leksikal berstatistik bahasa Melayu turut dibangunkan yang mengandungi perbendaharaan kata, petua-petua tatabahasa dan nilai kebarangkaliannya. Hasil pengujian mendapati penghurai berstatistik bahasa Melayu melalui teknik bawah-atas dalam kajian ini mempunyai keberkesanan yang tinggi dalam mengatasi masalah kesamaran dengan skor purata wajaran sebanyak 97.1%. Memandangkan bahasa Melayu merupakan bahasa kebangsaan yang semakin berkembang pesat dan penggunaannya semakin meluas ke negara-negara lain, adalah diharapkan hasil daripada kajian ini akan memudah cara kepada usaha pengkomputeran bahasa Melayu dalam penyelidikan-penyelidikan pada masa hadapan.,Tesis ini tidak ada Perakuan Tesis Sarjana/Doktor Falsafah" |
Pages: | 144 |
Publisher: | UKM, Bangi |
URI: | https://ptsldigital.ukm.my/jspui/handle/123456789/476348 |
Appears in Collections: | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ukmvital_82210+SOURCE1+SOURCE1.0.PDF Restricted Access | 235.47 kB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.