Please use this identifier to cite or link to this item:
https://ptsldigital.ukm.my/jspui/handle/123456789/513528
Title: | Model pengisian ontologi domain herba ubatan daripada pelbagai sumber teks berasaskan teknik petua dan corak leksikal |
Authors: | Zaharudin Ibrahim (P39304) |
Supervisor: | Shahrul Azman Mohd Noah, Prof. Dr. |
Keywords: | Ontologies (Information retrieval) Information organization -- Technological innovations Dissertations, Academic -- Malaysia Universiti Kebangsaan Malaysia -- Dissertations |
Issue Date: | 30-Aug-2015 |
Description: | Perwakilan pengetahuan yang mewakili kata yang relevan dalam domain herba ubatan sangat diperlukan dalam pembangunan ontologi TBox domain herba ubatan Malaysia dan pengisian ontologi. Herba ubatan adalah domain kompleks yang memerlukan pakar domain dan sumber yang sahih dalam pembangunan ontologi. Antara sumber yang boleh digunakan dalam pembangunan model perwakilan pengetahuan atau ontologi ialah dokumen teks. Proses menstrukturkan teks untuk pembangunan dan pengisian ontologi merupakan satu usaha yang mencabar kerana kebanyakan kata terdapat di dalam dokumen teks yang tidak berstruktur, tidak kaya semantik dan mempunyai kata yang samar. Matlamat utama kajian ini ialah mencadangkan kaedah berdasarkan petua dan corak leksikal dalam pengisian ontologi domain herba ubatan untuk dokumen teks. Kajian juga menilai keberkesanan petua untuk dokumen daripada pelbagai sumber. Konsep atau entiti utama dalam domain herba ubatan serta hubungan semantik antara konsep dijadikan asas pembentukan ontologi spesifik domain. Kajian ini menumpukan kepada sumber dokumen tidak berstruktur yang diperoleh daripada korpus buku berwasit, Wikipedia dan artikel umum yang mewakili sumber maklumat yang pelbagai. Setiap korpus mengandungi sebanyak 230 dokumen teks. Metod kajian ini terbahagi kepada kajian literatur, permodelan ontologi, pengisian ontologi dan penilaian. Permodelan ontologi dilakukan bersandarkan kepada konteks sesuatu ayat yang mengandungi pengetahuan yang hendak diperoleh. Kajian ini berjaya mengenal pasti lapan konsep utama dan lapan hubungan semantik untuk pembangunan ontologi TBox domain herba ubatan Malaysia. Pengisian ontologi melibatkan pembentukan korpus domain, kajian linguistik, pengenalpastian corak leksikal, pengekstrakan ayat dan pembinaan petua pengisian ontologi. Teknik corak leksikal ini penting kepada pengisian ontologi untuk memperkukuhkan ontologi dengan tika yang diekstrak daripada konsep. Petua membolehkan inferen dilakukan untuk mengekstrak tika yang berkaitan dengan sesuatu konsep. Kajian ini berjaya mengenal pasti sebanyak 42 corak leksikal dan 126 petua pengisian ontologi. Kajian juga berjaya menemui dua kategori hubungan semantik iaitu (1) spesifik dan (2) tidak spesifik. Satu kaedah pengekstrakan tika dibina untuk membolehkan proses pengisian ontologi dilakukan secara separa automatik. Penilaian dalam kajian ini mengadaptasi kaedah dapatan-semula, kejituan dan ukuran-F yang digunakan dalam bidang capaian maklumat untuk menilai keberkesanan petua pengisian ontologi. Hasil daripada proses pengisian ontologi didapati korpus buku mempunyai nilai purata dapatan-semula, kejituan dan ukuran-F masing-masing 0.93, 0.90 dan 0.91. Korpus Wikipedia mempunyai nilai purata dapatan-semula, kejituan dan ukuran-F masing-masing 0.87, 0.74 dan 0.79. Manakala korpus artikel umum mempunyai nilai purata dapatan-semula, kejituan dan ukuran-F masing-masing 0.96, 0.71 dan 0.78. Nilai dapatan-semula tertinggi pula ditunjukkan oleh korpus artikel umum iaitu 0.96. Korpus buku mempunyai nilai kejituan dan ukuran-F tertinggi iaitu masing-masing 0.90 dan 0.91. Kajian ini memberi implikasi kepada perkembangan penyelidikan bidang pengekstrakan maklumat yang melibatkan pelbagai aspek seperti analisis data besar, perkomputeran linguistik, perlombongan teks dan seumpamanya. Kesimpulannya kajian ini mendapati petua pengisian ontologi berkesan mengekstrak tika daripada teks pelbagai sumber dalam domain yang spesifik.,Ph.D. |
Pages: | 253 |
Call Number: | TK5105.88815.Z337 2015 3 tesis |
Publisher: | UKM, Bangi |
Appears in Collections: | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ukmvital_80439+SOURCE1+SOURCE1.0.PDF Restricted Access | 370.23 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.