Please use this identifier to cite or link to this item:
https://ptsldigital.ukm.my/jspui/handle/123456789/476286
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Dr. Kamsuriah Ahmad | |
dc.contributor.author | Alofairi Adel Ahmed (P47966) | |
dc.date.accessioned | 2023-10-06T09:15:50Z | - |
dc.date.available | 2023-10-06T09:15:50Z | - |
dc.date.issued | 2012-04-14 | |
dc.identifier.other | ukmvital:81185 | |
dc.identifier.uri | https://ptsldigital.ukm.my/jspui/handle/123456789/476286 | - |
dc.description | Schema matching is an interesting research topic which had been paid considerable attention by many researchers in the database community. It aims at identifying semantic correspondences between two schemas. Recently, large scale integration has brought a new challenge to schema matching. There are two types of approach to match large schema: matching two large schemas and holistic schema matching. The latter was proposed to match many schemas at the same time, i.e. by taking all the schemas as input and finding all the correct matching among the input schemas. Discovering semantic correspondences of attributes across many query interfaces on the web is an example of the latter type of matching large schema. As an active research topic in the field of schema integration, holistic schema matching tackles the challenge of matching large scale schema. Matching the complete input schemas may not only lead into taking a long execution time, but also poor quality matching results. Therefore, achieving good performance for the schema matching in a large search space is a more difficult and challenging process. In schema matching, effectiveness is a term which is concerned with the accuracy and the correctness of matching the results. Whereas efficiency is a term concerned with reducing the execution time and matching space. Recently, a number of methods were proposed to solve this schema matching using popular clustering techniques namely K-means or Agglomerative hierarchical clustering techniques. These techniques are usually used to reduce the search space, albeit with some drawbacks. However, the existing methods still need to be improved. To improve the matching efficiency and clustering process, the current study aims at finding a new method for holistic schema matching in terms of reducing the searching space. To produce an efficient matching method, a combination of clustering techniques was proposed. To achieve the main objective, the methodology includes two phases: preprocessing and clustering. The domain dictionary was used to improve the pre-processing and to provide the auxiliary information (synonyms, abbreviation). The findings of the present study revealed that the matching method proposed in this study reduced the searching space by using an integrated clustering technique that rapidly groups the most correspondences attributes in the same clusters. The Airfare data set from UIUC Web Integration Repository was selected for the experiments in this study. The proposed method achieved high performance (0.89) for the F-measure analysis. Thus, the results of the current study evidently prove that this method is an effective and promising method in holistic schema matching,Pemadanan skema adalah satu tajuk penyelidikan yang menarik dan menjadi tumpuan oleh ramai penyelidik yang terdahulu. Tujuannya ialah untuk mengenal pasti penglibatan semantik antara dua skema. Baru-baru ini, integrasi skema dalam skala yang besar telah membawa satu cabaran baru kepada pemadanan skema. Terdapat dua jenis pemadanan skema berskala besar iaitu pemadanan dua skema berskala besar dan pemadanan skema holistik. Pemadanan skema holistik telah dicadangkan untuk memadankan banyak skema pada masa yang sama, iaitu dengan mengambil semua skema sebagai input dan mencari semua padanan yang betul antaranya. Sifat-sifat semantik atribut yang terdapat pada kueri di laman web merupakan salah satu contoh pemadanan skema berskala besar. Sebagai salah satu topik penyelidikan yang aktif dalam bidang integrasi skema, pemadanan skema holistik berupaya menangani cabaran pemadanan skema berskala besar. Pemadanan skema input yang lengkap bukan sahaja membawa kepada pengambilan masa pelaksanaan yang lama, tetapi juga kualiti keputusan pemadanan yang rendah. Oleh itu, untuk mencapai prestasi yang baik untuk skema yang sepadan di dalam ruang carian yang besar adalah satu proses yang sukar dan mencabar. Dalam konteks pemadanan skema, keberkesanan merujuk kepada dan ketepatan memadankan keputusan, manakala kecekapan merujuk kepada mengurangkan masa pelaksanaan dan ruang pemadanan. Baru-baru ini, beberapa kaedah telah dicadangkan untuk menyelesaikan masalah pemadanan skema dengan menggunakan teknik pengelompokan biasa yang lebih popular iaitu K-means atau teknik pengelompokan hierarki aglomeratif. Teknik ini biasanya digunakan untuk tujuan mengurangkan ruang carian. Walau bagaimanapun, penggunaan teknik ini masih boleh diperbaiki. Untuk meningkatkan kecekapan pemadanan dan proses kelompok, kajian semasa bertujuan untuk mencari kaedah baru untuk pemadanan skema holistik dari segi mengurangkan ruang mencari. Untuk menghasilkan satu kaedah pemadanan yang cekap , teknik hibrid pengelompokan telah dicadangkan untuk mendapatkan keputusan yang lebih baik. Dalam mencapai matlamat utama, metodologi kajian terbahagi kepada dua fasa: prapemprosesan dan pengelompokan. Kamus domain digunakan untuk memperbaiki prapemprosesan dan untuk menyediakan maklumat tambahan (sinonim, singkatan). Hasil kajian ini menunjukkan bahawa kaedah pemadanan yang dicadangkan di dalam kajian ini berjaya mengurangkan ruang carian dengan menggunakan teknik hibrid pengelompokan. Data Airfare dari UIUC Repository Integrasi Web dipilih untuk dijadikan eksperimen di dalam kajian ini. Kaedah yang dicadangkan mencapai prestasi tinggi (0.89) untuk analisis sukat-F. Oleh itu, hasil kajian jelas membuktikan bahawa kaedah ini adalah kaedah yang berkesan dan berpotensi dalam pemadanan skema holistik.,Master | |
dc.language.iso | eng | |
dc.publisher | UKM, Bangi | |
dc.relation | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat | |
dc.rights | UKM | |
dc.subject | Schema matching | |
dc.subject | Large scale integration | |
dc.subject | Holistic schema matching. | |
dc.subject | Data integration (Computer science). | |
dc.title | An integrated clustering method for holistic schema matching | |
dc.type | theses | |
dc.format.pages | 107 | |
dc.identifier.callno | QA76.9.D338 A447 2012 3 | |
dc.identifier.barcode | 001640 | |
Appears in Collections: | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ukmvital_81185+SOURCE1+SOURCE1.0.PDF Restricted Access | 2.56 MB | Adobe PDF | ![]() View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.