Please use this identifier to cite or link to this item:
https://ptsldigital.ukm.my/jspui/handle/123456789/476482
Title: | Perbandingan kaedah persamaan untuk meningkatkan prestasi dapatan bagi data kimia |
Authors: | Nevy Rahmi Nurjana (P68494) |
Supervisor: | Suhaila Zainudin, Dr. |
Keywords: | Kimia informatik Cheminformatics |
Issue Date: | 13-Jun-2017 |
Description: | Kimia informatik adalah teknik berasaskan maklumat komputer yang telah digunakan dalam menyelesaikan pelbagai jenis masalah dalam bidang kimia seperti penemuan drug dalam syarikat-syarikat farmaseutikal. Salah satu teknik yang paling biasa dalam kimia informatik adalah pencarian persamaan (similarity searching) dimana untuk membandingkan persamaan antara struktur molekul didalam pangkalan data kimia menggunakan kaedah persamaan. Konsep persamaan pencarian telah digunakan dalam industri yang berbeza termasuk pembuatan, kewangan, imej komersial, dan penemuan drug. Penyelidik sebelum ini mendapati bahawa tidak ada pekali persamaan tertentu yang akan digunakan untuk semua jenis fingerprints dalam pencarian persamaan. Di samping itu, untuk mencari jenis fingerprint dan pekali persamaan yang paling sesuai untuk pangkalan data kimia, bergantung kepada ciri-ciri persamaan antara molekul dalam setiap kelas aktiviti. Banyak kajian sebelum yang telah menggunakan pangkalan data MDDR (MDL Drug Data Report) sebagai set data untuk mencari fingerprint dan pekali persamaan yang sesuai. Walau bagaimanapun, pangkalan data MDDR dikemaskini setiap tahun dimana penemuan sebatian baru telah ditambah kepada pangkalan data MDDR. Oleh itu, terdapat keperluan penyelidikan untuk mencari fingerprint dan pekali persamaan yang sesuai untuk digunakan dengan pangkalan data MDDR. Objektif utama kajian ini adalah untuk mengenal pasti kombinasi terbaik daripada fingerprint dan pekali persamaan untuk set data MDDR. 15 kelas aktiviti dipilih sebagai set data MDDR yang telah dimuat turun dan ditukar kepada 6 jenis fingerprint iaitu ECFP2, ECFP4, ECFP6, FCFP2, FCFP4 dan FCFP6. Pengiraan persamaan diukur menggunakan pekali Tanimoto, Cosine, Euclidean dan Soergel. Dari setiap kelas aktiviti kemudian akan dipilih 10 ID (struktur molekul / kueri) yang paling mewakili berdasarkan pengiraan ECFP2 fingerprint dan pekali persamaan Tanimoto. Oleh itu ID yang paling wakil akan digunakan untuk menganalisis nilai purata kejituan dan nilai purata dapatan pada setiap gabungan fingerprint dan pekali persamaan berdasarkan bilangan positif benar (true positive) daripada 1% nilai persamaan tertinggi. Hasil kajian menunjukkan bahawa pekali Tanimoto dan pekali Soergel mempunyai prestasi yang lebih baik dalam fingerprint FCFP2, ECFP4, ECFP6, FCFP4 dan FCFP6. Kajian ini juga mendapati bahawa fingerprint ECFP2 menunjukkan prestasi yang lebih baik dalam pekali Euclidean, pekali Soergel dan pekali Tanimoto. Hasil nilai purata persamaan pasangan (Mean Pairwise Similarity –MPS) menunjukkan bahawa set data MDDR adalah heterogen untuk tugas pencarian persamaan.,Tesis ini tidak ada Perakuan Tesis Sarjana/Doktor Falsafah" |
Pages: | 78 |
Call Number: | QD39.3.E46N439 2017 3 tesis |
Publisher: | UKM, Bangi |
Appears in Collections: | Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ukmvital_99010+SOURCE1+SOURCE1.0.PDF Restricted Access | 149.4 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.