Please use this identifier to cite or link to this item: https://ptsldigital.ukm.my/jspui/handle/123456789/513495
Title: Kaedah dangkal bagi pengekstrakan rangkaian sosial akademik dari web
Authors: Mahyuddin K.M. Nasution (P42116)
Supervisor: Shahrul Azman Mohd Noah, Prof. Dr.
Keywords: Online social networks
Universiti Kebangsaan Malaysia -- Dissertations
Dissertations, Academic -- Malaysia
Issue Date: 17-Jan-2013
Description: Penyelidikan telah menunjukkan kemungkinan pengekstrakan rangkaian sosial dari Web. Perkara yang paling penting dalam pengekstrakan rangkaian sosial adalah untuk mengenalpasti pelakon sosial yang sesuai dan hubungan yang mungkin wujud antara pasangan pelakon. Pengekstrakan ini adalah proses yang kompleks dan memakan masa. Terdapat dua aliran penyelidikan bagi pengekstrakan rangkaian sosial, iaitu pendekatan diselia dan tak diselia. Penyelidikan diselia melibatkan analisis korpus untuk mengenali entiti dan hubungan mereka dan juga label hubungan. Namun demikian, menamakan label hanya terhad kepada label yang telah ditetapkan dalam set latihan. Aliran tak diselia, sebaliknya, melibatkan hasil enjin carian untuk menjanakan rangkaian sosial tetapi dengan maklumat yang terhad. Sehubungan dengan itu, tujuan utama penyelidikan ini adalah untuk mempertingkatkan kaedah dangkal bagi pengekstrakan rangkaian sosial dengan melaksanakan teknik capaian maklumat, seperti nyahkekaburan nama. Kajian ini mencadangkan kaedah baru dengan mengeksploitasi snippet hasil carian Web yang dihasilkan oleh enjin carian. Pengekstrakan bermula dengan pengesanan hubungan antara sepasang pelakon yang dikemukakan sebagai kueri kepada enjin carian. Dalam kajian ini, diberikan tumpuan kepada empat hubungan akademik yang penting: 'pengarang-bersama', 'kumpulan-penyelidikan', 'persidangan-saintifik', dan 'peranan-akademik'. Setiap hubungan kemudian ditakrifkan dengan senarai kata berkaitan. Maklumat dijana dari hasil carian seperti kiraan dan URL yang digunakan untuk menjanakan kekuatan hubungan, manakala petunjuk bagi hubungan didasarkan kepada frekuensi ternormalisasi dan nilai TF.IDF yang ditemukan dalam snippet. Pilihan label bagi setiap hubungan berasaskan nilai kekuatan dan nilai kesamaan perkataan. Kompleksiti kaedah dicadangkan adalah O(mn) yang mana m dan n adalah bilangan pelakon, yang lebih baik daripada kompleksiti kaedah sebelumnya iaitu O(n2). Semasa proses penilaian, sebanyak 76 nama pensyarah Fakulti Teknologi dan Sains Maklumat UKM digunakan sebagai benih untuk menjanakan pelakon lain. Dalam usaha untuk mengesahkan hubungan yang dihasilkan, soal selidik telah diedarkan di kalangan penyelidik tersurat dan tersirat dengan menyebutkan hubungan antara pelakon yang mengambil bahagian. Keputusan menunjukkan potensi pendekatan dicadangkan meningkatkan prestasi pendekatan semasa untuk mengekstrak rangkaian sosial dari Web, iaitu dapatan semula daripada kaedah yang diajukan adalah tinggi (70-90%), akibatnya kejituan menurun (40-12%), tetapi masih lebih baik dibandingkan dengan kaedah sebelumnya.,Ph.D.
Pages: 251
Call Number: QA76.27.M337 2013 3 tesis
Publisher: UKM, Bangi
Appears in Collections:Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat

Files in This Item:
File Description SizeFormat 
ukmvital_75055+SOURCE1+SOURCE1.0.PDF
  Restricted Access
3.61 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.