Please use this identifier to cite or link to this item: https://ptsldigital.ukm.my/jspui/handle/123456789/772412
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorMohd Ridzwan Yaakob, Prof. Madya. Dr.-
dc.contributor.authorHasnan Othman, P106617-
dc.date.accessioned2024-01-18T03:41:56Z-
dc.date.available2024-01-18T03:41:56Z-
dc.date.issued2022-06-17-
dc.identifier.urihttps://ptsldigital.ukm.my/jspui/handle/123456789/772412-
dc.descriptionFulltexten_US
dc.description.abstractDimensi yang tinggi dan sparsiti merupakan antara cabaran di dalam analisis sentimen (SA) yang disebabkan oleh penggunaan bahasa formal dan bentuk kata serta kesalahan ejaan. Proses pengurangan dimensi pula adalah satu tugasan bagi mengekalkan beberapa sifat vektor yang penting dengan mengasingkan ciri-ciri hingar dan tidak berkaitan di ruang fitur. Penggunaan pemilihan fitur (FS) seperti Term Frequency Inverse Document Frequency (TF-IDF) telah menunjukkan bahawa ia berupaya mengurangkan dimensi yang tinggi dengan menormalkan terma kata dalam ruang vektor. Penggunaan model Pengekodan Dwi-Arah daripada TRANSFORMER (BERT) pula berupaya mewakili terma kata berdasarkan konteks sekeliling, menangani variasi diskret dalam pengertian perkataan dan impak kepada konteks perkataan dengan lebih baik. Walau bagaimanapun, tidak semua tugas boleh diwakili dengan mudah oleh model seni bina TRANSFORMER kerana ciri tetap yang ditentukan oleh model pra-latihan. Sehubungan dengan itu, seni bina model secara hibrid dicadangkan dengan menggunakan pemilihan fitur TF-IDF bagi memperkayakan sifat korpus yang akan dinilai dalam lapisan model BERT. Set data IMDB movie reviews telah digunakan bagi penilaian model dan hasilnya telah dapat meningkatkan ketepatan sebanyak 3.54 peratus daripada model aras asas. Pengukuran prestasi pula telah dinilai menggunakan nilai skor FI yang memperolehi sebanyak 93.10 peratus, kejituan sebanyak 92.4 peratus dan dapatan semula sebanyak 93.90 peratus bersama nilai Receiver Operating Curve (ROC) dan Area Under Curve (AUC) yang mencapai keputusan 90.50 peratus. Kesimpulannya, projek yang dicadangkan ini telah berjaya mencapai objektif dalam meningkatkan ketepatan model pengelasan dan penggunaan model dalam mengenalpasti polariti skor sentimen.en_US
dc.language.isomayen_US
dc.publisherUKM, Bangien_US
dc.relationFaculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumaten_US
dc.rightsUKMen_US
dc.subjectUniversiti Kebangsaan Malaysia -- Dissertationsen_US
dc.subjectDissertations, Academic -- Malaysiaen_US
dc.titleTeknik pemilihan fitur menggunakan TF-IDF dan pendekatan perwakilan pengekodan dwi-arah daripada transformer (BERT) bagi analisis sentimenten_US
dc.typeThesesen_US
dc.format.pages143p.en_US
dc.identifier.callnoFTSMen_US
dc.identifier.barcode005929(2021)(PL2)en_US
dc.format.degreeSarjana Sainsen_US
Appears in Collections:Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat

Files in This Item:
File Description SizeFormat 
HASNAN.pdf
  Restricted Access
1.92 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.