Universiti Teknologi Malaysia Institutional Repository

Pengkelasan dokumen web menggunakan teknik vector machine (SVM)

Othman, Mohd. Shahizan and Dollah @ Md. Zain, Rozilawati and Mi Yusuf, Lizawati and Salim, Juhana and Shukur, Zarina and Chin, Mae Yen (2005) Pengkelasan dokumen web menggunakan teknik vector machine (SVM). In: Seminar Capaian Maklumat & Pengurusan Pengetahuan 2005 (CAMP'05), December 2005, ESSET Bangi.

[img] PDF
299Kb

Abstract

Dewasa ini, kebanyakan enjin carian di internet menggunakan sistem pengindeksan subjek berbanding pengkelasan dokumen. Dalam sistem pengindeksan subjek, kosa kata atau kata kunci yang terkawal digunakan untuk menetapkan istilah pengindeksan pada dokumendokumen web. Manakala, pengkelasan dokumen pula akan mengkelaskan dokumen-dokumen web dalam satu struktur hirarki berdasarkan kategori subjek. Pengindeksan berdasarkan kata kunci berkemampuan untuk mencari dokumen-dokumen yang mengandungi kata kunci yang spesifik. Walau bagaimanapunia sukar untuk mengenalpasti dokumen-dokumen yang mempunyai kategori yang sama. Oleh yang demikian, pengkelasan teks secara automatik adalah diperlukan. Ini bertujuan untuk mengkelaskan dokumen-dokumen ke dalam kategoriketegori yang berbeza berdasarkan kandungan teks. Sehubungan dengan itu, kertas kerja ini akan membincangkan tentang kajian pengkelasan teks dengan menggunakan kaedah Support Vector Machine (SVM). Set data yang digunakan dalam kajian ini diperolehi daripada Bank Search Information Consultancy Ltd. dan Jabatan Sains Komputer di University of Reading. Set data ini dipecahkan kepada empat kategori iaitu perbankan dan kewangan, bahasa pengaturcaraan, sains dan sukan. Hasil kajian ini menunjukkan peratus ketepatan pengkelasan dokumen web untuk set data yang digunakan adalah rendah dan kurang memuaskan.

Item Type:Conference or Workshop Item (Paper)
Uncontrolled Keywords:Pengkelasan, Support Vector Machine (SVM), dokumen web.
Subjects:H Social Sciences > H Social Sciences (General)
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Divisions:Computer Science and Information System (Formerly known)
ID Code:3389
Deposited By: Mrs Rozilawati Dollah @ Md Zain
Deposited On:24 May 2007 00:03
Last Modified:19 Jan 2012 00:20

Repository Staff Only: item control page