Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/978
Title: Phân loại tên hồ sơ tiếng Việt theo thời hạn bảo quản
Authors: Tôn, Nữ Thị Sáu
Đặng, Văn Thìn
Nguyễn, Lưu Thùy Ngân
Keywords: Phân loại tài liệu
Support Vector Machines (SVM)
Random Forest (RF)
Issue Date: 2019
Publisher: Nhà xuất bản Đà Nẵng
Abstract: Trong bài báo này, chúng tôi trình bày nghiên cứu về phương pháp phân loại tên hồ sơ tiếng Việt theo thời hạn bảo quản. Chúng tôi thu thập dữ liệu là tên các hồ sơ đã được gán nhãn thời hạn bảo quản bởi những chuyên gia trong ngành lưu trữ. Sau đó, chúng tôi tiến hành thử nghiệm 2 phương pháp Support Vector Machines (SVM) và Random Forest (RF) với các đặc trưng khác nhau. Chúng tôi nhận thấy rằng phương pháp SVM kết hợp với đặc trưng từ loại và n-gram cho kết quả tốt nhất cho bài toán phân loại tên hồ sơ tiếng Việt. Kết quả cho thấy phương pháp có thể ứng dụng và thực tế, góp phần thay đổi phương thức, quy trình tổ chức quản lý tài liệu lưu trữ trong thời đại “Văn thư – lưu trữ 4.0”.
Description: Bài báo khoa học; từ trang 198-206
URI: http://elib.vku.udn.vn/handle/123456789/978
Appears in Collections:CITA 2019

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.