Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://elib.vku.udn.vn/handle/123456789/978
Nhan đề: Phân loại tên hồ sơ tiếng Việt theo thời hạn bảo quản
Tác giả: Tôn, Nữ Thị Sáu
Đặng, Văn Thìn
Nguyễn, Lưu Thùy Ngân
Từ khoá: Phân loại tài liệu
Support Vector Machines (SVM)
Random Forest (RF)
Năm xuất bản: 2019
Nhà xuất bản: Nhà xuất bản Đà Nẵng
Tóm tắt: Trong bài báo này, chúng tôi trình bày nghiên cứu về phương pháp phân loại tên hồ sơ tiếng Việt theo thời hạn bảo quản. Chúng tôi thu thập dữ liệu là tên các hồ sơ đã được gán nhãn thời hạn bảo quản bởi những chuyên gia trong ngành lưu trữ. Sau đó, chúng tôi tiến hành thử nghiệm 2 phương pháp Support Vector Machines (SVM) và Random Forest (RF) với các đặc trưng khác nhau. Chúng tôi nhận thấy rằng phương pháp SVM kết hợp với đặc trưng từ loại và n-gram cho kết quả tốt nhất cho bài toán phân loại tên hồ sơ tiếng Việt. Kết quả cho thấy phương pháp có thể ứng dụng và thực tế, góp phần thay đổi phương thức, quy trình tổ chức quản lý tài liệu lưu trữ trong thời đại “Văn thư – lưu trữ 4.0”.
Mô tả: Bài báo khoa học; từ trang 198-206
Định danh: http://elib.vku.udn.vn/handle/123456789/978
Bộ sưu tập: CITA 2019

Các tập tin trong tài liệu này:

 Đăng nhập để xem toàn văn



Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.