Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://elib.vku.udn.vn/handle/123456789/261
Nhan đề: GIẢI PHÁP TRÍCH RÚT VÀ PHÂN LOẠI CÁC THỰC THỂ DANH TỪ RIÊNG CHO KHO NGỮ LIỆU PHỤC VỤ XỬ LÝ NGÔN NGỮ TỰ NHIÊN
Nhan đề khác: EXTRACTION AND CLASSIFICATION OF NAMED ENTITIES FROM CORPORA IN NATURAL LANGUAGE PROCESSING
Tác giả: Đặng, Đại Thọ
Doãn, Hằng Diệu
Huỳnh, Công Pháp
Từ khoá: Trích rút thông tin
phân loại thông tin
kho ngữ liệu
Trích rút tên riêng
phân loại tên riêng
Năm xuất bản: 2014
Tóm tắt: Trích rút và phân loại thực thể danh từ riêng cho các kho ngữ liệu phục vụ xử lý ngôn ngữ tự nhiên là một bước quan trọng và là tiền đề cho việc mở rộng và xây dựng các kho ngữ liệu theo hướng ngữ nghĩa. Việc nghiên cứu trích rút và phân loại thông tin trong các ngôn ngữ khác và được thực hiện bằng các phương pháp như dựa trên hệ luật (rule – based),học máy (machine learning), Markov ẩn,...trên các nguồn dữ liệu internet đã được quan tâm đáng kể. Tuy nhiên chưa có công trình nào nghiên cứu trích rút và phân loại thực thể danh từ riêng trên các kho ngữ liệu phục vụ xử lý ngôn ngữ tự nhiên. Hơn nữa, các phương pháp trích rút và phân loại thông tin đã sử dụng như nêu ở trên đều có những nhược điểm riêng của nó. Trong bài báo này, chúng tôi đề xuất giải pháp kết hợp thuật toán Maximum Matching với phân tích quan hệ ngữ cảnh giữa các thành tố trong văn bản để trích rút và phân loại các thực thể danh từ riêng cho kho ngữ liệu phục vụ xử lý ngôn ngữ tự nhiên. Giải pháp mà chúng tôi đề xuấtbước đầu đã mang lại kết quả rất đáng khích lệ
Định danh: http://thuvien.cit.udn.vn//handle/123456789/261
Bộ sưu tập: CITA 2014

Các tập tin trong tài liệu này:

 Đăng nhập để xem toàn văn



Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.