Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://elib.vku.udn.vn/handle/123456789/261
Nhan đề: | GIẢI PHÁP TRÍCH RÚT VÀ PHÂN LOẠI CÁC THỰC THỂ DANH TỪ RIÊNG CHO KHO NGỮ LIỆU PHỤC VỤ XỬ LÝ NGÔN NGỮ TỰ NHIÊN |
Nhan đề khác: | EXTRACTION AND CLASSIFICATION OF NAMED ENTITIES FROM CORPORA IN NATURAL LANGUAGE PROCESSING |
Tác giả: | Đặng, Đại Thọ Doãn, Hằng Diệu Huỳnh, Công Pháp |
Từ khoá: | Trích rút thông tin phân loại thông tin kho ngữ liệu Trích rút tên riêng phân loại tên riêng |
Năm xuất bản: | 2014 |
Tóm tắt: | Trích rút và phân loại thực thể danh từ riêng cho các kho ngữ liệu phục vụ xử lý ngôn ngữ tự nhiên là một bước quan trọng và là tiền đề cho việc mở rộng và xây dựng các kho ngữ liệu theo hướng ngữ nghĩa. Việc nghiên cứu trích rút và phân loại thông tin trong các ngôn ngữ khác và được thực hiện bằng các phương pháp như dựa trên hệ luật (rule – based),học máy (machine learning), Markov ẩn,...trên các nguồn dữ liệu internet đã được quan tâm đáng kể. Tuy nhiên chưa có công trình nào nghiên cứu trích rút và phân loại thực thể danh từ riêng trên các kho ngữ liệu phục vụ xử lý ngôn ngữ tự nhiên. Hơn nữa, các phương pháp trích rút và phân loại thông tin đã sử dụng như nêu ở trên đều có những nhược điểm riêng của nó. Trong bài báo này, chúng tôi đề xuất giải pháp kết hợp thuật toán Maximum Matching với phân tích quan hệ ngữ cảnh giữa các thành tố trong văn bản để trích rút và phân loại các thực thể danh từ riêng cho kho ngữ liệu phục vụ xử lý ngôn ngữ tự nhiên. Giải pháp mà chúng tôi đề xuấtbước đầu đã mang lại kết quả rất đáng khích lệ |
Định danh: | http://thuvien.cit.udn.vn//handle/123456789/261 |
Bộ sưu tập: | CITA 2014 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.