Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://elib.vku.udn.vn/handle/123456789/154
Nhan đề: | NGHIÊN CỨU XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN BẰNG PHƯƠNG PHÁP TRÍCH RÚT DỮ LIỆU TỪ CÁC KHO NGỮ LIỆU |
Nhan đề khác: | SOLUTIONS FOR BUILDING DICTIONARY DATABASE USING INFORMATION EXTRACTION FROM CORPUS |
Tác giả: | Trần, Thị Kiều |
Từ khoá: | Trích xuất thông tin trích xuất văn bản từ điển kho ngữ liệu truy tìm thông tin |
Năm xuất bản: | 2016 |
Tóm tắt: | Đã có nhiều công trình, nhiều bài báo nghiên cứu để tạo nên một cơ sở dữ liệu từ điển: giải pháp hợp nhất dữ liệu để xây dựng từ điển đa ngữ [1], hay xây dựng từ điển dựa trên các kho ngữ liệu song song [4]. Tuy nhiên, các công trình nghiên cứu này còn riêng lẻ chưa có sự thống nhất chung để có thể xây dựng nên cơ sở dữ liệu từ điển lớn về khối lượng và tốt về chất lượng. Do đó, nghiên cứu này đề xuất giải pháp xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút dữ liệu từ các kho ngữ liệu: thứ nhất hợp nhất các nguồn dữ liệu từ điển, thứ hai mở rộng thêm cơ sở dữ liệu từ điển từ kho ngữ liệu để nâng cao khối lượng của cơ sở dữ liệu từ điển. Mục đích nhằm phá bỏ trào cản về ngôn ngữ và làm dữ liệu cho các hệ thống dịch tự động, tìm kiếm thông tin, phân loại văn bản tự động, trích rút thông tin tự động, tóm tắt văn bản tự động,… được nâng cao hơn |
Định danh: | http://thuvien.cit.udn.vn//handle/123456789/154 |
Bộ sưu tập: | CITA 2016 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.