Please use this identifier to cite or link to this item:
https://elib.vku.udn.vn/handle/123456789/154
Title: | NGHIÊN CỨU XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN BẰNG PHƯƠNG PHÁP TRÍCH RÚT DỮ LIỆU TỪ CÁC KHO NGỮ LIỆU |
Other Titles: | SOLUTIONS FOR BUILDING DICTIONARY DATABASE USING INFORMATION EXTRACTION FROM CORPUS |
Authors: | Trần, Thị Kiều |
Keywords: | Trích xuất thông tin trích xuất văn bản từ điển kho ngữ liệu truy tìm thông tin |
Issue Date: | 2016 |
Abstract: | Đã có nhiều công trình, nhiều bài báo nghiên cứu để tạo nên một cơ sở dữ liệu từ điển: giải pháp hợp nhất dữ liệu để xây dựng từ điển đa ngữ [1], hay xây dựng từ điển dựa trên các kho ngữ liệu song song [4]. Tuy nhiên, các công trình nghiên cứu này còn riêng lẻ chưa có sự thống nhất chung để có thể xây dựng nên cơ sở dữ liệu từ điển lớn về khối lượng và tốt về chất lượng. Do đó, nghiên cứu này đề xuất giải pháp xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút dữ liệu từ các kho ngữ liệu: thứ nhất hợp nhất các nguồn dữ liệu từ điển, thứ hai mở rộng thêm cơ sở dữ liệu từ điển từ kho ngữ liệu để nâng cao khối lượng của cơ sở dữ liệu từ điển. Mục đích nhằm phá bỏ trào cản về ngôn ngữ và làm dữ liệu cho các hệ thống dịch tự động, tìm kiếm thông tin, phân loại văn bản tự động, trích rút thông tin tự động, tóm tắt văn bản tự động,… được nâng cao hơn |
URI: | http://thuvien.cit.udn.vn//handle/123456789/154 |
Appears in Collections: | CITA 2016 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.