Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/154
Title: NGHIÊN CỨU XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN BẰNG PHƯƠNG PHÁP TRÍCH RÚT DỮ LIỆU TỪ CÁC KHO NGỮ LIỆU
Other Titles: SOLUTIONS FOR BUILDING DICTIONARY DATABASE USING INFORMATION EXTRACTION FROM CORPUS
Authors: Trần, Thị Kiều
Keywords: Trích xuất thông tin
trích xuất văn bản
từ điển
kho ngữ liệu
truy tìm thông tin
Issue Date: 2016
Abstract: Đã có nhiều công trình, nhiều bài báo nghiên cứu để tạo nên một cơ sở dữ liệu từ điển: giải pháp hợp nhất dữ liệu để xây dựng từ điển đa ngữ [1], hay xây dựng từ điển dựa trên các kho ngữ liệu song song [4]. Tuy nhiên, các công trình nghiên cứu này còn riêng lẻ chưa có sự thống nhất chung để có thể xây dựng nên cơ sở dữ liệu từ điển lớn về khối lượng và tốt về chất lượng. Do đó, nghiên cứu này đề xuất giải pháp xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút dữ liệu từ các kho ngữ liệu: thứ nhất hợp nhất các nguồn dữ liệu từ điển, thứ hai mở rộng thêm cơ sở dữ liệu từ điển từ kho ngữ liệu để nâng cao khối lượng của cơ sở dữ liệu từ điển. Mục đích nhằm phá bỏ trào cản về ngôn ngữ và làm dữ liệu cho các hệ thống dịch tự động, tìm kiếm thông tin, phân loại văn bản tự động, trích rút thông tin tự động, tóm tắt văn bản tự động,… được nâng cao hơn
URI: http://thuvien.cit.udn.vn//handle/123456789/154
Appears in Collections:CITA 2016

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.