BIỂU DIỄN NGỮ CẢNH NHẰM KHỬ NHẬP NHẰNG  TRONG KHAI TRIỂN CHỮ VIẾT TẮT BẰNG BỘ PHÂN LỚP NAÏVE BAYES

Nguyễn, Văn Quý; Triệu, Thị Ly Ly; Ninh, Khánh Duy

Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/94

Full metadata record

DC Field	Value	Language
dc.contributor.author	Nguyễn, Văn Quý	-
dc.contributor.author	Triệu, Thị Ly Ly	-
dc.contributor.author	Ninh, Khánh Duy	-
dc.date.accessioned	2018-12-07T05:40:49Z	-
dc.date.available	2018-12-07T05:40:49Z	-
dc.date.issued	2016	-
dc.identifier.uri	http://thuvien.cit.udn.vn//handle/123456789/94	-
dc.description.abstract	Chuẩn hóa văn bản là bài toán rất cần thiết trong các ứng dụng liên quan đến xử lý ngôn ngữ tự nhiên vì văn bản đầu vào thường chứa nhiều từ không chuẩn như chữ viết tắt, chữ số và từ ngữ nước ngoài. Nghiên cứu này giải quyết vấn đề chuẩn hóa chữ viết tắt trong văn bản tiếng Việt khi có nhiều lựa chọn để khai triển. Để khử nhập nhằng trong khai triển chữ viết tắt, phương pháp học máy với bộ phân lớp Naïve Bayes được sử dụng, trong đó thông tin ngữ cảnh của chữ viết tắt được biểu diễn bởi một trong hai mô hình: Bag-of-words (túi từ) hoặc Doc2Vec (vectơ hóa văn bản). Các thử nghiệm phân lớp trên một bộ dữ liệu chữ viết tắt do chúng tôi xây dựng cho thấy tỉ lệ khai triển đúng trung bình của hai mô hình Bag-of-words và Doc2Vec lần lượt là 86,0% và 79,7%. Kết quả thực nghiệm cũng cho thấy thông tin ngữ cảnh đóng vai trò quan trọng trong việc khử nhập nhằng khai triển chữ viết tắt	vi_VN
dc.language.iso	vi	vi_VN
dc.subject	Chuẩn hóa văn bản	vi_VN
dc.subject	khai triển chữ viết tắt	vi_VN
dc.subject	biểu diễn ngữ cảnh	vi_VN
dc.subject	mô hình Bag-of-words	vi_VN
dc.subject	mô hình Doc2Vec	vi_VN
dc.subject	tiếp cận học máy	vi_VN
dc.subject	bộ phân lớp Naïve Bayes	vi_VN
dc.title	BIỂU DIỄN NGỮ CẢNH NHẰM KHỬ NHẬP NHẰNG TRONG KHAI TRIỂN CHỮ VIẾT TẮT BẰNG BỘ PHÂN LỚP NAÏVE BAYES	vi_VN
dc.title.alternative	REPRESENTING CONTEXT FOR DISAMBIGUTION IN EXPANDING ABBREVIATIONS USING NAÏVE BAYES CLASSIFIER	vi_VN
dc.type	Article	vi_VN
Appears in Collections:	CITA 2016

Files in This Item:

Sign in to read

Show simple item record