Please use this identifier to cite or link to this item:
https://elib.vku.udn.vn/handle/123456789/229
Title: | Chuẩn hóa văn bản tiếng Việt dựa trên bộ quy tắc |
Authors: | Ninh, Khánh Chi Ninh, Khánh Duy |
Keywords: | Chuẩn Hóa Văn Bản Phân Lớp Ký Hiệu Bộ Quy Tắc |
Issue Date: | 2017 |
Abstract: | Chuẩn hóa văn bản là một bước quan trọng trong các hệ thống xử lý ngôn ngữ tự nhiên và tiếng nói, đặc biệt là trong ứng dụng chuyển văn bản thành tiếng nói. Văn bản tiếng Việt nói chung thường chứa những từ chưa được chuẩn hoá như chữ số, chữ viết tắt và từ ngữ nước ngoài. Để chuẩn hóa văn bản, chúng ta cần phải chuyển tất cả các từ chưa được chuẩn hoá thành dạng chuẩn là ngôn ngữ tự nhiên. Nghiên cứu tập trung trình bày giải pháp thiết kế bộ phân lớp ký hiệu, thành phần đóng vai trò quyết định độ chính xác của việc chuẩn hóa. Khác với các nghiên cứu trước sử dụng tiếp cận hướng dữ liệu, nghiên cứu này đề xuất giải pháp phân lớp ký hiệu sử dụng bộ quy tắc dựa trên kinh nghiệm ngôn ngữ do chúng tôi tự thiết kế. Kết quả thực nghiệm cho thấy giải pháp chúng tôi đề xuất mặc dù đơn giản nhưng vẫn có thể phân lớp các từ chưa được chuẩn hóa trong văn bản tiếng Việt với độ chính xác trên 90% cho 19 trên tổng số 24 lớp ký hiệu |
URI: | http://thuvien.cit.udn.vn//handle/123456789/229 |
Appears in Collections: | CITA 2017 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.