Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://elib.vku.udn.vn/handle/123456789/2655
Nhan đề: | Nghiên cứu sử dụng trí tuệ nhân tạo để phát hiện website có chứa nội dung thô tục |
Nhan đề khác: | Research Artificial Intelligence to Detect Websites Containing Profanity Content |
Tác giả: | Đặng, Đại Thọ Lê, Cẩm Bằng Phan, Lê Việt Hùng |
Từ khoá: | Profanity Word2vec PhoBERT Machine Learning Deep Learning Artificial Intelligence |
Năm xuất bản: | thá-2023 |
Nhà xuất bản: | Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn |
Tùng thư/Số báo cáo: | NCKHSV; |
Tóm tắt: | Nội dung thô tục là một vấn đề nhức nhối ảnh hưởng đến an toàn và sức khoẻ của người dùng internet. Mục tiêu của nghiên cứu này là xây dựng một hệ thống tự động phát hiện và cảnh báo các website có chứa nội dung thô tục bằng cách sử dụng các phương pháp trí tuệ nhân tạo hiện đại. Chúng tôi đã áp dụng các phương pháp tiền xử lý, biểu diễn dữ liệu bao gồm Word2vec, PhoBERT và các mô hình Machine Learning và Deep Learning khác nhau. Chúng tôi đã thu thập và xây dựng một bộ dữ liệu ngôn ngữ thô tục tiếng Việt, tiến hành huấn luyện và đánh giá các mô hình trên bộ dữ liệu này. Kết quả cho thấy mô hình BiLSTM với dữ liệu được biểu diễn với PhoBERT có độ chính xác cao nhất là 78%. Nghiên cứu này có thể được áp dụng rộng rãi trong việc cải thiện môi trường internet, bảo vệ trẻ em và thanh thiếu niên khỏi các tác hại tiêu cực của nội dung thô tục trên mạng. |
Mô tả: | Kỷ yếu Nghiên cứu khoa học của sinh viên Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn năm học 2022-2023; trang 34-40. |
Định danh: | http://elib.vku.udn.vn/handle/123456789/2655 |
Bộ sưu tập: | SV NCKH Năm học 2022-2023 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.