Nghiên cứu sử dụng trí tuệ nhân tạo để phát hiện website có chứa nội dung thô tục

Lê, Cẩm Bằng; Phan, Lê Việt Hùng

Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/2655

Title:	Nghiên cứu sử dụng trí tuệ nhân tạo để phát hiện website có chứa nội dung thô tục
Other Titles:	Research Artificial Intelligence to Detect Websites Containing Profanity Content
Authors:	Đặng, Đại Thọ Lê, Cẩm Bằng Phan, Lê Việt Hùng
Keywords:	Profanity Word2vec PhoBERT Machine Learning Deep Learning Artificial Intelligence
Issue Date:	Jun-2023
Publisher:	Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn
Series/Report no.:	NCKHSV;
Abstract:	Nội dung thô tục là một vấn đề nhức nhối ảnh hưởng đến an toàn và sức khoẻ của người dùng internet. Mục tiêu của nghiên cứu này là xây dựng một hệ thống tự động phát hiện và cảnh báo các website có chứa nội dung thô tục bằng cách sử dụng các phương pháp trí tuệ nhân tạo hiện đại. Chúng tôi đã áp dụng các phương pháp tiền xử lý, biểu diễn dữ liệu bao gồm Word2vec, PhoBERT và các mô hình Machine Learning và Deep Learning khác nhau. Chúng tôi đã thu thập và xây dựng một bộ dữ liệu ngôn ngữ thô tục tiếng Việt, tiến hành huấn luyện và đánh giá các mô hình trên bộ dữ liệu này. Kết quả cho thấy mô hình BiLSTM với dữ liệu được biểu diễn với PhoBERT có độ chính xác cao nhất là 78%. Nghiên cứu này có thể được áp dụng rộng rãi trong việc cải thiện môi trường internet, bảo vệ trẻ em và thanh thiếu niên khỏi các tác hại tiêu cực của nội dung thô tục trên mạng.
Description:	Kỷ yếu Nghiên cứu khoa học của sinh viên Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn năm học 2022-2023; trang 34-40.
URI:	http://elib.vku.udn.vn/handle/123456789/2655
Appears in Collections:	SV NCKH Năm học 2022-2023

Files in This Item:

Sign in to read

Show full item record