Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/1549
Title: Xử lý dữ liệu không cân bằng trong bài toán dự đoán lỗi phần mềm
Authors: Lê, Song Toàn
Nguyễn, Thanh Bình
Lê, Thị Mỹ Hạnh
Nguyễn, Thanh Bình
Keywords: Fault prediction
Undersampling
Oversampling
SMOTE
Issue Date: 8-Oct-2020
Publisher: Nhà xuất bản Khoa học tự nhiên và Công nghệ
Abstract: Dự đoán lỗi phần mềm giúp dự đoán trước khả năng có lỗi của mã nguồn, làm giảm thời gian kiểm thử, tăng chất lượng của sản phẩm. Các đặc trưng mã nguồn là những thông tin quan trọng giúp việc dự đoán lỗi phần mềm chính xác. Tuy nhiên, nhiều bộ dữ liệu về dự báo lỗi bị mất cân bằng, tức là số lượng dữ liệu giữa các lớp có sự chênh lệch lớn. Trong bài báo này, chúng tôi nghiên cứu về mất cân bằng dữ liệu và sự cần thiết của việc lấy mẫu dữ liệu để xử lý dữ liệu không cân bằng. Chúng tôi tiến hành thử nghiệm với ba kỹ thuật lấy mẫu dữ liệu để xử lý dữ liệu không cần bằng, gồm: Random Undersampling, Random Oversampling và SMOTE. Các kỹ thuật được áp dụng vào ba tập dữ liệu về dự báo lỗi của NASA trong kho lưu trữ của Promise. Các kết quả thu được cho thấy tính hiệu quả của việc áp dụng các mô hình học máy kết hợp với các kỹ thuật lấy mẫu để nâng cao tính chính xác của mô hình dự đoán lỗi phần mềm.
Description: Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020; từ trang 746-755
URI: http://elib.vku.udn.vn/handle/123456789/1549
ISBN: 978-604-9985-77-5
Appears in Collections:NĂM 2020

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.