Date Log
Bản quyền (c) 2025 Tạp chí Khoa học Đại học Công Thương
Tác phẩm này được cấp phép theo Ghi nhận tác giả của Creative Commons Giấy phép quốc tế 4.0 .
HỆ CHÚ THÍCH ẢNH TỰ ĐỘNG CHO NGƯỜI KHIẾM THỊ
Corresponding Author(s) : Trần Thị Vân Anh
Tạp chí Khoa học Đại học Công Thương,
T. 25 S. 4 (2025)
Tóm tắt
Suy giảm thị lực khiến người khiếm thị gặp nhiều trở ngại trong việc nhận biết và tương tác với môi trường xung quanh. Nhằm hỗ trợ khắc phục vấn đề này, nghiên cứu đề xuất một hệ thống chú thích ảnh tự động hoạt động đa nền tảng. Mô hình được thiết kế theo kiến trúc mã hóa–giải mã, trong đó DenseNet đảm nhận vai trò trích xuất đặc trưng hình ảnh, còn LSTM kết hợp với cơ chế chú ý để tạo ra mô tả ngôn ngữ. Phương pháp được huấn luyện và đánh giá trên hai bộ dữ liệu chuẩn MS COCO và Flickr30K, với các độ đo phổ biến như BLEU và METEOR. Kết quả cho thấy hệ thống đạt độ chính xác cao hơn nhiều phương pháp công bố gần đây. Ngoài ra, một phiên bản ứng dụng chạy trên Desktop và thiết bị di động cũng được phát triển, cho phép sinh mô tả ảnh dưới dạng âm thanh, góp phần hỗ trợ người khiếm thị tiếp cận thông tin trực quan.
Từ khóa
Tải xuống trích dẫn
Kiểu Endnote/Zotero/Mendeley (RIS)BibTex