a. Nội dung khóa học

– Kiến trúc, mô hình, thuật toán Deep Learning đỉnh cao cho Visual Understanding (tác vụ Thị giác máy tính, dữ liệu đa phương thức, khả năng lý giải)

– Các mô hình Deep Learning cho Thị giác máy tính: Vgg, Inception, u-Net/CheXNet/MrNet, ResNet, DenseNet, yoLo MobileNet, ShuffleNet, EffNet,…

– Kỹ thuật Deep Learning: Generative Adversarial Networks (GANs), Variational Autoencoder (VAE), meta/transfer/few-shot learning, evolutionary search, Bayesopt, DeepRL,…

– Các chủ đề của Visual Understanding: Image, Object, Scene, Video, Behavior, 3D, Setting, Integration,…

– Từng bước xây dựng mô hình Deep Learning và các ứng dụng AI

– Hình thức học: Tập trung

– Thời hạn: 16 tuần

– Website: https://vtc.edu.vn/course/visual-understanding/

b. Kết quả sau khóa học

– Hiểu cách xây dựng và phát triển một cách có hệ thống nhiều mô hình, thuật toán, ý tưởng trong DL cho Visual Understanding

– Làm việc với dữ liệu đa phương thức bao gồm: Hình ảnh, video, audio và ngôn ngữ (text)

– Áp dụng các công cụ lý giải trong việc xây dựng mạng lưới học sâu cho Visual Understanding

– Tối ưu và tùy chỉnh các mô hình ML tùy theo mục đích triển khai (Cloud, Web, Mobile, Edge devices)

– Xây dựng bài toán mới từ các ứng dụng thực: Thiết kế giải pháp dùng các thuật toán đỉnh cao; Tiến hành thu thập, xử lý, dán nhãn, huấn luyện, triển khai, đánh giá và cập nhật các mô hình ML.