Nhóm nghiên cứu của đại học Oxford mới đây đã phát triển một trí thông minh nhân tạo (AI) có khả năng đọc được khẩu hình (nhìn cử động của môi để đoán nội dung trao đổi). Đây là một bước tiến mới trong công nghệ AI, với sự hỗ trợ của công nghệ Deep learning từ DeepMind.
AI LipNet, tên của AI mới được tạo ra để đọc khẩu hình, được nhóm nghiên cứu đào tạo bằng cách "cho xem" nhiều clip có người nói và để AI Lipnet tự động học cách đọc khẩu hình.
Deep learning là công nghệ được DeepMind sử dụng để tạo ra AlphaGo, AI đánh bại kỳ thủ cờ vây vô địch thế giới hiện nay Lee Sedol. Hiện nay, Deep learning cũng đã được áp dụng tại nhiều lĩnh vực, trong đó, một nhóm kỹ sư của Google đã tạo ra một AI với khả năng tự tạo ra phương pháp mã hóa, vượt qua khả năng phá mã của con người.
Có thể hiểu ngắn gọn, Deep learning là một ngành máy học, sử dụng các thuật toán để mô hình hóa dữ liệu trừu tượng, thông qua nhiều biến đổi phi tuyến tính. |
Hiện tại, AI LipNet đã đạt mức độ chính xác 93,4%. Đây là một bước tiến lớn khi mà AI này đã vượt qua khả năng của con người. Ngay cả những chuyên gia trong lĩnh vực đọc khẩu hình cũng chỉ có thể đạt mức độ xử lý chính xác một nửa AI LipNet.
Nhược điểm của AI LipNet là mới chỉ có thể đạt độ chính xác cao khi theo dõi các video được quay chính diện và được chiếu sáng tốt.
Facebook đã và đang thay đổi cách chúng ta đọc báo như thế nào
Đừng coi thường, ngay cả những hãng sản xuất tin tức lớn nổi tiếng cũng phải liên tục thay đổi để thích nghi với các ... |