Công nghệ nhận diện giọng nói của Microsoft đã đạt tới mức độ chính xác như con người

Microsoft đã phát triển công nghệ có khả năng phát hiện giọng nói chính xác như con người.

Trên một bài báo được công bố ngày hôm qua, một nhóm kỹ sư của Microsoft nghiên cứu về trí tuệ nhân tạo đã công bố rằng, tỷ lệ nhận biết sai từ vựng (WER – word erro rate) của công nghệ phát hiện giọng nói chỉ là 5.9%, tương đương với khả năng con người.

Ông Xuedong Huang, Giám đốc ngôn ngữ khoa học của công ty cho biết: "Hệ thống phát hiện giọng nói đã đạt ngang bằng với trình độ của chúng ta. Đây là một thành tựu mang tính lịch sử".

cong nghe nhan dang giong noi cua microsoft da dat toi muc do chinh xac nhu con nguoi
Khả năng nhận dạng giọng nói của máy tính đã ngang bằng với trình độ của con người.

Sau nhiều thập kỷ thử nghiệm, tỷ lệ sai từ vựng cũng đã dần được cải thiện nhưng chưa thể vượt qua được mức 6.3%. Con số này chưa đủ để làm những nhà nghiên cứu hài lòng. Họ mong muốn công nghệ có thể đạt đến mức hoàn hảo, tức là “ngang ngửa” con người.

Để đạt được mức độ chính xác này, các nhà nghiên cứu đã sử dụng mạng nơron nhân tạo để lưu trữ một lượng lớn dữ liệu - được gọi là Training sets - giúp hệ thống nhận ra những mẫu giọng của con người. Hệ thống cũng được nâng cấp nhận biết những từ có chung gốc nghĩa để phát hiện nhanh chóng và dễ dàng hơn.

Âm thanh và hình ảnh được dùng đồng thời, giúp cho việc sử dụng dữ liệu hiệu quả hơn.

Con số 5.9% thực sự có ý nghĩa rất lớn khi mà cuộc chiến giành thị phần mảng trợ lý kỹ thuật số đang nóng lên trong thời gian gần đây. Cortana, Xbox, Và Windows là những sản phẩm đầu tiên được “thừa hưởng” công nghệ cải tiến này.

Nhóm nghiên cứu cũng mong đợi trong tương lai, phần mềm này sẽ đạt được độ chính xác cao hơn cũng như đảm bảo rằng nhận dạng giọng nói hoạt động tốt hơn trong các tình huống thực tế như tại một nhà hàng ồn ào, một đông đúc hay gặp trở ngại từ những cơn gió mạnh. Công nghệ này cũng mở ra hi vọng, một ngày không xa, những robot hay máy tính có thể hoàn toàn “hiểu” được lời nói của con người.

cong nghe nhan dang giong noi cua microsoft da dat toi muc do chinh xac nhu con nguoi Microsoft tung ra bản cập nhật giải quyết vấn đề khó chịu nhất trên Windows 10

Đó chính là việc hệ điều hành này cài đặt kèm theo quá nhiều ứng dụng mặc định.


Diễn đàn Đầu tư Việt Nam 2026 - Summer Summit

Thời gian: 11/06/2026
Địa điểm: L7 West Lake Hanoi by Lotte Hotels, Ballroom tầng 4, 683 Lạc Long Quân, Tây Hồ, Hà Nội

Vietnam Investment Forum 2026 - Summer Summit quy tụ đại diện cơ quan quản lý, lãnh đạo ngân hàng, công ty chứng khoán, quỹ đầu tư, giám đốc phân tích và các chuyên gia kinh tế độc lập, tập trung vào bức tranh vĩ mô, AI & Big Data và chiến lược tìm kiếm Alpha trong nửa cuối năm 2026.

Ba phiên thảo luận chính:

Phiên thảo luận 1: Vĩ mô 2026 - Việt Nam trước các cú sốc từ bên ngoài và cơ hội từ bên trong
Phiên thảo luận 2: AI & Big Data - Từ lợi thế ra quyết định đến thế hệ sản phẩm đầu tư mới
Phiên thảo luận 3: Cơ hội tìm kiếm Alpha trên thị trường chứng khoán và các kênh tài sản phổ biến

Tìm hiểu chương trình tại VIF 2026 Summer Summit.

Tham gia khảo sát "Dự báo của bạn về nửa cuối năm 2026" để có cơ hội nhận vé mời đặc biệt từ Ban Tổ chức.

chọn
Quan điểm cho vay bất động sản của các ngân hàng: Không 'đóng van' nhưng phải chọn lọc
Nhiều lãnh đạo ngân hàng có chung quan điểm về cách tiếp cận đối với tín dụng bất động sản là không đồng loạt siết mảng này, song sẽ tái cơ cấu theo hướng chọn lọc, ưu tiên dự án có pháp lý rõ ràng, dòng tiền minh bạch và đáp ứng nhu cầu thực, trong khi các khoản vay tiềm ẩn rủi ro cao sẽ bị hạn chế đáng kể.