Conversational AI là một bộ công nghệ cho phép các máy tính mô phỏng các cuộc hội thoại thực sự. Với ngôn ngữ tự nhiên, hệ thống Conversational AI có thể diễn giải lời nói của con người, trò chuyện với con người, thực hiện nhiệm vụ được giao hay tính toán.

Tuy nhiên, khi ta trò chuyện với các trợ lý AI phổ biến hiện nay như Alexa, Siri hay Google Assistant, cuộc hội thoại dường như không được tự nhiên. Mặc dù các chatbot này có thể kể chuyện cười, cung cấp thông tin hay thậm chí trả lời được nhiều câu hỏi khác nhau từ người dùng, nhưng đó vẫn chỉ là sản phẩm mô phỏng của con người.

Kết quả hình ảnh cho Conversational AI

Để chia sẻ về tiến trình ứng dụng deep learning trong hội thoại, Google đã giới thiệu Meena – một mạng lưới thần kinh với 2,6 tỷ thông số. Google tuyên bố Meena có khả năng giao tiếp vượt trội hơn các chatbot AI khác, nó có thể xử lý được hội thoại đa chiều và thậm chí tự nói đùa với người dùng.

Ngoài ra, Google cũng cho ra mắt SSA (Sensibleness and Specificity Average hay tiêu chuẩn cảm nhận đúng đắn và đặc trưng). SSA là tiêu chuẩn nhằm đánh giá độ chính xác của các phản hồi mà chatbot đưa ra trong cuộc hội thoại. Trong bài báo công bố trên arXiv, Google xác định một người bình thường có thể đạt được 86% trên thang điểm SSA. Những chatbot khác trong nghiên cứu trên có số điểm dao động từ 31 – 56%. Tuy nhiên Meena lại đạt tới 79% – khiến cho nó giao tiếp giống người hơn hẳn tất cả các hệ thống chatbot từng được thử nghiệm.

Meena được đào tạo với trên 40 tỷ từ, sử dụng mô hình seq2seq và một biến thể khác của Transformer architecture.

Để đánh giá một cuộc hội thoại, SSA dựa trên trạng thái tĩnh với một bộ cố định các gợi ý và tương tác, cho phép cuộc trò chuyện diễn ra trôi chảy. Mỗi cuộc hội thoại cần kéo dài từ 14 đến tối đa 28 lượt. Kết quả sau đó được đưa ra dựa trên tỷ lệ phần trăm các lượt được đánh giá là cụ thể và hợp lý, SSA sẽ trừ điểm đối với các câu trả lời chung chung.

Theo một bài blog, Google sẽ không phát hành bản demo của Meena cho cộng đồng ngay lập tức. Công ty có thể phát hành bản demo trong những tháng tới để giúp nghiên cứu về các mô hình hội thoại thần kinh và chatbot nói chung.

Tiêu chuẩn SSA của Google khác biệt hoàn toàn so với các tiêu chuẩn đánh giá khả năng giao tiếp của trợ lý ảo AI trước đây.

Trong 3 năm qua, Alexa Prize vẫn là một thách thức đối với các nhóm sinh viên developer trong việc tạo ra một trợ lý AI có khả năng duy trì cuộc trò chuyện trong 20 phút. Nhóm chiến thắng chung cuộc năm ngoái là Alexa – trợ lý AI có khả năng trò chuyện lên tới khoảng 10 phút. Vòng chung kết mới nhất sẽ được công bố vào tháng Năm.

Amazon đã bắt đầu phát triển các dịch vụ đối thoại đa chiều. Hội thoại là một tính năng bao gồm các đề xuất về ứng dụng giọng nói trong đối thoại đa chiều.

Theo Ashwin Ram, cựu giám đốc của Alexa Prize và Giám đốc của Google Research hiện tại, các trợ lý AI đang dần trở nên gần gũi với con người hơn, chúng có thể trò chuyện, ủng hộ, cổ vũ tinh thần, hay làm bạn với con người.

Tin liên quan: