Giải mã tổng đài tự động và quy trình kỹ thuật phát triển tổng đài tự động

234

Giải pháp tổng đài trả lời trực tuyến hoàn toàn tự động on-cloud (100% cloud-based) do FPT Software phát triển được xây dựng thông qua việc tối ưu hóa tất cả các thành tựu và dịch vụ mới nhất của AI như nhận diện giọng nói, xử lý văn bản; ứng dụng các công nghệ liên quan đến AWS bao gồm DynamoDB, Amazon Lex, Amazon Connect, trong đó Lex là phần quan trọng nhất và được coi là trái tim của Tổng đài Tự động.

Tuần qua, Solution Forum #15 đã diễn ra tại Hà Nội đã chào đón sự tham gia của hai đại diện đến từ Ban Công nghệ Giải pháp gồm anh Trần Công Thành (Artificial Intelligence Project Mangager) và anh Trần Vĩnh Ngọc (AI Developer).

Phần chia sẻ của hai diễn giả bao gồm 2 nội dung chính: Quá trình phát triển của AI (AI landscape) và quy trình kỹ thuật phát triển Tổng đài Tự động (Automated Call Center).

AI Landscape và lý do AI bùng nổ mạnh như hiện nay

IMG_1106

Tóm tắt về quá trình phát triển AI, anh Ngọc cho biết ý tưởng về  một thuật toán mô phỏng cách thức bộ não con người hoạt động bắt đầu từ khoảng 1943. Bộ não con người hoạt động nhờ các neuron truyền tín hiệu và xử lý qua nhiều lớp. Ban đầu, thuật toán chỉ được xây dựng với một lớp duy nhất, nên đã có rất nhiều người nghi ngờ về nó. Ví dụ: Marvin Minsky năm 1970 đưa ra một vấn đề không giải quyết được bằng mạng neuron chỉ có 1 lớp. Đến 1986, G. Hinton mới đưa ra được giải pháp với mạng nhiều lớp (multi-layered perceptron), nhưng mạng neuron yêu cầu tốc độ tính toán rất cao trong khi cấu hình phần cứng lúc đó chưa đáp ứng được. Đến 2006, G. Hinton và team của ông mới đưa ra kết quả của một deep network có độ chính xác cao trong việc voice recognition. Từ đó Deep Learning bắt đầu phát triển. Trước đây các thuật toán khác trong AI (không phải deep neuron network) để đạt được độ chính xác cao thì cần rất nhiều công nghiên cứu, chi phí mở phòng lab. Vì Deep Learning được triển khai nhanh hơn mà không cần đến phòng lab đã khiến cho AI bùng nổ như hiện nay.

Kiến trúc cơ bản của một hệ thống Call Center trên AWS

Giải thích về kiến trúc của hệ thống Call Center trên AWS, anh Thành cho biết: “Khi khách hàng dùng điện thoại (không cần phải là Smart phone) gọi điện đến Amazon Connect, cuộc gọi sẽ được xử lý từ giọng nói thành text và đưa về cho Amazon Lex – dịch vụ Chatbot của Amazon”.

Kiến trúc cơ bản của một hệ thống Call Center trên AWS được minh hoạ như trong hình vẽ dưới đây:

1

Sau khi giọng nói được chuyển thành text và đưa về cho Amazon Lex, Lex sẽ sử dụng Lambda để xử lý nội dung cuộc hội thoại, liên kết với Database DynamoDB để lấy dữ liệu khách hàng, chuyển lại thành Speech và gửi ngược lại cho Amazon Connect để giao tiếp với khách hàng.

Lambda

Về AWS Lambda, anh Thành chia sẻ, đây là một dịch vụ tính toán nơi mà người dùng có thể upload code của mình lên, và dịch vụ AWS Lambda sẽ giúp bạn chạy đoạn code đó bằng việc sử dụng các tài nguyên sẵn có của AWS. Sau khi upload code, và tạo ra một Lambda function, AWS sẽ cung cấp và quản lý các server mà người dùng sử dụng để chạy code.

AWS Lambda sẽ chạy code đã được upload trên môi trường có tính sẵn sàng cao và vận hành với quyền cao nhất đối với các tài nguyên tính toán, bao gồm server và hệ điều hành. Những ngôn ngữ mà AWS Lambda đang hỗ trợ bao gồm Node.js, Java, và Python.

2

DynamoDB

DynamoDB là môt dịch vụ quản lý NoSQL có khả năng đáp ứng hiệu suất cao và nhanh kèm theo khả năng mở rộng. Người dùng có thể dụng DynamoDB để tạo ra các bảng có khả năng lưu trữ và truy xuất bất kỳ số lượng dữ liệu, mà vẫn có thể phục vụ cho bất kỳ mức độ request traffic.

22

Lex và AWS Connect

Amazon Lex là một dịch vụ AWS để xây dựng hội thoại cho bất kỳ ứng dụng nào bằng voice và text. Lex cho phép người dùng xây dựng Chatbots một cách tinh vi để áp dụng vào bất kỳ ứng dụng nào. Lex cung cấp tính năng sâu và linh hoạt trong việc hiểu ngôn ngữ tự nhiên (NLU) và nhận dạng giọng nói tự động (ASR) để có thể xây dựng trải nghiệm người dùng hấp dẫn với tương tác thực tế, giao tiếp và tạo các loại sản phẩm mới.

Cấu trúc cơ bản của Lex được miêu tả trong hình sau:

33

Khi Lex nhận được Speech input từ AWS Connect, Speech sẽ được xử lý thành text, thông qua ngôn ngữ tự nhiên để đưa ra phản hồi hợp lý và được chuyển lại thành Speech, gửi lại cho Connect.

Xem lại video chương trình tại: livestream.

Một số hình ảnh Solution Forum #15 HN:

IMG_1130

IMG_1127

IMG_1094

IMG_1152POTATO Tech Mag

Tin liên quan: