Ngày 15/1, Microsoft thông báo sẽ cung cấp cho khách hàng quyền kiểm soát chi tiết hơn trong việc dữ liệu giọng nói của họ được công ty sử dụng để cải thiện các sản phẩm nhận diện giọng nói.

Chính sách mới này sẽ cho phép khách hàng quyết định xem người đánh giá, bao gồm nhân viên và đối tác của Microsoft, có thể nghe được bản ghi những gì họ nói với các sản phẩm và dịch vụ sử dụng công nghệ nhận diện giọng nói của Microsoft hay không. Các sản phẩm và dịch vụ này bao gồm Microsoft Translator, SwiftKey, Windows, Cortana, HoloLens, Mixed Reality, and Skype Translator. 

Bảo đảm quyền riêng tư trong nhận diện giọng nói là một nhiệm vụ đầy thách thức, bởi các kĩ thuật AI hiện đại nhất đã được sử dụng để đưa ra kết luận về các thuộc tính như ý định, giới tính, trạng thái cảm xúc và danh tính từ âm sắc, cao độ và phong cách của người nói. Báo cáo gần đây tiết lộ rằng việc vô tình bật trợ lý giọng nói làm lộ ra các cuộc hội thoại riêng tư. Một nghiên cứu của các nhà nghiên cứu tại trường Đại học Máy tính Clemson đã tìm ra rằng, các chính sách quyền riêng tư của ứng dụng giọng nói Amazon Alexa và Google Assistant thường “có vấn đề” và vi phạm các yêu cầu cơ bản. Điều này rủi ro đến mức các công ty luật bao gồm Mishcon de Reya đã khuyên các nhân viên tắt các thiết bị loa thông minh khi nói về các vấn đề của khách hàng ở nhà. 

Microsoft đã ngừng lưu trữ các đoạn ghi âm được xử lý bằng công nghệ nhận diện giọng nói của công ty từ ngày 30 tháng Mười. Google Assistant, Siri, Cortana, Alexa và các nền tảng nhận diện giọng nói lớn khác cũng cho phép người dùng xoá dữ liệu được ghi lại. Nhưng việc này đòi hỏi một vài nỗ lực (trong một số trường hợp là một nỗ lực đáng kể). Đó là lý do tại sao trong vài tháng tới, Microsoft cho biết họ sẽ cho ra các cài đặt đánh giá bản ghi âm mới trên tất cả những sản phẩm liên quan. Nếu khách hàng đồng ý, Microsoft có thể xem lại các đoạn ghi âm này để cải thiện khả năng của hệ thống AI “với nhiều người, nhiều phong cách nói, giọng điệu, ngôn ngữ địa phương và môi trường âm thanh”.

“Mục tiêu là làm cho các công nghệ nhận diện giọng nói của Microsoft trở nên toàn diện hơn bằng cách khiến việc tương tác với chúng dễ dàng và tự nhiên hơn”, Microsoft viết trong 2 bài đăng blog sáng 15/1. “Các bản ghi âm sẽ không còn được nhận dạng khi lưu trữ – chúng sẽ không được liên kết với bất kỳ tài khoản hay ID Microsoft nào của khách hàng. Dữ liệu giọng nói mới sẽ không còn hiển thị trong bảng điều khiển quyền riêng tư tài khoản của Microsoft. 

Nếu một khách hàng lựa chọn cho phép nhân viên hoặc đối tác của Microsoft nghe các bản ghi của họ để cải thiện công nghệ của công ty, một phần là bằng cách ghi chép thủ công những gì họ nghe được, Microsoft sẽ lưu giữ dữ liệu đó trong tối đa hai năm. Nếu một bản ghi âm được lấy mẫu để phiên âm, nó có thể sẽ được giữ lại trong nhiều hơn hai năm để “tiếp tục đào tạo và cải thiện chất lượng của AI nhận diện giọng nói.”

Microsoft cho biết các khách hàng lựa chọn không đóng góp bản ghi âm vẫn có thể sử dụng các sản phẩm và dịch vụ giọng nói của công ty. Tuy nhiên, công ty có quyền tiếp tục truy cập các thông tin liên quan đến hoạt động giọng nói của người dùng, ví dụ như các bản ghi được tạo tự động trong quá trình người dùng tương tác với AI nhận diện giọng nói.

Những gã khổng lồ công nghệ bao gồm Apple và Google đang là chủ đề của những báo cáo phát hiện ra khả năng lạm dụng các bản ghi âm được thu thập để cải thiện các trợ lý như Siri và Google Assistant. Vào tháng Tám năm 2019, Bloomberg tiết lộ rằng Amazon đã thuê nhân viên hợp đồng để chú thích hàng nghìn giờ âm thanh từ các thiết bị có trang bị Alexa, khiến công ty tung ra các công cụ cho người dùng để xoá nhanh dữ liệu được lưu trữ trên đám mây. Vào tháng Bảy, một bên thứ ba đã làm rò rỉ các bản ghi giọng nói của Google Assistant cho người dùng ở Hà Lan. Các bản ghi này có chứa dữ liệu nhận dạng cá nhân, như tên, địa chỉ và các thông tin riêng tư khác. Sau vụ rò rỉ đó, một cơ quan quyền riêng tư của Đức đã nhanh chóng ra lệnh cho Google ngừng thu thập dữ liệu giọng nói ở châu Âu để sử dụng cho việc đánh giá.

Về phần mình, Microsoft cho biết họ sẽ xoá một số thông tin cá nhân nhất định khỏi các clip thoại khi chúng được xử lý trên đám mây, bao gồm các chuỗi chữ cái và số có thể là số điện thoại, số an sinh xã hội và địa chỉ email. Hơn nữa, công ty cũng cho biết họ không sử dụng đánh giá viên con người để nghe các bản âm thanh thu thập từ tính năng nhận diện giọng nói trong các dich vụ dành cho doanh nghiệp của mình.

Quyền riêng tư ngày càng vượt ra khỏi phạm vi một câu hỏi triết học và trở thành yêu cầu tối thiểu trong kinh doanh. Luật pháp ở cấp tiểu bang, địa phương và liên bang được đặt ra nhằm mục đích làm cho quyền riêng tư trở thành một phần bắt buộc của quản lý tuân thủ. Hàng trăm dự luật đề cập tới quyền riêng tư về địa chỉ, an ninh mạng và vi phạm dữ liệu đang chờ được xử lý hoặc đã được thông qua ở 50 tiểu bang, vùng lãnh thổ của Hoa Kỳ và Đặc khu Columbia. Có thể nói rằng đạo luật toàn diện nhất trong số đó – Đạo luật Quyền riêng tư của Người tiêu dùng California – đã được ký khoảng hai năm trước. Đó là chưa kể đến Đạo luật về trách nhiệm giải trình và cung cấp bảo hiểm y tế (HIPAA), yêu cầu các công ty phải xin phép trước khi tiết lộ thông tin sức khoẻ cá nhân. Các quy định trong khuôn khổ quốc tế như Quy định chung về bảo vệ dữ liệu quyền riêng tư của Liên minh Châu Âu (GDPR) được đưa ra nhằm cung cấp cho người tiêu dùng quyền kiểm soát tốt hơn với việc thu thập và sử dụng dữ liệu cá nhân. 

Theo VentureBeat

Tin liên quan: