Được vận hành bởi các tiến bộ trong công nghệ AI, các hệ thống nhận dạng khuôn mặt đang mọc lên khắp nơi.

Mạng xã hội Facebook dùng chúng để đánh dấu (label) các bức ảnh được tải lên. Các điện thoại thông minh thế hệ mới có thể được mở khóa. Một số ngân hàng dùng chúng để xác nhận giao dịch. Siêu thị để kiểm tra xem có trẻ em mua bia rượu lậu không. Các bảng quảng cáo thông minh theo dõi phản ứng của khách hàng với nội dung đang quảng cáo. Bộ An ninh nội địa của Mỹ dự kiến công nghệ nhận dạng ảnh sẽ giúp nhận dạng 97% khách hàng bay ra nước ngoài vào 2023. Trung Quốc đã xây dựng một mạng lưới cameras nhận dạng khuôn mặt ở Tân Cương để kiểm soát. Nhiều đơn vị cảnh sát Anh đã thử nghiệm công nghệ này để phát hiện tội phạm trên đường phố.

Tuy nhiên các phản ứng trái chiều cũng đang tăng dần. Chính quyền nhiều thành phố của Mỹ, bao gồm San Francisco và Oakland, đã cấm các cơ quan công quyền như cảnh sát sử dụng công nghệ này. Ở Anh, nhiều thành viên nghị viện cũng đang kêu gọi ban hành các điều luật tương tự. Những người phản đối (Refuseniks) cũng bắt đầu tự bảo vệ bằng cách giấu khuôn mặt của họ trước cameras hay chiếu laser vào các cctv cameras công cộng như tại các cuộc biểu tình ở Hồng Kông gần đây để gây lóa. Trong khi đó, một số nhỏ đang các nhà bảo vệ quyền riêng tư cũng như một số nhà khoa học đang tìm cách tìm ra các phương pháp để chống lại công nghệ này.

Khuôn mặt là khuôn mặt nào

Nhận dạng ảnh dựa vào công nghệ Machine Learning, một phần của trí tuệ nhân tạo, trong đó máy tính sẽ tự học cách thực hiện các nhiệm vụ được giao mà không cần phải chỉ dẫn cụ thể. Trước tiên hệ thống sẽ được đào tạo với hàng ngàn những bức ảnh. Bằng cách thưởng khi nhận dạng đúng, và phạt khi sai, hệ thống có thể được dạy để phân biệt các bức ảnh có khuôn mặt và những bức ảnh không có khuôn mặt¹. Khi đã phân biệt được ảnh có mặt và ảnh không, hệ thống sẽ học cách phân biệt các khuôn mặt. Các chi tiết có thể khác nhau, nhưng về cơ bản thì các đặc điểm trên khuôn mặt đều sẽ được mô tả và lưu trữ một cách toán học, ví dụ như khoảng cách từ mũi đến các bộ phận khác, hay khoảng cách giữa hai mắt…

Trong các điều kiện thử nghiệm, các hệ thống như thế có thể cực kỳ chính xác. Một khảo sát của NIST – Cơ quan tiêu chuẩn của Mỹ, đã cho thấy là từ 2014 đến 2018 khả năng của các hệ thống khớp một khuôn mặt của một người so với hình ảnh lưu trong cơ sở dữ liệu đã tăng từ 96% lên 99%. Nhưng bởi vì máy tính tự học cho nên cách nhận dạng của nó không giống con người. Và sẽ có một số “lỗ hổng” có thể được lợi dụng để chống lại chúng.

Ví dụ năm 2010, một nghệ sỹ và nhà nghiên cứu người Mỹ tên là Adam Harvey trong bài luận án cao học của mình đã tạo ra một phong cách make-up được đặt tên là “cv (Computer Vision) Dazzle”, nhằm chủ yếu để đánh lừa các hệ thống nhận dạng khuôn mặt tự động. Các kỹ thuật như màu sắc sặc sỡ, độ tương phản cao, đánh bóng đa cấp độ, trang điểm bất đối xứng được sử dụng để đánh lừa thuật toán nhận dạng, không biết đó là khuôn mặt hay không. Với con người thì vẫn rõ ràng là một khuôn mặt, nhưng với máy tính, ít nhất là với các thuật toán mà anh Harvey nhắm tới, thì sẽ khá rối.

Make-up quá nổi làm máy tính bối rối nhưng dễ gây chú ý quá mức. HyperFace là một dự án mới của Harvey. Trong khi cv Dazzle nhằm thay đổi khuôn mặt, thì HyperFace tìm cách ẩn nó sau rất nhiều khuôn mặt giả. Nó sử dụng các hình khối bán trừu tượng được thiết kế để nhìn giống với khuôn mặt nhất đối với các hệ thống nhận dạng. Ý tưởng là giấu khuôn mặt thật trong một biển các khuôn mặt giả. Quần áo thiết kế kiểu này, với các đường nét và khối các điểm tối nhìn giống miệng hay đôi mắt, hiện đã được bày bán.

Một ý tưởng kín đáo hơn được đề xuất bởi các nhà nghiên cứu của đại học Trung Hoa, HK, đại học Indiane Bloomington và hãng công nghệ Alibaba trong một bài nghiên cứu năm 2018. Họ làm những chiếc mũ bóng chày được trang bị với các đèn LED chiếu các tia hồng ngoại lên khuôn mặt người đội mũ. Rất nhiều các cameras sử dụng trong các hệ thống nhận dạng mặt khá nhạy cảm với các tia trong phổ hồng ngoại trong khi mắt người thì lại không nên tia hồng ngoại rất phù hợp để che các nét mặt.

Khi thử với hệ thống FaceNet, hệ thống nhận dạng của Google, các nhà nghiên cứu nhận thấy rằng với một lượng chiếu hống ngoại vừa đủ họ có thể làm cho hệ thống hoàn toàn không nhận ra đây là một khuôn mặt. Các phương án đánh lừa tinh vi hơn cũng hoàn toàn có thể. Bằng cách tìm các khuôn mặt mà miêu tả toán học của chúng gần giống với một khuôn mặt của một đồng nghiệp, và điều chỉnh các điốt một cách thích hợp, họ có thể đánh lừa FaceNet trong 70% trường hợp là khuôn mặt của người đồng nghiệp chính là một khuôn mặt của người khác trong tập hợp các khuôn mặt gần giống kia.

Đào tạo một thuật toán để đánh lừa một thuật toán khác được gọi là Adversarial Machine Learning. Đây là một phương pháp hiệu quả, tạo ra các hình ảnh gây hiểu lầm với máy tính nhưng lại rất dễ nhận ra bởi con người. Một bài nghiên cứu năm 2016 bởi các nhà nghiên cứu của đại học Carnegie Mellon, và đại học North Carolina đã trình bày một số mẫu thị giác (Visual Pattern) trừu tượng vô thưởng vô phạt khi được in ra giấy và gắn vào khung mắt kính, cũng có thể làm cho một hệ thống nhận dạng nhầm một nhà nghiên cứu AI nam giới thành nữ diễn viên Hollywood Milla Jovovich.

Trong một bài báo tương tự, trình bày ở một hội nghị về Computer Vision vào tháng 7, một nhóm nghiên cứu của đại học Công giáo Leuven, Bỉ, đã trình bày phương pháp đánh lừa một hệ thống nhận dạng người (Person Recognition) chứ không chỉ nhận dạng mặt. Họ miêu tả một mẫu (Pattern) hình vuông 40cm được thuật toán tạo ra. Khi thử, chỉ cần giơ cao một tấm bìa với mẫu này in ở trên cũng có thể làm cho một người biến mất hoàn toàn trước một hệ thống máy tính nhận dạng người, mặc dù vẫn thấy rõ đối với một người bảo vệ.

Như bản thân các nhà nghiên cứu thừa nhận, các phương pháp đều có hạn chế. Đặc biệt là chúng thường được thiết kế để chống lại một loại thuật toán nhất định. Vì thế khả năng sử dụng không rộng. Nhưng theo anh Harvey, may mắn là mặc dù các hệ thống nhận dạng đang được sử dụng rộng rãi hơn, chúng vẫn chưa phủ hết và cũng chưa hoàn hảo. Một nghiên cứu của đại học Essex, công bố vào tháng 7, đã báo cáo kết quả một thử nghiệm của cảnh sát Lôn-đôn với hệ thống nhận dạng, trong 42 trường hợp hệ thống phát hiện thì chỉ có 8 trường hợp chính xác. Ngay cả ở Trung Quốc, chỉ một phần nhỏ cctv cameras là có đủ độ phân giải cho các hệ thống nhận dạng. Các biện pháp phòng chống low-tech cũng rất hiệu quả. “Ngay cả các việc nhỏ như mặc áo cổ lọ, đeo kính râm hay nhìn vào điện thoại cũng có thể có ích cho bạn” anh Harvey cho biết.

[1] Đoạn này có thể không chính xác.  Theo hiểu biết của người dịch thì về cơ bản các hệ thống này được dạy dựa trên các dữ liệu được đánh dấu có phải khuôn mặt hay không (supervised learning) chứ không phải dựa trên cơ chế thưởng phạt (reinforcement learning).

Xem thêm bài viết tại ĐÂY.

Dịch giả: Nguyễn Thành Lâm
Theo Amatech.funix

Tin liên quan: