Một thuật toán thử nghiệm không thuộc khuôn khổ nghiên cứu máy móc (Machine Learning) được gọi là nghiên cứu chuyên sâu (Deep Learning), thông qua việc tìm kiếm những đặc tính khác như hình thể, mái tóc, trang phục,…, có thể nhận diện khuôn mặt dưới dạng hình ảnh ngay cả khi khuôn mặt đó không lộ diện. YannLeCun, Giám Đốc nghiên cứu trí tuệ nhân tạo của Facebook (Facebook AI Research) bày tỏ mong muốn nghiên cứu nhận diện khuôn mặt không hiển lộ rõ ràng.
LeCun cho biết: “Chúng tôi sử dụng rất nhiều tín hiệu. Con người luôn sở hữu những phương diện đặc tính nhất định và đặc thù ngay cả khi bạn nhìn họ từ đằng sau. Ví dụ như bạn có thể nhận ra Mark Zuckerberg rất dễ dàng bởi anh ta luôn mặc một chiếc T-shirt xám.”
Mô hình nhận diện khuôn mặt không lộ diện được xây dựng với 2 bước cơ bản.
Bước 1: Phát hiện cục bộ
Hình 1. Phát hiện cục bộ
Tại bước này, mô hình họ sử dụng là một cấu trúc ConvNet định vị các bộ phận cơ thể. Dữ liệu đầu vào là một hình ảnh RGB của một hoặc vài người và đầu ra là một bản đồ nhiệt độ nhận định các vị trí kết nối quan trọng trên khung xương con người qua từng điểm ảnh. Mạng lưới của mô hình sẽ trượt qua hình ảnh ban đầu để xây dựng một bản đồ nhiệt độ chi tiết cho mỗi khớp xương trên cơ thể. Mô hình này của họ tiếp cận các đầu vào đa dạng về độ phân giải một cách khá chồng chéo. Ngân hàng phân giải bên trên xử lý cửa sổ đầu vào với độ phân giải 64×64 trong khi bên dưới xử lý mẫu đầu vào 128×128 được thu gọn thành 64×64.
Những hình ảnh đầu vào sau đó được tiêu chuẩn hóa độ phân giải địa phương (sau khi thu gọn mẫu với công nghệ chống vỡ hình ở ngân hàng phân giải bên dưới) để xây dựng một hình tương tự kim tự tháp Laplacian. Tác dụng của việc sử dụng những công đoạn chồng chéo này là cho phép mạng lưới quan sát được rộng hơn các phần của hình ảnh đầu vào mà chỉ phải tăng khối lượng xử lý lên một phần nhỏ. Vai trò của kim tự tháp Laplacian là cung cấp cho mỗi ngân hàng nội dung quang phổ không trùng lặp, tối thiểu hóa sự nhàn rỗi trong mạng lưới.
Bước 2: Mạng lưới bộ nhớ
Hình 2. Mạng lưới bộ nhớ
Sau khi nhận diện khuôn dạng cơ thể, bước này sẽ phát hiện đặc tính của từng phần như: màu tóc, trang phục,… Do thói quen và sở thích, con người luôn luôn có những đặc tính riêng biệt: cử chỉ, phong cách trang phục, kiểu tóc,… Đặc tính của họ được tìm hiểu và ghi chép trong mạng lưới bộ nhớ. Sau khi qua xử lý ở bước đầu tiên – nhận ra nơi bạn lộ diện – trong bước này, bạn sẽ được nhận diện bằng mạng lưới bộ nhớ.
Theo nghiên cứu của Facebook thực hiện qua việc chọn lọc 40000 bức ảnh trên Flickr – một số khuôn mặt có thể nhận diện, số khác thì không – mức độ chính xác lên tới 83%, một con số đáng ngạc nhiên. Những bước đột phá mới trong nhận diện này được ngụy trang như một phương tiện nhận biết con người trong các ứng dụng như Moments, mặc dù chưa thể kết luận kế hoạch Facebook dự định sẽ khai thác công nghệ phi thường này.
Trong trường hợp bạn cố tình che giấu khuôn mặt, thuật toán cải tiến của Facebook vẫn có thể biết bạn là ai, dù bạn có ý kiến gì đi chăng nữa. Trên thực tế, ngay từ khi bắt đầu bạn đã không thể giấu mình trên một mạng xã hội khổng lồ như Facebook. Tuy nhiên, triển vọng phát triển vượt bậc của công nghệ mà Facebook đầu tư này cũng không khỏi khiến người ta dè chừng.
Đặng Minh Đức – FPT Software
Tin liên quan: