Chỉ bằng một tấm ảnh đã có thể làm giả video với deepfake AI của Samsung

302

Làm giả tới cả… Mona Lisa? Một phòng nghiên cứu của Samsung tại Nga đã tạo ra công nghệ AI có thể làm video giả chỉ với một hình ảnh, hay thậm chí là tranh vẽ.

Nguồn ảnh: Egor Zakharov

Hãy tưởng tượng, bạn chỉ cần một bức ảnh đại diện trên facebook, chạy một phần mềm, và có được video người trong ảnh đang thực hiện bất cứ hành động gì dựa trên một video khác? Nghe bất khả thi nhưng hiên nay đã hoàn toàn có thể với công nghệ deepfake mới được phát triển bởi Samsung.

Deepfake là một dạng video giả cho thấy một người đang thực hiện những hành động họ chưa từng làm, và yêu cầu một kho dữ liệu ảnh chi tiết để mô phỏng chân thực nhất. Tuy nhiên, trí tuệ nhân tạo mới của Samsung chỉ cần một bức ảnh duy nhất để tạo ra những video này.

Công nghệ trong nghiên cứu mới nhất từ phòng nghiên cứu AI của Samsung tại Nga này có thể được sử dụng để giải trí, bằng cách cho các bức tranh kinh điển như Mona Lisa cử động. Song, Hany Farid, một nhà nghiên cứu tại Dartmouth về thẩm định đa phương tiện, chuyên phát hiện video deepfake cho rằng công nghệ này có thể sẽ bị sử dụng cho những mục đích xấu như lan truyền thông tin sai lệch, gian lận bầu cử, và lừa đảo.

Farid phát biểu: “Theo những gì chúng tôi đã chứng kiến, càng ngày những công nghệ này càng cần ít dữ liệu để tạo ra những video trông giống thật và đáng tin hơn.” Ông cho rằng, cho dù vẫn có những điểm không thực trong các video, “những video này sẽ dẫn tới những kỹ thuật tiên tiến hơn, và rồi chúng ta sẽ có những nội dung mà không thể phân biệt được thật giả nữa.

Nếu photoshop có thể làm bất cứ một bức hình nào trông thật, thì phần mềm deepfake có thể sử dụng học máy để làm như vậy với video. Đương nhiên, kỹ thuật chỉnh sửa video đã tồn tại từ lâu, nhưng deepfake đã khiến việc này dễ dàng hơn, cũng như khó bị phát hiện hơn. Một video deepfake hoạt động như một con rối máy, chỉ cần lắp vào một khuôn mặt, và nó sẽ cử động như thật với khuôn mặt đó.

Có cả một kho deepfake cho mục đích giải trí: khuôn mặt cử động của Mona Lisa, mặt của Nicholas Cage trong những bộ phim mà diễn viên này chưa từng đóng. Song, deepfake cũng có thể trở nên nguy hiểm, khuôn mặt của bạn có thể bị ghép vào những thước phim người lớn cho mục đích bôi nhọ cá nhân.

Để có thể tạo ra những video deepfake, phần mềm thường cần một kho dữ liệu ảnh chi tiết. Tuy nhiên, trí tuệ nhân tạo mới của Samsung chỉ cần một bức ảnh duy nhất để tạo ra những video giả này. Ảnh: Egor Zakharov

Trong nghiên cứu, phòng phát triển trí tuệ nhân tạo của Samsung đã gọi công nghệ này là “realistic neural talking heads” (đầu biết cử động với hệ thần kinh mô phỏng thật). Trong đó, thuật ngữ “talking heads” này chỉ những video được tạo ra, còn “neural” chỉ hệ thần kinh của phần mềm – Một dạng học máy mô phỏng não bộ.

Với các nhà nghiên cứu, công nghệ sẽ tạo ra những đột phá lớn trên nhiều lĩnh vực, như game và phim ảnh: “Nó mang lại năng lực mô phỏng thực tiễn, và có thể được sử dụng cho các hội thảo từ xa, game nhiều người chơi, và ngành công nghiệp kỹ xảo.”

Thông thường, để có thể mô phỏng một khuôn mặt cử động, bạn cần phải “huấn luyện” AI với một lượng dữ liệu chi tiết, bao gồm rất nhiều hình ảnh của một người. Vì vậy, deepfake thường được sử dụng với người nổi tiếng, chính trị gia, cầu thủ… những người có rất nhiều hình ảnh được công bố ra bên ngoài.

Hệ thống của Samsung khác biệt ở chỗ nó tập trung vào khâu chuẩn bị, hơn là thực hiện. Trong đó, việc chuẩn bị bao gồm một quá trình “meta-learning” kéo dài, khi AI tập trung xem các video để “học” theo biểu cảm. Sau đó, hệ thống sẽ áp dụng những gì “học” được lên một bức ảnh, từ đó tạo ra một video giả.

Những video này vẫn chưa thể giống người thật hoàn toàn: một video mô phỏng Marilyn Monroe đã sao chép thiếu nốt ruồi đặc trưng của nữ minh tinh, theo như Siwei Lyu, giáo sư chuyên ngành Tin học, chuyên gia về giám định hình ảnh và học máy tại Đai học Albany, New York. Ngoài ra, hệ thống của Samsung vẫn lưu giữ một số đặc điểm của bản gốc, được thể hiện qua sự khác nhau giữa 3 gương mặt Mona Lisa trong 3 video.

Một hệ thống deepfake thông thường sẽ cố gắng loại bỏ những lỗi ảnh. Để đạt được điều này, cần có một hệ dữ liệu đầy đủ của cả video gốc lẫn mục tiêu làm giả.

Lyu cũng tin rằng Samsung đang đi đúng hướng trong quá trình phát triển công nghệ này, do việc “meta-learning” kỹ lưỡng sẽ giảm bớt thời gian để “tái huấn luyện” AI khi thay đổi mục tiêu mô phỏng. “Nó giúp tiết kiệm thời gian, và tạo ra một mô hình quy chuẩn cho các mô phỏng khác,” bà phát biểu.

Công nghệ deepfake vẫn có thể đột phá xa hơn nữa, và chẳng mấy chốc, công nghệ của Samsung sẽ trở nên phổ biến rộng rãi.

Có thể thấy, Samsung đang cố gắng để khắc phục những lỗi hình ảnh trong tương lai. Tuy nhiên, đây cũng là một nỗi lo lớn, bởi lẽ khuôn mặt của chúng ta giờ có thể đang bị mô phỏng thực hiên bất cứ một hành động nào.

 Theo Joan E. Solsman

Tin liên quan: