Ứng dụng công nghệ (mà cụ thể ở đây là machine learning và AI) sẽ giúp việc sàng lọc nội dung trở nên dễ dàng hơn.

Facebook từ lâu đã muốn sử dụng AI để xử lý các tác vụ sàng lọc trên nền tảng mạng xã hội của mình, và mới đây đã thúc đẩy điều này thông qua động thái mới nhất: để machine learning đảm nhận chính việc sàng lọc nội dung trên Facebook.

Để hiểu rõ hơn, trước hết ta sẽ khái quát qua về quy trình sàng lọc nội dụng trên Facebook: Đầu tiên, các bài viết vi phạm (bao gồm các bài viết spam, có nội dung sỉ nhục, tấn công, hoặc cổ vũ bạo lực) sẽ bị đánh dấu bởi người dùng hoặc các bộ lọc machine learning. Sau đó, các bài vi phạm rõ ràng sẽ được xử lý một cách tự động (bài viết sẽ bị xóa hoặc tài khoản viết sẽ bị chặn), còn các bài còn lại thì sẽ được cho vào danh sách chờ để được xử lý bởi các nhân viên sàng lọc nội dung.

Hiện tại, Facebook có khoảng 15.000 nhân viên sàng lọc nội dung trên khắp thế giới. Tuy nhiên, các nhân viên này lại thường không được hỗ trợ đủ, và hay phải chịu sang chấn do môi trường làm việc. Công việc của họ bao gồm đọc và kiểm duyệt các bài viết bị đánh dấu vi phạm, sau đó quyết định xem bài viết có đúng là đã vi phạm các chính sách của Facebook hay không.

Trong quá khứ, tác vụ này thường được làm theo trình tự thời gian – tức các bài viết bị báo cáo trước sẽ được kiểm tra trước. Tuy nhiên, Facebook giờ đây lại muốn tập trung hơn vào các bài viết quan trọng, và đã sử dụng tới công nghệ machine learning để thực hiện điều này. Như vậy, trong tương lai có thể sẽ xuất hiện nhiều thuật toán machine learning giúp xử lý các bài viết trong danh sách chờ, đồng thời sắp xếp mức độ ưu tiên cho chúng bằng ba chỉ tiêu chính, đó là: mức độ phổ biến, mức độ nghiêm trọng, và khả năng vi phạm của bài viết.

Hệ thống sàng lọc cũ của Facebook sử dụng kết hợp các bộ lọc ML (machine learning) và báo cáo của người dùng. Ảnh: Facebook.
Hệ thống sàng lọc mới của Facebook, sử dụng machine learning để sàng lọc danh sách chờ, sau đó chuyển sang cho các nhân viên sàng lọc nội dung. Ảnh: Facebook.

Tuy rằng Facebook chưa tiết lộ cách tính các chỉ tiêu này, mạng xã hội này vẫn khẳng định rằng, mục tiêu của cơ chế mới là để ưu tiên xử lý các bài viết nghiêm trọng nhất. Theo đó, bài viết càng phổ biến (càng nhiều lượt xem và chia sẻ) hay nghiêm trọng, thì nó sẽ càng được xử lý nhanh hơn. Ngoài ra, Facebook cũng chia sẻ rằng, hãng tập trung hơn cả vào các bài viết có nội dung gây ảnh hưởng trực tiếp tới đời thực, như: khủng bố, lạm dụng trẻ em, tự hại… Trong khi đó, các bài viết có nội dung spam – gây khó chịu song lại ít ảnh hưởng – thì sẽ ít được ưu tiên hơn.

“Mọi bài viết vi phạm sẽ vẫn phải qua sàng lọc kỹ lưỡng bởi con người”

Mọi bài viết vi phạm sẽ vẫn phải qua sàng lọc kỹ lưỡng bởi con người, nhưng chúng tôi tin rằng, hệ thống mới sẽ còn làm quy trình sàng lọc hiệu quả hơn,” Ryan Barnes, giám đốc sản phẩm thuộc đội ngũ community integrity của Facebook, đã chia sẻ phát biểu trong một buổi họp báo.

Cũng trong buổi họp, Facebook đã chia sẻ một số chi tiết về công nghệ machine learning mà hãng ứng dụng trong quy trình sàng lọc nội dung cũ. Cụ thể, các hệ thống này bao gồm một mô hình có tên là  “WPIE” (viết tắt cho “whole post integrity embeddings”), với khả năng đánh giá nội dung một cách tổng thể.

Điều này có nghĩa là thuật toán sẽ đánh giá nhiều yếu tố trong một bài viết bất kỳ, rồi cố gắng hiểu một cách tổng thể mọi thành phần của bài viết như hình ảnh, chú thích, poster… Ví dụ: Nếu một bài viết ghi rằng họ đang bán “nguyên mẻ”, “đặc biệt”, kèm theo đó là hình ảnh bánh ngọt, thì hệ thống sẽ cố dự đoán sản phẩm được bán. Một số từ ngữ trong chú thích cũng có thể làm thay đổi đánh giá của hệ thống.

Facebook sử dụng rất nhiều thuật toán machine learning để sàng lọc nội dung, trong đó bao gồm công cụ đánh giá tổng thể WPIE. Ảnh: Facebook

Trong quá khứ, Facebook đã từng bị chỉ trích bởi hành vi sử dụng AI trong kiểm duyệt nội dung, bởi lẽ nhiều nhà phê bình tin rằng, trí tuệ nhân tạo AI không thể hiểu được bổi cảnh các bài viết tốt như con người. Điều này là đặc biệt đúng với các chủ đề như thông tin sai lệch, bắt nạt, và quấy rối, bởi lẽ máy tính hầu như không thể hiểu được những nội dung này.

Trước quan điểm này, Chris Palow, một kỹ sư phần mềm tại Facebook, lại cho rằng, tuy AI vẫn có những hạn chế nhất định, công nghệ này hoàn toàn có thể hỗ trợ loại bỏ những nội dung xấu. “Hệ thống này sẽ kết hợp AI và con người để giảm tỷ lệ sai, bởi lẽ chỉ AI thì không thể hoàn hảo được,” Palow bày tỏ.

Palow đã không trả lời khi được hỏi về tỷ lệ phân loại sai của các hệ thống machine learning của Facebook, song ông lại khẳng định rằng, Facebook chỉ cho phép ứng dụng các hệ thống tự động không giám sát khi chúng đạt tỷ lệ chính xác tương đương với con người. “Tiêu chuẩn để ứng dụng tự động là vô cùng cao,” ông nói. Tuy nhiên, cũng không thể phủ nhận rằng, Facebook vẫn đang ngày một ứng dụng AI nhiều hơn trong công tác sàng lọc nội dung.

Theo The Verge

Tin liên quan: