Kỷ nguyên số đang ngày một xóa nhòa ranh giới giữa thế giới thực và ảo. Song hành với sự phát triển của các video, hình ảnh ảo là khả năng truyền bá thông tin thông qua những người nổi tiếng “ảo” nhờ công nghệ Deepfake. Tuy nhiên, Deepfake cùng với AI có thể hỗ trợ doanh nghiệp thay đổi phương thức tiếp cận khách hàng trên toàn cầu.

Ảnh: Synthesia.

Các avatar giáo dục ảo có thể giúp tăng tương tác cũng như cải thiện khả năng ghi nhớ thông tin trong các lớp học số. Hiểu được điều này, Synthesia – một công ty sản xuất video AI, đã hợp tác với các khách hàng trong nhiều lĩnh vực khác nhau, nhằm thay đổi phương thức huấn luyện, giáo dục, phát tán thông tin… tại các tổ chức và doanh nghiệp.

Chia sẻ thông tin trong kỷ nguyên đa phương tiện ảo

Vào năm 2019, một video tuyên truyền bệnh sốt rét đã gây bão trên Internet do xuất hiện deepfake của David Beckham. Mở đầu video, Beckham ngồi xuống ghế, trên bàn là bánh mì nướng, mứt và một cốc nước cam. Nhưng sau đó, anh đột ngột đọc kịch bản tuyên truyền bằng tiếng Anh và 8 ngôn ngữ khác, từ Kinyarwanda tới Yoruba.

Video này đã sử dụng nền tảng video AI của Synthesia. Cụ thể, Synthesia quay cảnh người xuất hiện trên video, rồi sử dụng quy trình Native Dubbing để tích hợp âm thanh từ diễn viên lồng tiếng. Sau đó, nền tảng này sẽ tích hợp đoạn âm và các biểu cảm tương ứng lên video gốc, tạo thành deepfake với đối tượng được quay ban đầu.

Nhìn chung, các video được tổng hợp bởi Synthesia đều rất ấn tượng, dù đôi lúc vẫn xuất hiện các điểm không khớp giữa khẩu hình trên video so với âm thanh. Theo Tiến sỹ  Steve Joordens – Giáo sư triết học tại Đại học Toronto, sự không hoàn hảo này lại có lợi cho việc Marketing. “Một chút sai sót trong video thương mại hoặc tuyên bố dịch vụ công (PSA), sẽ thu hút nhiều sự chú ý hơn. Bởi lẽ mọi người sẽ quan sát nó kỹ hơn, đặc biệt là khi có yếu tố bất ngờ, trong trường hợp này là David Beckham đột nhiên nói nhiều thứ tiếng,” Joordens nói.

Các doanh nghiệp cũng có thể ứng dụng nền tảng này cho rất nhiều mục đích, từ cung cấp các trải nghiệm ‘nhập môn’ cho nhân viên mới tới thực hiện đào tạo số thông qua avatar AI. Công nghệ này sẽ đem lại nhiều lợi thế hơn so với các video được sản xuất thông thường.

Khi quay một video thông thường với người thật, bạn sẽ phải viết kịch bản, thuê diễn viên, thuê studio, người làm âm thanh, quay dựng, xử lý hậu kỳ… Còn với AI, chúng tôi đã số hóa quy trình sản xuất video, cho phép người dùng tạo video dài từ 5 tới 10 phút, mà không cần tới máy quay, diễn viên hay studio,” Victor Riparbelli, CEO kiêm đồng sáng lập Synthesia chia sẻ.

Ngoài các lợi thế tiết kiệm thời gian lên kế hoạch và tối giản khâu hậu cần, sản xuất video với AI cũng có chi phí rẻ hơn so với thông thường. Quay một video bình thường cho doanh nghiệp có thể tốn tới 5.000 USD, đồng thời cần nhiều thời gian và khả năng quản lý dự án. Trong khi đó, công nghệ của chúng tôi chỉ tính 2.000 tới 3.000 USD cho mỗi video mà ai cũng có thể làm trên trình duyệt thông thường, chỉ trong vài phút,” Riparbelli khẳng định.

Riparbelli cho rằng, có rất nhiều doanh nghiệp muốn sản xuất video, song lại không thể thực hiện vì lí do chi phí và thời gian. Tuy nhiên, những công nghệ mới đã giúp họ giải quyết được bài toán này.

Có một sự chênh lệch rất lớn giữa số lượng video mà các doanh nghiệp muốn làm và số lượng mà họ đủ điều kiện để làm. Đây không chỉ là vấn đề tiền bạc, mà còn là về thời gian và độ khó. Chúng tôi đang nỗ lực thu hẹp khoảng cách này bằng cách giúp mọi người dễ dàng làm video AI trên trình duyệt,” Riparbelli nói.

Ảnh: Synthesia.

Trong quá khứ, rất nhiều công ty sử dụng văn bản để phát tán thông tin nội bộ doanh nghiệp. Nhưng giờ đây, họ có thể tải các tài liệu này lên nền tảng tạo video của Synesthesia, rồi chuyển những văn bản đó thành một video trực quan sinh động với AI. Những tài liệu cũng trở nên hấp dẫn hơn, một nghiên cứu đã chỉ ra rằng hình ảnh thường thu hút hơn và giúp mọi người ghi nhớ được nhiều thông tin hơn so với văn bản.

Ngoài ra, năng lực đa ngôn ngữ được thể hiện trong video cũng cho phép các công ty tương tác tốt hơn với thị trường toàn cầu. Từ đó, doanh nghiệp có thể thu hút các đối tượng cụ thể bằng ngôn ngữ bản địa của người xem.

Sản phẩm của chúng tôi có khả năng tổng hợp video trực tiếp từ văn bản, vì vậy mọi người có thể dễ dàng dịch nội dung sang 39 thứ tiếng khác nhau được hỗ trợ trên nền tảng. Các khách hàng của chúng tôi đa số đều thuộc Fortune 1000 và họ thường tạo các tài liệu gốc bằng tiếng Anh, rồi thực hiện dịch tự động sang 10 thứ tiếng khác,” Riparbelli chia sẻ.

Ngoài khả năng đa ngôn ngữ, người dùng cũng có thể dễ dàng tùy chỉnh chi tiết và linh hoạt các video tổng hợp. Khác với những quy trình sản xuất truyền thống mà sản phẩm cuối không thể thay đổi, nền tảng của Synthesia cho phép người dùng thoải mái thay đổi dữ liệu sao cho phù hợp với từng cá nhân khác nhau.

Một ví dụ là WPP đã tạo khóa học cho 100.000 nhân viên của mình. Thông qua hệ thống CRM của họ, chúng tôi biết được tên, chức vụ, vai trò, bộ phận, thâm niên làm việc và thậm chí là vị trí làm. Những dữ liệu này sẽ được tích hợp tự động vào video, và như vậy, mỗi nhân viên có một video khác nhau được làm riêng cho họ,” Riparbelli nói.

Tương lai của công nghệ video ảo: bản tin AI, avatar giáo dục, và rất nhiều ứng dụng khác

Công nghệ này cũng có rất nhiều tiềm năng trong các lĩnh vực khác. Cụ thể, các hãng tin có thể tận dụng nền tảng này để tạo ra các bản tin mà chỉ cần tới kịch bản và avatar AI. Theo Riparbelli, một khách hàng của hãng cũng đang sử dụng nền tảng này để tạo ra các người thuyết trình AI ảo, nhằm tăng cường trải nghiệm học từ xa.

Nếu bạn là giáo viên, bạn có thể quay lại bản thân trong 5 phút, gửi video cho chúng tôi, và tự biến mình thành một người thuyết trình AI,” Riparbelli chia sẻ.

Ông cũng khẳng định rằng, khi học viên tham gia lớp học, avatar AI này sẽ có thể tương tác với họ, cũng như đưa ra các phản hồi cá nhân hóa hoặc cụ thể hóa theo nội dung bài học.

Ảnh: Synthesia.

Chúng ta đang ở trong kỷ nguyên của việc học từ xa, các giáo viên trên toàn thế giới cũng cần nhanh chóng biến đổi giáo trình của họ sao cho thích hợp với nền tảng số. Joordenschia sẻ rằng, ông cùng đồng nghiệp đã sử dụng các kỹ thuật mới để tạo ra những bài giảng hấp dẫn xuyên suốt đại dịch. Một số ví dụ bao gồm: chia các bài giảng dài thành các bài ngắn hơn, bổ sung video, hình ảnh, và nhiều yếu tố khác để tăng tương tác, tạo ra các nội dung dễ tiếp cận hơn,…

Tôi nói với rất nhiều đồng nghiệp của mình rằng…học sinh sẽ không lắng nghe một người nói suốt 2 tiếng đồng hồ, nhất là khi chúng còn thấy đầy rẫy những thông báo trên Internet,” Joordens khẳng định.Theo tôi, chúng ta nên thành thạo việc sử dụng video, biết cách sử dụng chúng đúng cách, và học hỏi từ những marketer và nhiều người khác có kinh nghiệm trong việc sử dụng chúng.”

Riparbelli chia sẻ rằng, anh muốn dùng nền tảng Synthesia để có thể chia sẻ thông tin rộng rãi hơn tới nhiều người hơn bởi nhiều người không hề muốn đọc sách báo, mà sẽ thích thú hơn với việc tiếp nhận thông tin qua video. Đa số thông tin của thế giới hiện tại là ở dạng văn bản, nhiệm vụ của chúng tôi là chuyển hóa tất cả các văn bản này thành các video ngắn. Chúng tôi tin rằng, điều này sẽ giúp nhiều người trên thế giới học được nhiều kiến thức hơn, bất kể ngôn ngữ họ đang sử dụng,” Riparbelli bày tỏ.

Độc giả đừng quên tham gia cuộc thi Tech Sharing ngay hôm nay để chia sẻ những kiến thức về Trí tuệ nhân tạo, những bài toán khoa học về Trí tuệ nhân tạo đã và đang được nghiên cứu, ứng dụng thành công trong hoạt động của doanh nghiệp; và nhận về nhiều phần thưởng tiền mặt hấp dẫn. Thông tin chi tiết xem tại đây.

FPT Tech Sharing #1: Pitching AI for business

  • Thời hạn nhận bài: từ 12/08/2020 đến 25/09/2020

  • Tác giả gửi bài dự thi tại đây. Tiêu đề file ghi rõ: Tech Sharing – Họ và tên.

  • Mọi thắc mắc xin vui lòng liên hệ Ms. Thảo My: 0363 626 569 – Email: [email protected].

Theo Tech Republic

Tin liên quan: