Sự phát triển mạnh mẽ của công nghệ thị giác máy tính đã đem lại rất nhiều ứng dụng cho machine learning trong ngành công nghiệp game, cụ thể là ở game thực tế ảo (VR game), đi kèm với nó là cách chúng ta chơi game, cũng như giao tiếp xã hội qua game. Chính vì vậy, ta hoàn toàn có thể khẳng định rằng, VR chính là tương lai của game.

Còn nếu bạn yêu thích các console game truyền thống (game dùng thiết bị điều khiển), thì AI vẫn có thể tăng tính tương tác và hòa nhập cho các trò chơi này theo rất nhiều cách khác nhau. Bài viết này sẽ liệt kê 5 dự đoán về tương lai của AI trong game, cũng như cách các phát triển về machine learning có thể hỗ trợ các nhà làm game tạo ra những tựa game thú vị hơn.

1. Công nghệ chuyển đổi văn bản thành giọng nói (TTS) và giọng nói nhân tạo giúp tạo hội thoại nói

Một lĩnh vực lớn trong phát triển game, thường tốn rất nhiều thời gian để thực hiện, là việc thu âm hội thoại nói. Thông thường, các nhà phát triển game sẽ phải tổ chức các buổi thử giọng để chọn diễn viên lồng tiếng, thu âm từng cảnh game, cũng như xử lý các bản thu âm này. Thậm chí, nhiều nhà phát triển còn sử dụng nhiều bản thu khác nhau cho các ngôn ngữ khác nhau – một công việc ngốn vô cùng nhiều thời gian trong quá trình phát hành. Quả nhiên, hội thoại nói làm game rất thú vị, các diễn viên lồng tiếng mang lại một trải nghiệm cá nhân, dễ liên tưởng hơn. Tuy nhiên, không phải hãng game nào cũng có đủ điều kiện để thuê diễn viên lồng tiếng.

Trước đây, các nhà làm game sẽ rất khó khăn mới có thể tạo được hội thoại nói cho game của họ, tuy nhiên, giờ đây mọi chuyện đã khác. Cụ thể, một công ty chuyên về giọng nhân tạo – Replica Studios, đã đưa ra một giải pháp hầu như hoàn hảo, bằng sử dụng các mạng nơ-ron phức tạp, được huấn luyện để bắt chước giọng người. Như vậy, bạn sẽ chỉ cần nhập văn bản cần nói để có được bản thu, thậm chí có thể lựa chọn cảm xúc tương ứng với văn bản đó.

Bạn có thể nghe thử một bản thu của Replica Studios trong link dưới đây. Hội thoại này đã minh họa âm thanh nhân tạo khi được áp dụng trong một game thật:

“Agartha” — Replica Studios

Thật khó để phân biệt giữa giọng trên và giọng người thật phải không nào? Có thể nói, giọng nhân tạo sẽ đóng một vai trò lớn trong sự phát triển của ngành công nghiệp game ở tương lai gần.

2. Chuyển đổi văn bản thành giọng nói (TTS), giọng nói nhân tạo, mạng nơ-ron tạo sinh giúp hội thoại trở nên sinh động

Tuy rằng điều này khó xảy ra trong tương lai gần, ta vẫn có thể hi vọng rằng các game thực tế ảo, hay thậm chí là console game thông thường sẽ trở nên dễ liên tưởng và sinh động hơn. Còn ở hiện tại, đa số các nhà phát triển game đều phải thuê người viết nội dung cho cốt truyện và hội thoại.

Cụ thể, trong các game nhập vai (RPG) như Skyrim hay The Witcher, người chơi sẽ được lựa chọn giữa các hội thoại có sẵn, nhưng trong tương lai, các hệ thống hội thoại trong game có thể trở nên thực tế hơn rất nhiều.

Ảnh chụp từ game The Elder Scrolls V: Skyrim. Nguồn: IGDB.com.

Trong một tương lai như vậy, thay vì gặp gỡ NPC và chỉ sử dụng các lựa chọn hội thoại có sẵn, người chơi sẽ có thể hỏi NPC bất cứ những gì họ muốn. Với mô hình chuyển đổi giọng nói thành văn bản (speech-to-text – STT), hệ thống sẽ chuyển đổi lời nói của người chơi thành văn bản, rồi sau đó xử lý văn bản này để lọc ra ý định và cảm xúc.

Tiếp đó, game sẽ sử dụng một mạng nơ-ron tạo sinh để NPC đưa ra được phản hồi thích hợp nhất, dựa trên các thông tin đã tiếp nhận, thay thậm chí là mang màu sắc tính cách mà NPC được lập trình để mô phỏng. Sau đó, phản hồi văn bản này sẽ được chuyển thành giọng nói thông qua một mô hình giọng nói nhân tạo TTS, và được gửi lại cho người chơi (tương tự như một cuộc trò chuyện thông thường). Về cơ bản, NPC sẽ hoạt động như một chatbot, chỉ khác là có tính trực giác và phản ứng tích cực hơn rất nhiều.

Ảnh chụp từ game The Witcher 3: Wild Hunt. Nguồn: IGDB.com.

Quy trình trên dường như rất phức tạp và bất khả thi, bởi lẽ nó sẽ tốn rất nhiều thời gian. Tuy nhiên, Replica Studios hiện đã và đang phát triển một API TTS, với khả năng chuyển hội thoại trong game thành giọng nhân tạo, trong vỏn vẹn vài giây đồng hồ.

Bản demo và thử nghiệm của API TTS này thật sự rất nhanh với hiệu quả đáng kinh ngạc, nhưng đáng tiếc thay, Replica Studios vẫn chưa công bố chúng. Nhưng một khi công nghệ này được phát hành, nó sẽ đem lại những ảnh hưởng to lớn lên ngành công nghiệp game, đặc biệt là với các đơn vị phát hành game indie, với ngân sách vô cùng hạn hẹp.

3. Công nghệ theo dõi chuyển động tay và găng tay haptic trong thực tế ảo VR

Machine learning cũng có thể cải tiến video game thông qua sự phát triển của công nghệ nhận diện cử chỉ tay và theo dõi chuyển động tay. Ở đây, theo dõi chuyển động tay (hand tracking) có nghĩa là khả năng nhận diễn và theo dõi chuyển động tay của headset VR thông qua các camera gắn trên thiết bị này. Vào khoảng đầu năm nay, Oculus đã phát hành chiếc Oculus Quest – một VR headset không dây có khả năng theo dõi chuyển động tay một cách toàn diện. Công nghệ hiện đang trong giai đoạn thử nghiệm, xong đã cho độ chính xác và hiệu quả vô cùng cao. Dự kiến, trong tương lai, công nghệ này sẽ được ứng dụng rộng rãi trong các VR game.

Ảnh chụp từ game Arizona Sunshine trên Oculus Quest. Nguồn: IGDB.com.

Tuy nhiên, các game sử dụng hand tracking lại khiến người dùng mất đi khả năng cảm thấy áp lực và độ rung khi chơi game. Cụ thể, khi chơi đầu game bắn zombie Arizona Sunshine, người chơi sẽ được cầm điều khiển – giống như một vũ khí, từ đó đem lại cảm giác như đang cầm súng thật và đang nã đạn thật thông qua độ rung của điều khiển. Do đó, để mang lại trải nghiệm game tốt nhất, cần kết hợp công nghệ hand tracking với găng tay haptic – những thiết bị mô phỏng áp lực và độ rung, giúp tạo ra cảm giác thực hơn. Trong tương lai, chúng ta sẽ được thấy nhiều phát triển hơn của hai công nghệ này, đặc biệt là ở trải nghiệm VR game.

4. Phân tích dữ liệu sâu sẽ thay đổi cơ chế chơi game và thiết kế cấp độ game

Fortnite: Battle Royale. Nguồn: epicgames.com.

Do văn hóa game đã xuất hiện nhiều bản cập nhật và bổ sung, các video game giờ đây có thể thay đổi rất nhiều, kể cả sau khi đã được phát hành chính thức. Tuy rằng có rất nhiều ý kiến trái chiều về xu hướng này thì vẫn có một sự thật không thể thay đổi: Với big data, các nhà phát triển game đã có thể thu thập nhiều quan điểm hơn, qua đó chỉnh sửa game phù hợp với người chơi hơn.

Một ví dụ điển hình cho điều này là Fortnite – game chiến đấu sinh tồn đã gây nên một làn sóng mới trên thế giới. Tuy rằng nhà phát hành game là Epic Games chưa bao giờ công khai chia sẻ về cách họ sử dụng phân tích dữ liệu sâu để đưa ra quyết định, song hệ thống của họ lại luôn phát hiện được các chi tiết như: người chơi dùng map nào nhiều nhất, skin nhân vật nào được yêu thích nhất, các vũ khí nào đang được sử dụng thường xuyên nhất. Có thể thấy, hành vi của người chơi có ảnh hưởng rất lớn tới quyết định của nhà phát hành game và điều này được thể hiện qua những thay đổi liên tục về map và vũ khí trong trò chơi Fortnite đình đám này.

5. Phân tích văn bản và cảm xúc trong những nhận xét về game

Ảnh: Animal Crossing: New Horizons.

Trong ngành công nghiệp game, phân tích văn bản còn được ứng dụng để phân tích các bình luận về game. Cụ thể, nhà phát hành có thể thu thập bình luận từ những trang như Metacritic và GameSpot, rồi từ đó thực hiện các phép phân tích để biết được người dùng đang nghĩ gì về một game cụ thể. Việc phân tích cũng thường bao gồm phân tích tần suất xuất hiện của một vài từ cụ thể, qua đó tổng hợp được các từ xuất hiện nhiều nhất trong các bình luận về game.

Việc phân tích này cũng có thể được tích hợp với công nghệ phân tích cảm xúc, tức là thông qua từ ngữ xuất hiện thường xuyên để biết được mức độ bình luận tích cực hay tiêu cực về game, qua đó tìm ra các điểm yếu và điểm mạnh để khắc phục và phát triển. Hãy lấy Animal Crossing: New Horizons (ACHN) làm ví dụ. Có thể thấy, trên Metacritic, các bình luận tiêu cực thường đi cùng với các từ như: “giới hạn”, “độc tài”, “hạn chế”; qua đó, nhà sản xuất thấy được người chơi không thích thiết kế game (xem Bảng 1). Với thông tin này, Nintendo sẽ có thể thực hiện các chiến dịch quảng bá khác, hay thậm chí là quảng bá game khác đối với nhóm người dùng trên trang này.

Bảng 1: Từ ngữ thể hiện cảm xúc tiêu cực.

Ngoài ra, việc phân tích văn bản cho bình luận, cũng có thể được phối hợp với chú thích văn bản trên các điểm đánh giá. Cụ thể, khi kết hợp điểm cảm xúc của từng bình luận với mức đánh giá tương ứng, ta sẽ hiểu được một cách chính xác suy nghĩ của người dùng về game, qua đó biết được họ thực sự thấy thích hay thấy thất vọng về một tựa game cụ thể. Mức độ quan tâm trên Google Search cũng có thể được sử dụng để đo lường mức độ quan tâm chung về game, cũng như phản hồi của người dùng. Trong trường hợp của ACNH, game được tìm kiếm nhiều kể từ tháng 1 năm 2020 (Bảng 2), song lại có đánh giá thấp trên Metacritic.

Bảng 2: Mức độ quan tâm về Animal Crossing trên Google Search.

Như vậy, ta có thể hiểu được những người viết bình luận, cũng như xem xét họ có phải đại diện cho nhóm người chơi chủ chốt của tựa game ACNH hay không.

Còn đối với các website đánh giá game, phân tích văn bản lại giúp họ nhận diện các từ khóa liên quan tới game, cụ thể là các từ thường xuất hiện trong bình luận của người dùng. Qua đó, các trang web có thể tích hợp các từ khóa này lên công cụ tìm kiếm trong trang, giúp người dùng có thể tìm kiếm game dễ hơn, thông qua các từ ngữ mang tính đại diện chính xác hơn.

Theo Becoming Human

Tin liên quan: