AI của DeepMind có thể biến hình phẳng thành cảnh 3D

97

DeepMind – công ty “chị-em” của Google có trụ sở tại Vương quốc Anh gần đây đã phát triển thành công một hệ thống trí tuệ nhân tạo có thể biến những hình ảnh 2D phẳng thành các cảnh 3D.

Các đột phá: Các nhà nghiên cứu AI đang nỗ lực để dạy cho máy móc cách nhận thức được như con người. Thay vì nhìn ngắm thế giới qua những điểm ảnh thì chúng quan sát môi trường xung quanh rồi tự đưa ra các giả định về nó. Ví dụ nếu thấy được ngực của một người, AI sẽ tự mặc định rằng họ cũng sẽ có lưng mặc dù không nhìn thấy phần cơ thể đó ở góc nhìn của mình.

Hoặc nếu bạn chơi ú òa với một đứa trẻ, nó sẽ biết rằng khuôn mặt bạn vẫn ở đó kể cả khi bạn lấy tay che mặt. Về cơ bản, đây là điều mà đội ngũ nhân viên ở DeepMind đã dạy cho AI của họ: Họ đã huấn luyện cho một hệ thống trí thông minh nhân tạo dự đoán hình dáng của đồ đạc, cảnh vật ở góc độ mà nó chưa từng nhìn thấy.

Cụ thể là, các nhà khoa học tại DeepMind đã phát triển ra Generative Query Network – một mạng neural network được thiết kế để dạy AI cách tưởng tượng ra đồ vật sẽ trông như thế nào từ một góc nhìn khác. AI sẽ phân tích hình ảnh 2D của cảnh rồi tự vẽ thêm các góc còn lại mà hình ảnh chưa thể hiện được. Điều đáng nói là trí thông minh nhân tạo của DeepMind không hề sử dụng các dữ liệu nhập hay kho kiến thức nào cả. Nó chỉ xem qua ít nhất 3 tấm hình 2D của cảnh rồi ngay lập tức dự đoán phiên bản 3D của cảnh sẽ ra sao.

AI của DeepMind sẽ phân tích hình ảnh 2D của cảnh rồi tự vẽ thêm các góc còn lại mà hình ảnh chưa thể hiện được

Để bạn đọc dễ hình dung, hãy coi quá trình này như việc chụp bức ảnh một khối rubic rồi yêu cầu AI tái tạo lại tấm hình từ một góc độ khác. Các yếu tố như ánh sáng hay đổ bóng sẽ thay đổi, cũng như các đường thẳng của khối rubic. Trí tuệ nhân tạo – nhờ sử dụng GQN, phải tự hình dung ra khối hộp sẽ như thế nào ở các mặt còn lại để có thể tạo ra hình ảnh 3D được yêu cầu của vật thể..

Các nhà nghiên cứu đang muốn AI có khả năng “nhận thức được toàn bộ khung cảnh mà không cần sự giám sát của con người.” Hiện tại, AI này vẫn chưa được luyện tập với hình ảnh của thế giới thật, vì vậy bước tiếp theo là AI sẽ render lại danh lam thắng cảnh đời thật từ ảnh.

Trong tương lai, hệ thống AI sử dụng GQN của Deepmind được kỳ vọng có thể tạo ra cảnh 3D gần như giống hệt với hình ảnh trong thế giới thực chỉ với các bức ảnh 2D.

Theo TheNextWeb

BÌNH LUẬN

Please enter your comment!
Please enter your name here