Các gã khổng lồ công nghệ chia sẻ gì tại sự kiện AI lớn nhất thế giới?

210

NeurIPS – hội nghị thượng đỉnh AI lớn nhất trong năm đã được tổ chức tại Montreal, Canada. NeurIPS thu hút 8300 người tham dự với 42 workshop và gần 4854 bài nghiên cứu được nộp, trong đó 1010 bài được chấp nhận.

Hội nghị hàng năm về Hệ thống xử lý thông tin nơ-ron là nơi gặp gỡ của các nhà nghiên cứu các mạng nơ-ron sinh học và nhân tạo; tại đây quy tụ các công trình nghiên cứu về trí tuệ nhân tạo (AI), thống kê và học máy. Trong những năm gần đây, NeurIPS đã là điểm đến của các chuyên gia hàng đầu từ gã khổng lồ công nghệ như Intel, Amazon, IBM, Nvidia, Google, Apple, Facebook, Tesla và Uber, Alibaba, Xiaomi…

Tại sự kiện, nhà khoa học tại Google Brain, ông Pallavi Baljekar đã cập nhật về cuộc thi Inclusive Images, giúp xây dựng hệ thống phân loại hình ảnh. Đây là nỗ lực của Google với sự hỗ trợ của cộng đồng nhằm giải quyết vấn đề thiên lệch (bias) trong hệ thống phân loại hình ảnh. Các nhóm tham gia vào cuộc thi sẽ sử dụng Open Images – tập dữ liệu được mở cho cộng đồng huấn luyện hệ thống dựa trên công nghệ trí tuệ nhân tạo. Google AI sử dụng một ứng dụng hướng dẫn người dùng chụp ảnh vật thể xung quanh và tạo ra các phụ chú sử dụng công nghệ học máy. Các phụ chú này được chuyển thành các nhãn hành động và đi qua lớp phân loại hình ảnh, được kiểm định bởi người thật. Bước kiểm tra này nhằm đảm bảo người trong ảnh chắc chắn được dán nhãn.

Một số mẫu hình ảnh dán nhã trong tập dữ liệu trong cuộc thi.

DeepMind, công ty thuộc sở hữu của công ty mẹ Google, đã tuyên bố rằng công trình nghiên cứu về AlphaZero – một hệ thống có khả năng tự học để đánh bại các nhà vô địch cờ vua, shogi và cờ vây thế giới đã được chấp nhận trên tạp chí khoa học. Công trình nghiên cứ được công bố tại NEURIPS lần này mô tả làm thế nào DeepMind chiến thắng các đối thủ bằng cách sử dụng các thuật toán như Stockfish, Elmo hay chiến thắng Deep Blue của IBM bằng cách sử dụng mạng nơ-ron sâu – các hàm toán học theo lớp mô phỏng hành vi của nơ-ron trong bộ não người, thay thế cho các quy luật do con người tạo ra.

Trong khi đó NVIDIA, công ty phần cứng khổng lồ chuyên sản xuất card đồ họa mới công bố tại NEURIPS rằng họ phát triển thành công một mẫu AI mới, có thể sử dụng video về thế giới thực của chúng ta để tạo ra những thế giới ảo tương tác được, với đồ họa tiên tiến. Theo NVIDIA, hệ thống AI mới có thể giảm chi phí phát triển môi trường ảo trong game và cả trong phim xuống rất nhiều. Dữ liệu các nhà nghiên cứu tại NVIDIA cho AI học là những đoạn video về ô tô đi xuyên qua thành phố đời thực. Sau đó phân tích từng khung hình xem có những gì (xe cộ, cây cối, nhà cửa) và dạy cho AI cách nhận biết từng sự vật đó.

Khi AI đã biết hình dáng những sự vật nó đã học, nó sẽ sử dụng dữ liệu đó để tự tạo nên thế giới của riêng mình. Tới thời điểm hiện tại, đội ngũ nghiên cứu tại NVIDIA tạo ra được một game lái xe đơn giản sử dụng thế giới do chính AI tạo ra.

IBM đã công bố kỹ thuật huấn luyện AI đột phá, phương pháp kỹ thuật số xử lý nhanh hơn 4 lần so với công nghệ tân tiến nhất hiện này và con chip với bộ nhớ đổi pha (phase-change). Mitch Jeffrey Welser, phó chủ tịch và giám đốc phòng thí nghiệm tại Nghiên cứu của IBM-Almaden, đã viết trong một bài đăng trên blog ”Các thế hệ ứng dụng sử dụng AI sắp tới sẽ cần thời gian phản hồi nhanh hơn với khối lượng công việc sử dụng AI lớn hơn và dữ liệu đa phương thức từ nhiều luồng hơn. Để khai thác trọn vẹn tiềm năng của AI, IBM đang thiết kế lại phần cứng với tư duy hướng AI: từ máy gia tốc đến phần cứng được xây dựng phục vụ cho các tác vụ có liên quan tới AI, như con chip mới và cuối cùng là điện toán lượng tử cho AI. Việc nhân rộng quy mô AI với các giải pháp phần cứng mới là một phần trong nỗ lực tổng thể của IBM Research để chuyển từ AI hẹp, thường được sử dụng để giải quyết các nhiệm vụ cụ thể, được xác định rõ ràng, đến AI rộng, giúp các con người giải quyết các vấn đề cấp bách nhất”

Cũng tại hội nghị, Intel tuyên bố rằng họ sở hữu HE-Transformer mã nguồn mở, một công cụ cho phép các hệ thống AI hoạt động trên dữ liệu nhạy cảm. Nó là hệ thống đằng sau nGraph, trình biên dịch mạng nơ-ron Intel, và dựa trên Thư viện số học được mã hóa đơn giản (SEAL), một thư viện mã hóa mà Microsoft Research cũng đã công bố dưới dạng mã nguồn mở vào tuần này.

HE là một kỹ thuật tương đối mới – nhà nghiên cứu IBM Craig Gentry đã phát triển sơ đồ kiến trúc HE đầu tiên vào năm 2009. HE cho phép việc tính toán trên các dữ liệu được mã hóa. Năng lực này khi ứng dụng vào học máy sẽ cho phép chủ dữ liệu có được các thông tin sâu mà không phải đưa ra ngoài các dữ liệu mà thay vào đó nó có thể giúp bảo vể mô hình bằng cách triển khai chúng dưới dạng mã hóa. Và như Boemer và Wierzynski lưu ý, thiết kế các mô hình AI sử dụng nó đòi hỏi chuyên môn không chỉ học máy mà còn mã hóa và kỹ thuật phần mềm. Boemer và Wierzynski nói rằng các phiên bản tương lai của HE-Transformer sẽ hỗ trợ nhiều mô hình mạng nơ-ron hơn.

Trong khi đó, Ruhi Sarikaya, giám đốc khoa học ứng dụng tại Alexa AI (Thuộc Amazon), đã trình bày chi tiết về cải tiến của Amazon trong lĩnh vực trí tuệ nhân tạo trong lĩnh vực hội thoại trong suốt năm qua. Ông cũng chia sẻ một số bước tiến trong mảng loa thông minh, TV, hộp giải mã và các thiết bị khác có hỗ trợ Alexa.

Ông Sar Saraya đã chia sẻ “Chúng ta đã có những tiến bộ đáng kể trong các hệ thống AI hội thoại trong thập kỷ này nhờ một phần lớn vào sức mạnh của điện toán đám mây, sự dồi dào của dữ liệu cần thiết để đào tạo các hệ thống AI và cải tiến thuật toán AI nền tảng. Những tiến bộ đáng kể của công nghệ học máy đã hiện thực hóa những điều này, cho phép các hệ thống như Alexa thực hiện theo yêu cầu của khách hàng bằng cách dịch lời nói thành văn bản, sau đó chuyển văn bản đó thành hành động.”

Hiện tại, Alexa dựa vào một số thông tin theo ngữ cảnh để hạn chế những yếu tố không rõ ràng, bao gồm hoạt động trong lịch sử tương tác, sở thích, bộ nhớ, xếp hạng và sử dụng và đánh giá kỹ năng của bên thứ ba. Để cải thiện độ chính xác hơn nữa, Amazon tuần này đã ra mắt một hệ thống tự học, giúp phát hiện ra những khiếm khuyết trong cách hiểu của Alexa và tự động sửa những lỗi này mà không cần sự can thiệp của con người bằng cách tận dụng các thông tin từ bối cảnh, cả ngầm định bên trong lẫn bên ngoài của khách hàng.

Alibaba, đối trọng với Amazon từ Trung Quốc đã cập nhật những thành tựu trong xây dựng sản phẩm trong thời gian qua. Theo Rong Jin, trưởng khoa của Viện Khoa học Dữ liệu Alibaba, cho biết. “AI cùng những đổi mới gần đây sẽ hỗ trợ giải quyết những thách thức. Một trong những thách thức đó là nhận dạng giọng nói trong môi trường có nhiều tiếng ồn, ví dụ như hệ thống tàu điện ngầm đông đúc hoặc trung tâm hội nghị với rất nhiều người tham dự”. Giải pháp của Alibaba tới một phần từ phần cứng, một phần từ phần mềm: microphone tầm xa và các thuật toán học sâu phức tạp giúp tách biệt giọng nói trong đám đông, làm giảm đáng kể tỷ lệ lỗi. So với độ chính xác 84%, công nghệ nhận dạng giọng nói “tốt nhất” chỉ có thể đạt được với một giọng, Alibaba khẳng định mô hình chính xác từ 94 đến 95%, ngay cả với những diễn giả có với giọng nặng tính địa phương. Hiện tại, nó đã được triển khai trong một phần của hệ thống bán vé tàu điện ngầm ở Thượng Hải, và Alibaba đang trong quá trình thương thảo để mang công nghệ này đến “thêm một số thành phố”.

Ngoài các hãng công nghệ nói trên, các chia sẻ khác cũng được cập nhật như Xiaomi với DeepExposure- hệ thống giúp phân một hình ảnh thành các hình ảnh khác, tất cả với một độ phơi sáng riêng. Hệ thống ứng dụng AI sử dụng các hình ảnh được phân chia ra đó để tạo ra bức ảnh với chất lượng tốt hơn trước khi kết hợp ảnh đó với ảnh gốc.

Năm ngoái, các nhà khoa học từ Nvidia đã gửi một bài nghiên cứu (Unsupervised Image-to-Image Translation Networks- mạng chuyển ảnh không giám sát). Mạng này có thể mô tả một hệ thống chuyển hình ảnh từ cảnh mùa đông sang cảnh mùa hè, hoặc một con báo đốm thành mèo nhà. Trong một cuộc chia sẻ, trưởng bộ phận khoa học của Google, ông John Platt đã thảo luận cách thức học máy có thể đẩy nhanh và tối ưu hóa nghiên cứu nhiệt hạch hạt nhân. Và David Silver của DeepMind , một nhánh của Google tiết lộ trong một phiên rằng AlphaZero, một mô hình AI đã đánh bại những người chơi hàng đầu trong bảng trò chơi Go, dễ dàng đánh bại Stockfish, một máy chơi cờ vua được được đánh giá rất cao, trong thể thức trận đấu 100 trận. Trong năm 2016, sự kiện đã có 5.000 người tham gia đăng ký. Năm ngoái, con số này là 8.000 người, thu hút những nhà khoa học, nghiên cứu hàng đầu thế giới.

Lê Hoàng

Tin liên quan:
  • 11
    Shares