Một chương trình có khả năng tự động hóa phát triển web, một bot có thể viết thư không khác gì con người, một blog nổi tiếng trên Hacker News được viết bởi Trí tuệ nhân tạo (AI),… tất cả những câu chuyện trên đều đang nói về GPT-3, thiết bị mới nhất của phòng nghiên cứu AI đình đám OpenAI. GPT-3 là mô hình ngôn ngữ lớn nhất từ trước tới nay, và đã dấy lên rất nhiều tranh luận xoay quanh cách mà AI sẽ thay đổi nhiều nền công nghiệp.

Greg Brockman (bên trái) – CTO của OpenAI, và Sam Altman (bên phải) – CEO của OpenAI. Ảnh: TechCrunch.

Tuy nhiên, chúng ta lại ít bàn tới những thay đổi mà GPT-3 đã mang lại cho chính OpenAI. Cụ thể, trong quá trình chế tạo ra hệ thống xử lý ngôn ngữ tự nhiên thành công nhất tính tới hiện tại, OpenAI đã biến đổi từ một phòng nghiên cứu AI phi lợi nhuận thành một công ty cung cấp dịch vụ AI.

Chuyển biến này phần nào đang đi ngược lại với sứ mệnh mà OpenAI từng đề ra tại thời điểm thành lập.

Những thay đổi về mặt cấu trúc

Vào hồi tháng 3 năm 2019, OpenAI chính thức tuyên bố sẽ chuyển hóa từ phòng nghiên cứu phi lợi nhuận thành một công ty sinh lời. Sự kiện này đã thu hút nhiều khoản đầu tư từ cá nhân và các công ty công nghệ lớn, với hi vọng rằng họ sẽ thu lời gấp 100 lần so với số vốn bỏ ra.

Nhưng tại sao OpenAI lại quyết định thay đổi cấu trúc? Công ty đã chia sẻ trong một bài viết rằng: Nước đi này nhằm “tăng đầu tư  nhanh chóng vào nhân tài và năng lực máy tính, đồng thời thực hiện kiểm soát và cân bằng việc nghiên cứu, hiện thực hóa sứ mệnh mà chúng tôi đã đề ra.”

Có thể thấy, từ khóa chính ở đây là “nhân tài và năng lực máy tính”.

Chi phí cho nhân tài và năng lực máy tính là hai trong số rất nhiều vấn đề chủ chốt của việc nghiên cứu AI. Số lượng nhân lực đủ tiêu chuẩn để thực hiện các nghiên cứu tại OpenAI là rất nhỏ. Trong khi đó, AI thương mại đang ngày một trở nên phổ biến, và các công ty công nghệ lớn sẽ sớm phải cạnh tranh để tuyển mộ được nhân lực cho các dự án của họ. Điều này đã dẫn tới một cuộc đua về mức lương, thưởng và chính sách trong các công ty này nhằm thu hút nhân tài.

Google và Facebook đã lần lượt chiêu mộ được Geoffrey Hinton và Yann LeCun, hai trong số ba người tiên phong ở lĩnh vực Deep Learning. Ian Goodfellow, một nhà nghiên cứu AI lớn kiêm nhà phát minh ra mạng GAN (Generative Adversarial Network) thì hiện đang làm việc tại Apple. Một thiên tài AI khác là Andrej Karpathy lại đầu quân cho Tesla.

Việc nghiên cứu khoa học và học thuật vẫn chưa bao giờ giảm sức hút, nhưng với tình trạng đa số nhân lực ngành AI đang đổ về các công ty với mức lương thưởng cao, thì các phòng nghiên cứu AI phi lợi nhuận lại rất khó để thu hút nhân tài, trừ khi họ cũng có thể đưa ra mức lương tương ứng.

Theo một bài viết trên tờ New York Times được đăng tải vào năm 2018, một số nhà nghiên cứu tại OpenAI kiếm được hơn 1 triệu USD mỗi năm. Trong khi đó, vào cùng năm, DeepMind – một phòng nghiên cứu AI khác trả hơn 483 triệu USD cho tổng cộng 700 nhân viên của mình.

Chi phí cho việc nghiên cứu AI lại càng được độn lên do các yêu cầu về năng lực máy tính ở các mạng nơ-ron nhân tạo, với thành phần chính là các thuật toán Deep Learning. Cụ thể, trước khi đạt hiệu quả, các mạng nơ-ron này cần được huấn luyện qua rất nhiều ví dụ, đây là một quy trình vô cùng đắt đỏ. Trong những năm gần đây, OpenAI đã thực hiện rất nhiều dự án AI với chi phí khổng lồ như: Cánh tay robot chơi Rubik, robot chơi game đánh bại các game thủ hàng đầu trong trò Dota 2 và một nhóm AI có thể chơi trốn tìm 500 triệu lần.

Các nhà khoa học ước tính việc huấn luyện GPT-3 sẽ “ngốn” ít nhất là 4,6 triệu USD. Đồng thời, việc huấn luyện các mô hình Deep Learning cũng chẳng hề đơn giản: ta phải thử nhiều biện pháp khác nhau, chỉnh sửa nhiều tham số dẫn tới chi phí bị đội lên nhiều lần.

OpenAI cũng không phải là phòng nghiên cứu AI đầu tiên quyết định thực hiện thương mại hóa. Để giải quyết các vấn đề tương tự, DeepMind cũng đã chấp nhận thương vụ bán lại cho Google với mức là là 650 triệu USD trong năm 2014.

Những thay đổi trong bộ máy lãnh đạo

Sam Altman, CEO kiêm đồng sáng lập OpenAI. Ảnh: TechCrunch.

OpenAI bắt đầu tiến trình thương mại hóa dưới quyền của Sam Altman – một đồng sáng lập của tổ chức, người đã từ bỏ vai trò chủ tịch tại startup Y Combinator để về đảm nhận chức vụ CEO tại OpenAI.

Gương mặt đại diện cho OpenAI trước Altman là Greg Brockman, một kỹ sư và nhà khoa học kỳ cựu, cũng là đồng sáng lập kiêm CTO của tổ chức này.

Tuy nhiên, ở thời đại của việc đầu tư công nghệ, danh tiếng và kỹ năng quản lý sản phẩm lại quan trọng hơn rất nhiều so với tri thức khoa học. Chính vì vậy, Altman mới là người dành được lòng tin của nhà đầu tư. Trong quá trình làm việc tại Y Combinator, ông đã hỗ trợ thành công rất nhiều doanh nghiệp như Airbnb và Dropbox.

Trong cuộc phỏng vấn với báo giới vào hồi tháng 5 năm 2019, Altman đã chia sẻ, “Chúng tôi chưa từng có doanh thu và cũng chưa từng có kế hoạch để tạo doanh thu. Chúng tôi cũng không biết rằng trong tương lai cần làm thế nào để có doanh thu.”

Tuy nhiên, phát ngôn này cũng không thể ngăn cản các nhà đầu tư đổ tiền vào OpenAI. Tới tháng 7, Microsoft đã quyết định “rót” 1 tỷ USD vốn đầu tư vào tổ chức này với niềm tin rằng, Altman sẽ có cách để kiếm lời từ khoản đầu tư đó.

Sự thay đổi về sứ mệnh của OpenAI

Mặc dù vậy, vẫn có những xung đột nhất định của các hãng đầu tư công nghệ và những phòng nghiên cứu khoa học như OpenAI.

Sứ mệnh ban đầu của OpenAI là đảm bảo rằng, công nghệ AGI (Artificial General Intelligence) “sẽ đem lại lợi ích cho toàn nhân loại, thông qua việc cố gắng xây dựng các AGI an toàn, rồi chia sẻ công nghệ này cho toàn thế giới.”

Tuy nhiên, theo ước tính của giới chuyên gia thì phải vài thập kỷ nữa AGI mới trở thành hiện thực. Trong khi đó, các hãng đầu tư công nghệ lại không thể kiên nhẫn lâu như vậy. Họ mong kiếm được lợi nhuận chỉ sau vài năm (ví dụ điển hình là hãng robot nổi tiếng Boston Dynamics và câu chuyện bị “sang tay” liên tục mặc dù có rất nhiều video robot “phủ sóng” trên Youtube). Vậy làm sao để OpenAI đạt được thế cân bằng giữa việc nghiên cứu AGI và sự hài lòng của các nhà đầu tư?

Trong thông báo của OpenAI về khoản đầu tư của Microsoft có  viết: “OpenAI đang sản suất những công nghệ AI ngày một mạnh mẽ hơn, vì vậy cũng cần nhiều năng lực máy tính. Giải pháp đơn giản nhất để bù đắp các chi phí cần thiết là xây dựng sản phẩm thương mại, điều này lại đồng nghĩa với việc thay đổi trọng tâm nghiên cứu. Thay vào đó, chúng tôi quyết định đăng ký bản quyền một số công nghệ tiền-AGI, và coi Microsoft là đối tác cho việc thương mại hóa chúng.”

Tuy nhiên, lại xuất hiện nhiều dấu hiệu rõ ràng cho thấy rằng OpenAI đang dần trở thành một công ty chuyên về sản phẩm.

Phát hành thương mại GPT-3

Vào tháng 5 năm 2020, Microsoft công bố rằng hãng hiện đang chế tạo một trong số các siêu máy tính hàng đầu “hợp tác độc quyền với OpenAI.” Có thể thấy, Microsoft đã sử dụng nhân lực của OpenAI để tạo ra hệ thống mà Altman từng mô tả. Siêu máy tính này sẽ giúp OpenAI huấn luyện các mô hình Deep Learning của họ, đồng thời cũng phục vụ cho các khách hàng sử dụng nền tảng điện toán đám mây Azure của Microsoft.

Chỉ trong 2 tuần, phiên bản nghiên cứu GPT-3 đầu tiên đã được đăng tải trên máy chủ arXiv. Khác với tiền thân của nó là GPT-2, GPT-3 sẽ không được công khai. Thay vào đó, OpenAI đã quyết định sẽ phát hành mô hình này theo hình thức thương mại và các nhà phát triển có thể mua quyền truy cập thông qua API.

OpenAI đã công bố quyết định này vào ngày 11 tháng 6 mới đây, tuy nhiên một số nhà phát triển đã được cấp quyền dùng trước cho mô hình ngôn ngữ này.

Điều này đã khiến GPT-3 trở nên tương tự với Microsoft Cognitive Services – một nền tảng AI hộp đen dựa trên Cloud mà qua API các nhà phát triển có thể truy cập được những công nghệ như Thị giác máy tính, Xử lý ngôn ngữ tự nhiên và nhiều tính năng AI khác, mà không cần cung cấp chi tiết mô hình phía sau dịch vụ này.

Việc phát hành thương mại GPT-3 sẽ giúp OpenAI trả một phần vốn đầu tư cho Microsoft. “Gã khổng lồ” Microsoft cũng sẽ thu lợi lớn từ việc hợp tác này, bởi lẽ hãng sẽ truy cập được sâu hơn công nghệ của OpenAI và tích hợp chúng với các sản phẩm của Microsfot như: Bing, Office 365, Outlook.com và Teams.

Bước đi này đã khiến OpenAI trở nên giống với một công ty chuyên về sản phẩm AI hơn, đồng thời cũng đi xa dần so với sứ mệnh nguyên bản là một tổ chức nghiên cứu AI phi lợi nhuận.

Không chú trọng các cảnh báo AI

Khi GPT-2 mới được phát triển, đội ngũ OpenAI đã quyết định không công khai mô hình này cho công chúng, do quan ngại về “việc lạm dụng công nghệ cho mục đích xấu” như lan truyền spam và tin tức giả. Thay vào đó, việc phát hành mô hình này được chia thành nhiều giai đoạn nhỏ, với nhiều phiên bản nhỏ hơn của GPT-2 rồi đánh giá kết quả của chúng trước khi quyết định công khai một mô hình lớn hơn.

GPT-3 lại lớn hơn GPT-2 gấp 1.000 lần. Trong khi đó, bộ nhớ lại là một trong số những vấn đề mấu chốt của các mô hình ngôn ngữ Deep Learning. Văn bản được tổng hợp càng dài thì AI lại càng mất đi tính mạch lạc. Các thử nghiệm cũng đã cho thấy rằng, những mạng nơ ron càng lớn thì có bộ nhớ càng lâu dài, từ đó suy ra rằng GPT-3 có khả năng bị lạm dụng nhiều hơn so với GPT-2.

Tuy nhiên, OpenAI cho rằng họ không thấy quan ngại về khả năng GPT-3 bị lạm dụng để tạo spambot và tổng hợp tin giả. Hãng cố lấp đi các cảnh báo về GPT-3. Vào hồi tháng 7, Sam Altman đã viết trong một bài đăng trên Twitter với nội dung rằng OpenAI còn rất nhiều điều phải làm với mô hình này.

Altman không hề sai, bởi lẽ AI còn cần phải phát triển rất nhiều trước khi đạt được tới trình độ của con người. Nhiều thử nghiệm với GPT-3 cũng cho thấy mặc dù đã xuất hiện nhiều cải tiến thú vị, song mô hình này vẫn rất chật vật với một số tác vụ cơ bản, dùng để đo trí thông minh.

Tuy nhiên, phát biểu của Altman vẫn mang hàm ý đảm bảo với các nhà đầu tư rằng mọi thứ vẫn đang trong tầm kiểm soát.

OpenAI với tư cách là một công ty chuyên sản phẩm

Kể từ khi mới phát hành, GPT-3 đã nhận được rất nhiều lời ca ngợi trong cộng đồng công nghệ. Đã có rất nhiều nhà phát triển và kinh doanh chia sẻ các bài thơ, meme, bài viết, và cả các trang web được thực hiện bởi GPT-3.

Thậm chí, một nhà phát triển còn sử dụng GPT-3 để tạo ra code Python cho các mô hình Deep Learning.

“Tôi vừa dùng GPT-3 để tạo code cho một mô hình machine learning, chỉ bằng cách mô tả bộ dữ liệu và đầu ra cần có. Đây chính là khởi đầu cho kỷ nguyên AI không code” – Matt Shumer (@mattshumer_) 25 tháng 7, 2020.

Những bài viết này đa số chỉ là các thí nghiệm vui và GPT-3 sẽ vẫn còn xa mới có thể làm việc thay cho con người. Các nhà nghiên cứu và khoa học AI cũng đã khẳng định rằng, các mô hình deep learning không thể xử lý các vấn đề nhân thức trừu tượng vốn là rất đơn giản với con người.

Tuy nhiên, GPT-3 cũng có những lợi ích nhất định, kèm với đó là khả năng thay đổi thị trường AI. Đa số các hệ thống Deep Learning rất hẹp và chỉ có thể thực hiện một số tác vụ nhất định chứ không thể phổ biến phương thức cho các tác vụ khác. Như vậy, để huấn luyện được một mô hình Deep Learning mới, bạn sẽ cần phải huấn luyện nó từ gốc, hoặc ứng dụng Transfer Learning (học chuyển hóa) để chỉnh sửa các thông số của một mô hình đã được huấn luyện trước

Hạn chế này đã ngăn chặn việc triển khai các dịch vụ AI dưới dạng nền tảng. Dù GPT-3 vẫn là một AI khá hẹp nhưng nó đã có thể học tương đối nhiều tác vụ khác nhau. Điều này cũng có nghĩa là bạn có thể tùy chỉnh nó thành rất nhiều ứng dụng khác mà không cần phải trả về đúng tham số.

Năng lực này đã truyền cảm hứng cho rất nhiều ý tưởng về việc sử dụng mô hình AI để tạo ra các dịch vụ mới. Debuild.co là một công ty đang sử dụng GPT-3 để tạo ra ứng dụng web.

Augrented, một công ty hỗ trợ người thuê nhà, cũng đang tìm cách để sử dụng GPT-3 cho việc tóm tắt các văn bản pháp lý cùng một số văn bản khác, giúp đảm bảo quyền lợi cho người thuê nhà.

Còn OthersideAI thì đang dùng GPT-3 để cung cấp các công cụ sáng tạo cho người dùng.

Như vậy, GPT-3 có thể sẽ trở thành một nền tảng cho rất nhiều doanh nghiệp và hệ sinh thái mới. Đây sẽ là một thành công đối với Altman, song lại khiến OpenAI trở nên giống với một công ty cung cấp sản phẩm/dịch vụ. Đây là khác biệt lớn so với việc chia sẻ một mô hình AI nguồn mở và cho phép các nhà phát triển thoải mái sử dụng chúng.

Giờ đây, OpenAI phải làm thỏa mãn khách hàng của họ, mở rộng quy mô hạ tầng, giải quyết các vấn đề nguyên tắc và rất nhiều các tác vụ khác. Khi mô hình AI này trở thành nhân tố chủ chốt cho rất nhiều startup trong tương lai, thì họ sẽ phải giải quyết các vấn đề về duy trì doanh nghiệp Deep Learning. Ngoài ra, OpenAI cũng vẫn phải xử lý các tồn tại như loại bỏ những định kiến và khắc phục những mô hình bị hư hại. Tất nhiên, mọi tác vụ kể trên đều tốn rất nhiều chi phí, đặc biệt là khi OpenAI đang phải làm việc với một mô hình Deep Learning có tới 175 tỷ tham số.

Ngoài việc xử lý toàn bộ các vấn đề trên, OpenAI sẽ vẫn phải tìm cách để tạo ra lợi nhuận.

Cho dù Altman có là một nhà kinh doanh tài giỏi tới đâu, thì anh vẫn không thể vận hành công ty một mình. Càng tiến xa hơn vào lĩnh vực quản lý sản phẩm, OpenAI sẽ càng cần tới sự hỗ trợ của Microsoft.

Hiện tại, OpenAI đã dựa vào hạ tầng Cloud của Microsoft để huấn luyện và chạy mô hình. Nhưng trong tương lai, hãng sẽ còn cần tới “gã khổng lồ” này cho các vấn đề về mặt pháp lý, hỗ trợ khách hàng, an ninh – bảo mật, quy mô hóa sản phẩm…

Tương lai của OpenAI

Trụ sở OpenAI tại San Francisco.

Câu chuyện của OpenAI đã nêu bật các thách thức đang hiện diện trong việc nghiên cứu AI một cách khoa học. Quan điểm hiện tại là: mô hình Deep Learning càng lớn thì càng tạo ra được các hệ thống AI tiên tiến. Do vậy, các phòng nghiên cứu AI sẽ cần rất nhiều tiền để thu hút nhân tài, cũng như để huấn luyện các mô hình Deep Learning ngày một mở rộng của họ.

Những người duy nhất sẵn sàng bỏ tiền đầu tư cho họ lại không ai khác ngoài các công ty công nghệ lớn. Nhà đầu tư nào cũng đều mong muốn có lợi nhuận và các phòng nghiên cứu sẽ không có cách nào khác ngoài việc vận dụng một phần tài nguyên của mình để tạo ra các sản phẩm sinh lời. Thậm chí, trong tương lai, các hãng công nghệ lớn hoàn toàn có thể mua lại toàn bộ các phòng nghiên cứu này, nhằm phục vụ mục đích thương mại.

Một minh chứng cho điều này là thương vụ Google mua lại DeepMind. Cụ thể, phòng nghiên cứu AI này đã phải phân bố một số tài nguyên nghiên cứu AGI sang lĩnh vực “AI ứng dụng” để tạo ra các sản phẩm thương mại. Tuy nhiên, công ty này vẫn chưa hồi đủ vốn cho chủ sở hữu mới của nó.

Đối với OpenAI, càng tập trung vào việc thương mại hóa các dịch vụ AI của hãng, thì OpenAI lại càng khó có thể theo đuổi sứ mệnh ban đầu. Liệu công ty này sẽ tiếp tục theo đuổi bản chất nghiên cứu khoa học về các AI giống con người, hay sẽ nghiêng về phía thương mại hóa, đăng ký bản quyền cho bí mật thương mại và tài sản trí tuệ của mình? Liệu OpenAI có thể tiếp tục “nghĩa vụ với nhân loại”, hay sẽ ưu tiên sự hài lòng của các nhà đầu tư? Có lẽ, chỉ thời gian mới có thể trả lời.

Theo TechTalks

Tin liên quan: