DeepMind và Google, ai sẽ là người chiến thắng? – Phần 3

193

Ngay từ đầu, Hassabis đã cố gắng bảo vệ sự độc lập của DeepMind. Ông luôn khăng khăng rằng DeepMind vẫn ở lại London. Khi Google mua công ty vào năm 2014, câu hỏi về kiểm soát trở nên cấp bách hơn. Hassabis vốn không cần bán DeepMind cho Google. Có rất nhiều tiền mặt trong tay và ông đã phác thảo một mô hình kinh doanh mà công ty sẽ thiết kế các trò chơi để tài trợ cho nghiên cứu. Sức mạnh tài chính của Google rất hấp dẫn, tuy nhiên, giống như nhiều nhà sáng lập, Hassabis đã rất ngần ngại khi chuyển giao công ty mà ông đã nuôi dưỡng. Trong thỏa thuận, DeepMind ngăn Google đơn phương kiểm soát tài sản trí tuệ của công ty. Trong năm chuẩn bị cho thương vụ, theo một người hiểu về thương vụ này cho biết, cả hai bên đã ký một hợp đồng gọi là Thỏa thuận đánh giá đạo đức và an toàn (Ethics and Safety Review Agreement). Thỏa thuận này, trước đây không được báo cáo, đã được soạn thảo bởi các luật sư cao cấp ở London.

Thỏa thuận này đặt quyền kiểm soát công nghệ lõi của DeepMind – AGI trong tay một hội đồng quản trị được gọi là Ủy ban đạo đức. Đây không phải là một bước nhượng bộ mang tính hình thức từ Google, mà Ủy ban đạo đức sẽ cung cấp cho DeepMind sự ủng hộ pháp lý vững chắc để giữ quyền kiểm soát công nghệ có giá trị nhất của nó, theo cùng một nguồn tin cho biết. Tên của các thành viên trong hội đồng này đều không được công khai, nhưng một nguồn tin thân cận với cả DeepMind và Google cho biết cả ba thành viên sáng lập DeepMind đều ở trong ủy ban này. (DeepMind từ chối trả lời một loạt các câu hỏi chi tiết về việc này nhưng nói rằng việc giám sát và quản trị đạo đức là ưu tiên hàng đầu của họ từ những ngày đầu tiên).

Hassabis cũng có thể định đoạt vận mệnh DeepMind bằng những cách khác. Một trong số đó là lòng trung thành. Các nhân viên trong quá khứ và hiện tại nói rằng chương trình nghiên cứu của Hassabis là một trong những thế mạnh lớn nhất của DeepMind. Chương trình của ông, nơi cung cấp những công việc quan trọng và hấp dẫn, không bị áp lực của giới học thuật, đã thu hút hàng trăm chuyên gia tài năng nhất thế giới. DeepMind có văn phòng công ty con tại Paris và Alberta. Nhiều nhân viên cảm thấy thân thiết với Hassabis và sứ mệnh của ông hơn là với công ty mẹ  luôn đòi hỏi doanh thu. Chừng nào còn giữ được lòng trung thành cá nhân của họ, thì Hassabis còn nắm quyền lực đáng kể so với cổ đông duy nhất của mình. Google tốt hơn hết nên để các tài năng AI của DeepMind ở lại còn hơn là cho những người đó đổ về làm cho Facebook hoặc Apple.

DeepMind có một nguồn lực khác, mặc dù nguồn này đòi hỏi phải bổ sung liên tục: sự ưu ái từ cộng đồng. Công ty vượt trội về điều này. AlphaGo là một cú PR ngoạn mục. Kể từ khi được mua lại bởi Google, công ty đã liên tục sản xuất những tuyệt tác thu hút được sự chú ý trên toàn cầu. Điển hình, một phần mềm có thể phát hiện sớm chứng thoái hóa điểm vàng bằng cách tìm ra các mẫu hình trong ảnh quét nhãn cầu. Một chương trình khác đã học chơi cờ từ đầu bằng cách sử dụng kiến ​​trúc tương tự AlphaGo, trở thành chiếc máy chơi cờ vĩ đại nhất mọi thời đại chỉ sau chín giờ chơi với chính nó. Vào tháng 12 năm 2018, một chương trình có tên AlphaFold đã chứng minh chính xác hơn các đối thủ khi dự đoán cấu trúc protein ba chiều có khả năng mở đường để điều trị các bệnh như Parkinson, và Alzheimer.

Kết quả hình ảnh cho cờ vâyDeepMind đặc biệt tự hào về các thuật toán mà nó đã phát triển để tính toán các phương tiện hiệu quả nhất để làm mát các trung tâm dữ liệu của Google, trong đó ước  chừng có 2,5 triệu máy chủ. DeepMind cho biết vào năm 2016 rằng họ đã giảm 40% hóa đơn năng lượng của Google. Nhưng một số người trong cuộc nói rằng tự hào như vậy là hơi quá. Google đã sử dụng các thuật toán để tối ưu hóa các trung tâm dữ liệu của mình từ lâu trước khi DeepMind tồn tại. “Họ chỉ muốn PR để có thể đòi hỏi một số quyền lợi ở trong Alphabet”, một nhân viên Google nói. DeepMind thu 54 triệu bảng từ các công ty thuộc Alphabet trong năm 2017. Con số đó quá mờ nhạt so với các chi phí của DeepMind. Công ty đã chi 200 triệu bảng chỉ riêng tiền lương cho nhân viên của mình trong năm đó. Nhìn chung, DeepMind đã mất 282 triệu bảng vào năm 2017.

Số tiền này chẳng đáng là bao so với người khổng lồ về tài chính như Google. Tuy nhiên giám đốc tài chính nổi tiếng chặt chẽ của Alphabet, Ruth Porat, đã luôn để mắt đến những công ty con của Alphabet đang thua lỗ. Google Fiber là một ví dụ, dịch vụ cung cấp Internet (ISP) này đã bị dừng lại khi thấy rằng phải mất hàng chục năm mới có thể có lãi. Các nhà nghiên cứu AI đang bảo nhau khi nào sẽ đến lượt DeepMind.

DeepMind tiết lộ các tiến bộ của AI là một phần của chiến lược quản lý, nâng giá trị uy tín của nó đối với các thế lực trong tập đoàn. Điều đó đặc biệt có giá trị tại thời điểm Google bị buộc tội xâm phạm quyền riêng tư của người dùng và truyền bá tin tức giả mạo. DeepMind cũng may mắn có được một người đồng hành ở cấp cao nhất: Larry Page, một trong hai người sáng lập Google, hiện là giám đốc điều hành của Alphabet. Thời mới khởi sự, Page nói rằng ông đã xây dựng Google chỉ để thành lập một công ty AI.

Sự kiểm soát chặt chẽ của DeepMind với báo chí không ăn nhập lắm với tinh thần chia sẻ học thuật trong công ty. Một số nhà nghiên cứu phàn nàn rằng có thể khó công bố công trình của họ: họ phải chiến đấu qua hàng tầng lớp các phê duyệt nội bộ trước khi họ thậm chí có thể gửi tác phẩm đến các hội nghị và tạp chí. DeepMind tin rằng cần phải tiến hành cẩn thận để tránh khiến công chúng sợ hãi với triển vọng của AGI. Nhưng việc kiểm soát quá chặt có thể làm mất bầu không khí học thuật và làm giảm nhiệt huyết của nhân viên.

Năm năm sau khi được Google mua lại, câu hỏi về việc ai sẽ kiểm soát DeepMind đang đi đến điểm mấu chốt. Những người sáng lập và các nhân viên đầu tiên của công ty đều có thể ra đi với khoản bồi thường tài chính mà họ nhận được từ việc mua lại (cổ phiếu của Hassabis có lẽ trị giá khoảng 100 triệu bảng). Nhưng một nguồn tin thân cận với công ty cho thấy rằng Alphabet không thỏa thuận cho phép họ ra đi sau hai năm. Với sự tập trung không ngừng nghỉ của mình, Hassabis cũng không cho thấy khả năng ra đi. Ông chỉ quan tâm đến tiền cho đến khi nó giúp ông đạt được công việc của mình. Nhưng một số đồng nghiệp đã rời đi. Ba kỹ sư AI đã rời đi kể từ đầu năm 2019. Và Ben Laurie, một trong những kỹ sư bảo mật nổi tiếng nhất thế giới, giờ đã quay trở lại Google, công ty trước đây của anh. Con số này là nhỏ, nhưng với việc DeepMind cung cấp một trải nghiệm đầy thú vị và trả lương khá cao nên việc rời công ty là rất hiếm.

Cho đến nay, Google đã không can thiệp nhiều vào DeepMind. Nhưng một sự việc gần đây đã làm dấy lên mối lo ngại về việc công ty có thể duy trì sự độc lập này trong bao lâu.

DeepMind luôn có kế hoạch sử dụng AI để cải thiện việc chăm sóc sức khỏe. Vào tháng 2 năm 2016, công ty đã thành lập một bộ phận mới, DeepMind Health, dẫn đầu bởi Mustafa Suleyman, một trong những người đồng sáng lập công ty. Suleyman, có mẹ là y tá, cố gắng tạo ra một chương trình có tên Streams, cảnh báo các bác sĩ khi sức khỏe của bệnh nhân bị suy giảm. DeepMind sẽ kiếm được một khoản phí dựa trên hiệu suất. Vì công việc này đòi hỏi quyền truy cập vào thông tin nhạy cảm về bệnh nhân, Suleyman đã thành lập Hội đồng Đánh giá Độc lập (Independent Review Panel – IRP) bao gồm những nhân vật lớn ở Anh trong lĩnh vực y tế và công nghệ. Ủy viên thông tin người Anh sau đó phát hiện ra rằng một trong những bệnh viện đối tác đã phạm luật trong việc xử lý dữ liệu bệnh nhân. Tuy nhiên, vào cuối năm 2017, Suleyman vẫn ký thỏa thuận với bốn bệnh viện lớn.

Kết quả hình ảnh cho Google HealthVào ngày 8 tháng 11 năm 2018, Google đã thông báo thành lập bộ phận chăm sóc sức khỏe của riêng mình, Google Health. Năm ngày sau, có thông báo rằng DeepMind Health sẽ được sáp nhập với công ty mẹ. DeepMind dường như có rất ít cảnh báo. Theo thông tin có được, họ chỉ thông báo cho các bệnh viện đối tác của mình trước ba ngày về thông báo thay đổi. DeepMind từ chối trả lời về câu hỏi khi nào thì các cuộc thảo luận về việc sáp nhập bắt đầu nhưng họ nói rằng khoảng cách ngắn giữa thông báo mật và thông báo công khai là vì sự minh bạch. Suleyman đã viết vào năm 2016 rằng, “sẽ không bao giờ có chuyện dữ liệu của bệnh nhân được liên kết với tài khoản, sản phẩm hay dịch vụ của Google”. Lời hứa này dường như đã không thực hiện được. (Trả lời câu hỏi của chúng tôi, DeepMind nói rằng “ở giai đoạn này, không có hợp đồng nào của chúng tôi được chuyển sang Google và Google sẽ chỉ có được chúng khi có sự đồng ý của các đối tác của chúng tôi. Streams sẽ trở thành dịch vụ của Google không có nghĩa là dữ liệu bệnh nhân sẽ được sử dụng để cung cấp các sản phẩm hoặc dịch vụ khác cho Google.”)

Cuộc thôn tính Google đã khiến các nhân viên tại DeepMind Health tức giận. Theo những người gần gũi với đội ngũ y tế, nhiều nhân viên có kế hoạch rời khỏi công ty sau khi quá trình sáp nhập hoàn tất. Một thành viên của IRP, Mike Bracken, đã bỏ Suleyman. Theo nhiều người trong cuộc, Bracken đã quyết định rời vào tháng 12 năm 2017 vì lo ngại rằng ban lãnh đạo công ty sẽ chỉ chú trọng trau chuốt bên ngoài mà không có tầm nhìn thực sự. Khi Bracken hỏi Suleyman rằng ông sẽ trao cho các thành viên hội đồng quyền lực trách nhiệm và quyền quản trị hay không, Suleyman chỉ cười chế giễu.(Người phát ngôn của DeepMind nói họ “không có ký ức gì” về việc này). Julian Huppert, người đứng đầu IRP, lập luận rằng hội đồng đã giao quyền cai trị triệt để hơn so với Bracken hy vọng vì các thành viên có thể nói chuyện cởi mở và không bị ràng buộc bởi sự bí mật nào.

Điều này cho thấy một số hoạt động của DeepMind sẽ dễ bị Google can thiệp. DeepMind cho biết rằng “họ thấy hợp lý khi kết hợp những nỗ lực lại với nhau với nguồn lực ngày càng tăng”. Điều này đặt ra câu hỏi liệu Google có áp dụng logic tương tự cho AGI của DeepMind hay không.

Nhìn từ xa, DeepMind có vẻ đã có những bước tiến lớn. Công ty đã xây dựng phần mềm có thể học được cách thực hiện các nhiệm vụ ở cấp độ cao. Hassabis thường nhắc đến Breakout, một trò chơi điện tử trên Atari. Người chơi Breakout điều khiển một cái gậy di chuyển theo chiều ngang phía dưới màn hình, sử dụng nó để  đẩy một quả bóng đập vào các khối lơ lửng phía trên, phá hủy chúng khi va chạm. Người chơi chiến thắng khi tất cả các khối bị xóa sạch và thua nếu không đỡ được quả bóng. Khi không có sự chỉ dẫn của con người, chương trình DeepMind không chỉ học cách chơi trò chơi mà còn tìm ra cách bắn quả bóng vào khoảng trống phía sau các khối, tận dụng các cú bật lại để phá vỡ nhiều khối hơn. “Điều này, thể hiện sức mạnh của việc học tăng cường và khả năng thích nghi phi thường của các chương trình máy tính do DeepMind phát triển”, Hassabis nói.

Đó là một bản demo ấn tượng. Nhưng Hassabis đã bỏ sót một vài điều. Nếu cây gậy ảo ở trên được di chuyển chỉ cao hơn một chút thôi, thì chương trình sẽ thất bại. Kỹ năng được học bởi chương trình DeepMind, bị hạn chế đến mức nó không thể phản ứng ngay cả với những thay đổi nhỏ đối với môi trường mà một người thông thường sẽ có – ít nhất là không phải học thêm hàng ngàn vòng học tăng cường nữa. Đối với trí thông minh y học, không có hai cơ quan cơ thể nào giống nhau. Đối với trí thông minh cơ học, không có hai động cơ có thể được điều chỉnh theo cùng một cách. Vì vậy, việc phát hành các chương trình được hoàn thiện trong không gian ảo vào thế giới thực sẽ đầy khó khăn.

Nhắc nhở thứ hai, mà DeepMind hiếm khi nói đến, đó là thành công trong môi trường ảo phụ thuộc vào sự tồn tại của chức năng phần thưởng: tín hiệu cho phép phần mềm đo lường tiến trình của nó. Chương trình học được rằng việc quay lại từ bức tường phía sau làm cho điểm số của nó tăng lên. Phần lớn hoạt động của DeepMind với AlphaGo nằm trong việc xây dựng chức năng phần thưởng tương thích với một trò chơi phức tạp như vậy. Thật không may, thế giới thực không có cung cấp phần thưởng đơn giản. Tiến bộ hiếm khi được đo bằng điểm số. Kể cả nếu các biện pháp như vậy tồn tại, thì chính trị sẽ lại làm phức tạp vấn đề. Ví dụ như việc hòa giải giữa phần thưởng cho sức khỏe của khí hậu (nồng độ CO2 trong khí quyển) với phần thưởng cho các công ty dầu mỏ (giá cổ phiếu) cần phải thỏa mãn cùng lúc nhiều con người với các lợi ích mâu thuẫn nhau. Tín hiệu hiệu phần thưởng như vậy thường rất yếu. Rất hiếm khi bộ não của con người nhận được phản hồi rõ ràng về sự thành công của một nhiệm vụ khi ở đang thực hiện nó.

DeepMind đã tìm ra cách khắc phục điều này bằng cách sử dụng một lượng lớn năng  lực xử lý của máy tính. AlphaGo phải mất hàng ngàn năm nếu quy ra thời gian chơi của con người để học bất cứ điều gì. Nhiều nhà nghiên cứu AI nghi ngờ giải pháp này không bền vững đối với các nhiệm vụ mang lại phần thưởng thấp hơn. DeepMind thừa nhận sự tồn tại của sự mơ hồ như vậy. Gần đây nó đã tập trung vào StarCraft 2, một trò chơi chiến lược trên máy tính. Các quyết định được đưa ra sớm trong trò chơi có sự phân nhánh về sau, gần với loại phản hồi hỗn độn và chậm trễ đặc trưng cho nhiều nhiệm vụ trong thế giới thực. Vào tháng 1, phần mềm DeepMind đã đánh bại một số người chơi hàng đầu thế giới trong một bản demo, mà trong khi bị hạn chế rất nhiều, vẫn rất ấn tượng. Các chương trình của nó cũng đã bắt đầu tìm hiểu các chức năng khen thưởng bằng cách làm theo phản hồi của con người. Nhưng đặt hướng dẫn của con người vào vòng lặp có nguy cơ làm mất tác dụng của quy mô và tốc độ mà quá trình xử lý máy tính không cần can thiệp cung cấp .

Các nhà nghiên cứu tại DeepMind và Google cũng bày tỏ sự hoài nghi rằng liệu DeepMind có thể đạt được AGI thông qua các phương pháp như vậy hay không. Đối với họ, việc tập trung vào  mục tiêu đạt được hiệu suất cao trong môi trường mô phỏng khiến vấn đề tín hiệu phần thưởng trở nên khó giải quyết. Tuy nhiên, cách tiếp cận này là trọng tâm của DeepMind. Công ty của Hassabis có một bảng xếp hạng nội bộ, trong đó các chương trình từ các nhóm lập trình viên cạnh tranh với nhau để giành quyền làm chủ các lĩnh vực ảo.

Hassabis luôn xem cuộc sống là một trò chơi. Phần lớn sự nghiệp của ông được dành cho việc tạo ra chúng, và một phần lớn thời gian giải trí của ông được dành để chơi chúng. Tại DeepMind, các trò chơi là phương tiện được Hassabis chọn để phát triển AGI. Giống như phần mềm của mình, Hassabis chỉ có thể học hỏi từ kinh nghiệm của bản thân ông. Việc theo đuổi AGI có thể mất phương hướng, dù đã góp phần phát minh ra một số công nghệ y tế hữu ích và vượt trội. Thành tích đáng kể, nhưng đó không phải là điều ông khao khát. Nhưng nếu  Demis Hassabis có thể biến AGI thành hiện thực, ngay trong Google nhưng vượt qua tầm kiểm soát của nó, ông sẽ là người chiến thắng trong cuộc chơi khó nhất này.

Hồ Minh Hiệp – Phương Anh (Theo 1843magazine)

Phần 1: DeepMind, Google và cuộc chiến giành lấy “ngai vàng” trong lĩnh vực trí tuệ nhân tạo

Phần 2: Ai sẽ nắm lấy dây cương của con ngựa AGI?

Tin liên quan:
  • 45
    Shares