11:21 14/11/2024

OpenAI, Google và Anthropic chứng kiến lợi nhuận sụt giảm dù đầu tư tốn kém vào AI 

Bảo Bình

OpenAI và các công ty AI hàng đầu khác như Google và Anthropic đang thất vọng với các mô hình mới của mình...

Khi chi phí tăng, áp lực và kỳ vọng cho mỗi mô hình AI mới cũng tăng theo
Khi chi phí tăng, áp lực và kỳ vọng cho mỗi mô hình AI mới cũng tăng theo

OpenAI đang đối mặt với một cột mốc quan trọng khi hoàn thành vòng đào tạo đầu tiên cho một mô hình AI quy mô lớn mới, mang tên Orion. Tuy nhiên, mô hình này không đạt được hiệu suất mong đợi, nó gặp khó khăn trong việc trả lời các câu hỏi lập trình. So với các phiên bản trước như GPT-4, Orion không mang lại bước tiến lớn. 

OpenAI không phải là công ty duy nhất gặp khó khăn, khi các công ty AI hàng đầu khác như Google và Anthropic cũng chứng kiến sự thất vọng với các mô hình mới của mình.

THÁCH THỨC DỮ LIỆU CHẤT LƯỢNG CAO ĐỂ ĐÀO TẠO AI

Một trong những thách thức lớn hiện nay là việc khó tìm kiếm dữ liệu đào tạo chất lượng cao và chưa được khai thác. Orion gặp vấn đề trong việc xử lý mã hóa vì thiếu dữ liệu đào tạo đầy đủ. Các công ty AI phải đối mặt với chi phí cao và khó có thể biện minh cho những cải tiến dù là nhỏ nhất.

Mặc dù OpenAI đã thực hiện các quy trình tinh chỉnh mô hình qua đào tạo để cải thiện Orion, nhưng mô hình này vẫn chưa đạt yêu cầu để phát hành công khai. Những khó khăn này làm dấy lên nghi ngờ về tính khả thi của mục tiêu AI mạnh mẽ vượt trội hơn con người (AGI - trí tuệ nhân tạo tổng quát ), đặc biệt kể từ khi OpenAI phát hành ChatGPT hai năm trước, một tham vọng mà các công ty AI lớn đã theo đuổi trong suốt những năm qua. Phần lớn ngành công nghệ đã đặt cược vào cái gọi là sức mạnh tính toán, dữ liệu lớn và các mô hình lớn để mở đường cho những bước nhảy vọt lớn hơn về sức mạnh của AI.

Những thất bại gần đây cũng làm dấy lên nghi ngờ về các khoản đầu tư lớn vào AI và tính khả thi của việc đạt được mục tiêu bao trùm mà các công ty này đang ráo riết theo đuổi: trí tuệ nhân tạo tổng quát.

Margaret Mitchell từ Hugging Face nhận định rằng "bong bóng AGI đang vỡ", và có thể cần các phương pháp đào tạo khác để làm cho các mô hình AI hoạt động hiệu quả hơn.

Trong một tuyên bố, đại diện của Google DeepMind cho biết công ty "hài lòng với tiến triển của Gemini và sẽ chia sẻ thêm thông tin khi sẵn sàng". OpenAI từ chối bình luận, trong khi CEO Dario Amodei Anthropic cho biết có "nhiều yếu tố" có thể "làm gián đoạn" quá trình phát triển AI mạnh mẽ hơn trong vài năm tới, bao gồm khả năng "hết dữ liệu". Tuy nhiên, ông vẫn lạc quan rằng các công ty AI sẽ tìm ra cách vượt qua những khó khăn này.

Công nghệ hỗ trợ ChatGPT và các chatbot AI khác được xây dựng từ một lượng lớn dữ liệu có sẵn trên mạng, bao gồm bài đăng trên mạng xã hội, bình luận trực tuyến, sách và các nguồn miễn phí khác. Điều này đủ để tạo ra những sản phẩm có thể viết tiểu luận hoặc thơ thông minh, nhưng để xây dựng một hệ thống AI thông minh vượt trội như con người, thậm chí đạt giải Nobel, sẽ cần nguồn dữ liệu chất lượng cao hơn ngoài những bài viết trên Wikipedia hay video trên YouTube.

OpenAI đã ký thỏa thuận với các nhà xuất bản để có được dữ liệu chất lượng cao, đồng thời đáp ứng các yêu cầu pháp lý ngày càng tăng từ các nghệ sĩ và nhà xuất bản về việc sử dụng dữ liệu cho sản phẩm AI. Ngoài ra, các công ty công nghệ cũng đang tìm cách tuyển dụng các chuyên gia có bằng cấp để giúp gắn nhãn dữ liệu theo các lĩnh vực chuyên môn như toán học hoặc lập trình, nhằm cải thiện khả năng phản hồi của AI đối với các câu hỏi về các chủ đề chuyên sâu.

Tuy nhiên, những nỗ lực này diễn ra chậm và tốn kém hơn việc chỉ sử dụng dữ liệu lấy từ web. Các công ty cũng đang chuyển sang sử dụng dữ liệu tổng hợp, như hình ảnh hoặc văn bản do máy tính tạo ra, để mô phỏng nội dung do con người sản xuất. Tuy nhiên, việc này cũng gặp nhiều hạn chế.

Ông Lila Tretikov, người đứng đầu chiến lược AI tại New Enterprise Associates và cựu phó giám đốc công nghệ của Microsoft, cho biết: "Quan trọng hơn không phải là số lượng mà là chất lượng và sự đa dạng của dữ liệu. Chúng ta có thể tạo ra dữ liệu tổng hợp, nhưng gặp khó khăn trong việc thu thập bộ dữ liệu độc đáo, chất lượng cao mà không cần sự can thiệp của con người, đặc biệt là khi nói đến ngôn ngữ”.

Tuy nhiên, các công ty AI vẫn kiên trì theo đuổi chiến lược "càng nhiều càng tốt". Để phát triển các sản phẩm có trí thông minh gần như con người, các công ty công nghệ đang gia tăng sức mạnh tính toán, dữ liệu và thời gian dành cho việc huấn luyện các mô hình mới - và điều này cũng làm tăng chi phí. CEO Amodei đã cho biết các công ty sẽ chi 100 triệu USD để huấn luyện một mô hình tiên tiến trong năm nay, và con số này có thể đạt 100 tỷ USD trong những năm tới.

Khi chi phí tăng, áp lực và kỳ vọng cho mỗi mô hình mới cũng tăng theo. Noah Giansiracusa, phó giáo sư toán học tại Đại học Bentley ở Massachusetts, cho rằng các mô hình AI sẽ tiếp tục cải tiến, nhưng tốc độ cải tiến có thể không như mong đợi. Ông chia sẻ: “Chúng ta đã rất phấn khích trong một giai đoạn ngắn với tiến bộ vượt bậc. Nhưng điều đó không thể duy trì mãi mãi."

TÌNH THẾ NAN GIẢI CỦA THUNG LŨNG SILICON

Trong những tháng gần đây, tình trạng nan giải của các công ty AI ở Thung lũng Silicon đã trở nên rõ ràng hơn. Vào tháng 3, Anthropic giới thiệu ba mô hình AI mới, tuyên bố rằng phiên bản mạnh nhất, có tên là Claude Opus, vượt trội hơn GPT-4 của OpenAI và Gemini của Google về các tiêu chí quan trọng như lập luận và mã hóa ở cấp độ sau đại học.

Trong vài tháng sau đó, Anthropic đã cập nhật hai mô hình Claude khác, nhưng lại không ra mắt Opus. "Đó là phiên bản mà ai cũng mong đợi," Simon Willison, một nhà nghiên cứu AI độc lập, cho biết. Đến tháng 10, Willison và các chuyên gia trong ngành nhận thấy thông tin về 3.5 Opus – bao gồm cả việc “sẽ ra mắt trong năm nay” – đã bị gỡ bỏ khỏi trang web của công ty.

Giống như các đối thủ, Anthropic cũng đang gặp khó khăn trong việc phát triển 3.5 Opus, theo hai nguồn tin nội bộ. Sau khi huấn luyện mô hình, Anthropic nhận thấy 3.5 Opus có cải thiện so với phiên bản cũ, nhưng không đạt được kỳ vọng về hiệu suất dù chi phí xây dựng và vận hành rất cao.

CEO Dario Amodei của Anthropic 
CEO Dario Amodei của Anthropic 

Một đại diện của Anthropic cho biết thông tin về Opus đã được gỡ khỏi trang web do quyết định chỉ hiển thị các mô hình có sẵn và đã qua đánh giá. Khi được hỏi liệu 3.5 Opus có ra mắt trong năm nay không, Amodei khẳng định Anthropic vẫn có kế hoạch phát hành mô hình này nhưng từ chối cam kết về thời gian cụ thể.

Các công ty công nghệ hiện đang cân nhắc việc có nên tiếp tục cung cấp các mô hình AI cũ đã cải tiến, hay chấp nhận chi phí cao để hỗ trợ những phiên bản mới đắt đỏ mà có thể không cải thiện đáng kể về hiệu suất.

Google đã cập nhật mô hình AI hàng đầu Gemini, bao gồm khả năng tạo ảnh chân dung người, nhưng không có nhiều đột phá lớn trong chất lượng mô hình gốc. Trong khi đó, OpenAI chủ yếu tập trung vào các cập nhật nhỏ hơn, chẳng hạn như phiên bản trợ lý giọng nói cho phép người dùng có các cuộc trò chuyện mượt mà hơn với ChatGPT.

Gần đây, OpenAI ra mắt phiên bản thử nghiệm của mô hình o1, cho phép quá trình tính toán kỹ càng hơn trước khi trả lời câu hỏi – một kỹ thuật gọi là “lý luận”. Google cũng đang phát triển cách tiếp cận tương tự để xử lý các câu hỏi phức tạp hơn và cải thiện chất lượng phản hồi theo thời gian.

Các công ty công nghệ đang đối mặt với khó khăn khi phải điều chỉnh nguồn tài nguyên tính toán để phát triển các mô hình lớn mà hiệu quả chưa thực sự vượt trội. Sam Altman, CEO của OpenAI, chia sẻ trong một buổi Ask Me Anything trên Reddit rằng các mô hình AI đã trở nên rất phức tạp và công ty không thể phát triển đồng thời nhiều dự án như mong muốn do hạn chế tài nguyên tính toán.

Altman tiết lộ OpenAI sẽ có một số phát hành quan trọng vào cuối năm, nhưng sẽ không có GPT-5 – một cái tên mà nhiều người kỳ vọng là bản phát hành lớn tiếp theo sau GPT-4, đã ra mắt cách đây hơn 18 tháng.

Hiện OpenAI, giống như Google và Anthropic, đang chuyển hướng từ việc tập trung vào quy mô của mô hình sang những ứng dụng mới, bao gồm các công cụ AI gọi là “agents” có thể đặt vé máy bay hoặc gửi email thay cho người dùng. Altman viết trên Reddit rằng: “Chúng tôi sẽ có những mô hình ngày càng tốt hơn, nhưng tôi nghĩ bước đột phá lớn tiếp theo sẽ là các ‘agents’.”