Công nghệ AI đang “tới ngưỡng”, OpenAI và các Big Tech tìm cách làm cho AI thông minh hơn
Hoàng Hà
06/12/2024
Các phòng thí nghiệm AI đang tiêu tốn hàng chục triệu đô la đào tạo mô hình, sử dụng hàng trăm chip cùng lúc, nhưng dễ gặp lỗi phần cứng và thiếu dữ liệu đầu vào chất lượng. Quá trình này còn đòi hỏi nguồn năng lượng khổng lồ...
Các công ty AI như OpenAI đang tìm kiếm cách mới để vượt qua những thách thức trong việc phát triển các mô hình ngôn ngữ lớn hơn. Một chiến lược mới là áp dụng các kỹ thuật huấn luyện mô hình có xu hướng giống con người hơn, nhằm giúp các thuật toán xử lý thông tin theo cách "suy nghĩ" tự nhiên hơn.
AI ĐANG ĐẠT ĐẾN GIỚI HẠN?
Hàng chục nhà khoa học và nhà nghiên cứu trong lĩnh vực AI tin rằng những phương pháp này, được sử dụng trong mô hình mới nhất của OpenAI (được gọi là o1), có thể thay đổi cục diện cạnh tranh trong lĩnh vực AI. Các kỹ thuật này không chỉ cải thiện hiệu suất mô hình mà còn ảnh hưởng lớn đến nhu cầu tài nguyên khổng lồ của ngành AI, bao gồm năng lượng và chip máy tính.
Trước đây, các công ty AI thường tập trung vào việc "mở rộng quy mô" mô hình bằng cách thêm nhiều dữ liệu và sức mạnh tính toán để cải thiện hiệu suất. Tuy nhiên, các chuyên gia hiện đang thảo luận về giới hạn của chiến lược này. Tiến sĩ Ilya Sutskever, đồng sáng lập OpenAI và Phòng thí nghiệm AI Safe Superintelligence (SSI), cho biết hiệu quả của việc mở rộng quy mô đào tạo mô hình với dữ liệu lớn dường như đang chững lại. Điều này thúc đẩy việc nghiên cứu các cách tiếp cận sáng tạo hơn để phát triển AI.
Tiến sĩ Ilya Sutskever, một trong những người tiên phong trong lĩnh vực AI tạo sinh, đã thúc đẩy sự phát triển của các mô hình AI lớn thông qua việc tăng cường dữ liệu và sức mạnh tính toán, đóng vai trò quan trọng trong việc tạo ra ChatGPT. Tuy nhiên, vào đầu năm 2024, ông rời OpenAI để thành lập phòng thí nghiệm Safe Superintelligence Initiative (SSI), tập trung vào cách tiếp cận mới để đào tạo AI.
Tiến sĩ Sutskever cho rằng kỷ nguyên phát triển AI của những năm 2010 gắn liền với việc "mở rộng quy mô" đã đạt đến giới hạn. Ông tin rằng ngành AI đang bước vào giai đoạn khám phá sáng tạo hơn. SSI hiện đang nghiên cứu một phương pháp mới để tối ưu hóa quá trình đào tạo, mặc dù ông chưa tiết lộ chi tiết.
Đằng sau hậu trường, các phòng thí nghiệm AI hàng đầu đối mặt với nhiều thách thức khi phát triển các mô hình ngôn ngữ lớn hơn. Những mô hình này tiêu tốn hàng chục triệu đô la để đào tạo, sử dụng hàng trăm chip cùng lúc, nhưng dễ gặp lỗi phần cứng và thiếu dữ liệu đầu vào chất lượng. Quá trình đào tạo cũng đòi hỏi nguồn năng lượng khổng lồ, đôi khi bị cản trở bởi tình trạng thiếu điện.
TÌM CÁCH ĐỂ AI THÔNG MINH HƠN NỮA, BIẾT SUY NGHĨ "NHƯ CON NGƯỜI"
Để khắc phục, các nhà nghiên cứu đã áp dụng kỹ thuật mới như "tính toán thời gian thử nghiệm," giúp các mô hình suy nghĩ nhiều bước như con người trong giai đoạn "suy luận." Thay vì chọn ngay câu trả lời, các mô hình này đánh giá nhiều khả năng và chọn giải pháp tốt nhất. Phương pháp này cải thiện hiệu suất đáng kể, đặc biệt trong các nhiệm vụ phức tạp như toán học hoặc mã hóa.
Ví dụ, Tiến sĩ Noam Brown từ OpenAI chia sẻ rằng cho mô hình "suy nghĩ" thêm 20 giây trong một ván bài poker mang lại hiệu quả tương tự như tăng kích thước và thời gian đào tạo lên 100.000 lần. OpenAI đã áp dụng kỹ thuật này vào mô hình mới nhất của họ, "o1," với khả năng suy nghĩ đa bước và nhận phản hồi từ các chuyên gia. Mô hình này đánh dấu bước tiến quan trọng trong việc phát triển AI gần hơn với cách tư duy của con người.
Bí quyết của dòng o1, một trong những mô hình AI tiên tiến của OpenAI, là một giai đoạn đào tạo bổ sung được thực hiện trên các mô hình cơ sở như GPT-4. OpenAI có kế hoạch áp dụng kỹ thuật này với các mô hình lớn hơn trong tương lai. Đồng thời, các phòng thí nghiệm AI hàng đầu khác như Anthropic, xAI và Google DeepMind cũng đang phát triển các kỹ thuật tương tự để cải thiện mô hình AI, theo các nguồn tin thân cận.
Kevin Weil, giám đốc sản phẩm của OpenAI, nhận định tại một hội nghị công nghệ rằng họ vẫn có nhiều cơ hội cải thiện mô hình nhanh chóng và khẳng định OpenAI sẽ luôn nỗ lực đi trước các đối thủ. Tuy nhiên, Google, xAI và Anthropic từ chối bình luận về vấn đề này.
Sự thay đổi trong cách phát triển AI đang làm thay đổi bối cảnh cạnh tranh trong ngành công nghiệp phần cứng. Trước đây, nhu cầu chip AI, đặc biệt là từ Nvidia, được thúc đẩy bởi việc đào tạo mô hình khổng lồ. Giờ đây, trọng tâm đang dần chuyển sang các "đám mây suy luận" – các hệ thống phân tán dựa trên đám mây giúp AI thực hiện suy luận nhanh hơn. Điều này có thể tạo ra thách thức mới cho sự thống trị của Nvidia trong thị trường phần cứng AI, đặc biệt là trong lĩnh vực suy luận.
Tuy nhiên, Nvidia vẫn đang dẫn đầu với các chip AI tiên tiến như Blackwell, đáp ứng nhu cầu ngày càng tăng trong giai đoạn suy luận. Tổng giám đốc Jensen Huang của Nvidia đã nhấn mạnh tầm quan trọng của việc đáp ứng nhu cầu này, cho thấy công ty vẫn đang giữ vị thế mạnh mẽ trong ngành.
Mạng lưới này được thiết kế với mục tiêu phủ rộng, giảm chi phí và nâng cao chất lượng dịch vụ, qua đó hạ thấp rào cản tiếp cận tài nguyên tính toán cho các SME...
Thương vụ này được cho là có thể huy động từ 40 tỷ đến 80 tỷ USD – con số đủ để đưa SpaceX vào nhóm những đợt IPO lớn nhất từng được thực hiện trên toàn cầu…
GAM Esports vừa gia nhập danh sách 40 câu lạc bộ thuộc Chương trình Đối tác 20 triệu USD của Esports Foundation, tiếp cận mạng lưới hơn 300 triệu người hâm mộ toàn cầu...
Sora nhanh chóng phải dừng lại khi tài nguyên được công ty mẹ ưu tiên sử dụng vào mục đích khác trong bối cảnh đối thủ cạnh tranh ngày càng mạnh…
Cuộc khủng hoảng nguồn cung naphtha – nguyên liệu đầu vào quan trọng của ngành hóa dầu và sản xuất bán dẫn – đang lan rộng khắp châu Á trong bối cảnh căng thẳng địa chính trị tại Trung Đông leo thang...
Điểm gây tranh cãi lớn nhất chính là cơ cấu sở hữu: TCL nắm 51% cổ phần, trong khi Sony giữ 49%...
Chi tiêu vốn (capex) của các nhà mạng quốc doanh Trung Quốc được dự báo sẽ giảm xuống mức thấp nhất trong vòng 15 năm vào năm 2026, khi làn sóng đầu tư cho hạ tầng 5G đã đi qua giai đoạn cao trào...
Các cố vấn chính phủ Trung Quốc cảnh báo việc phát triển và ứng dụng AI nếu thiếu kiểm soát có thể gây ra những hệ lụy nghiêm trọng về việc làm và an ninh dữ liệu. Họ kêu gọi thiết lập các “lằn ranh đỏ” cho công nghệ này…
Làn sóng niêm yết của các công ty lượng tử diễn ra trong bối cảnh thị trường toàn cầu đầy biến động, khi các xung đột địa chính trị làm suy giảm niềm tin của nhà đầu tư, đặc biệt với các tài sản rủi ro cao như công nghệ mới nổi…
Nguyên nhân đến từ một nghiên cứu mới của Google Research, cho thấy các trung tâm dữ liệu AI trong tương lai có thể cần ít bộ nhớ hơn đáng kể so với kỳ vọng trước đó...