Công nghệ AI đang “tới ngưỡng”, OpenAI và các Big Tech tìm cách làm cho AI thông minh hơn
Hoàng Hà
06/12/2024
Các phòng thí nghiệm AI đang tiêu tốn hàng chục triệu đô la đào tạo mô hình, sử dụng hàng trăm chip cùng lúc, nhưng dễ gặp lỗi phần cứng và thiếu dữ liệu đầu vào chất lượng. Quá trình này còn đòi hỏi nguồn năng lượng khổng lồ...
Các công ty AI như OpenAI đang tìm kiếm cách mới để vượt qua những thách thức trong việc phát triển các mô hình ngôn ngữ lớn hơn. Một chiến lược mới là áp dụng các kỹ thuật huấn luyện mô hình có xu hướng giống con người hơn, nhằm giúp các thuật toán xử lý thông tin theo cách "suy nghĩ" tự nhiên hơn.
AI ĐANG ĐẠT ĐẾN GIỚI HẠN?
Hàng chục nhà khoa học và nhà nghiên cứu trong lĩnh vực AI tin rằng những phương pháp này, được sử dụng trong mô hình mới nhất của OpenAI (được gọi là o1), có thể thay đổi cục diện cạnh tranh trong lĩnh vực AI. Các kỹ thuật này không chỉ cải thiện hiệu suất mô hình mà còn ảnh hưởng lớn đến nhu cầu tài nguyên khổng lồ của ngành AI, bao gồm năng lượng và chip máy tính.
Trước đây, các công ty AI thường tập trung vào việc "mở rộng quy mô" mô hình bằng cách thêm nhiều dữ liệu và sức mạnh tính toán để cải thiện hiệu suất. Tuy nhiên, các chuyên gia hiện đang thảo luận về giới hạn của chiến lược này. Tiến sĩ Ilya Sutskever, đồng sáng lập OpenAI và Phòng thí nghiệm AI Safe Superintelligence (SSI), cho biết hiệu quả của việc mở rộng quy mô đào tạo mô hình với dữ liệu lớn dường như đang chững lại. Điều này thúc đẩy việc nghiên cứu các cách tiếp cận sáng tạo hơn để phát triển AI.
Tiến sĩ Ilya Sutskever, một trong những người tiên phong trong lĩnh vực AI tạo sinh, đã thúc đẩy sự phát triển của các mô hình AI lớn thông qua việc tăng cường dữ liệu và sức mạnh tính toán, đóng vai trò quan trọng trong việc tạo ra ChatGPT. Tuy nhiên, vào đầu năm 2024, ông rời OpenAI để thành lập phòng thí nghiệm Safe Superintelligence Initiative (SSI), tập trung vào cách tiếp cận mới để đào tạo AI.
Tiến sĩ Sutskever cho rằng kỷ nguyên phát triển AI của những năm 2010 gắn liền với việc "mở rộng quy mô" đã đạt đến giới hạn. Ông tin rằng ngành AI đang bước vào giai đoạn khám phá sáng tạo hơn. SSI hiện đang nghiên cứu một phương pháp mới để tối ưu hóa quá trình đào tạo, mặc dù ông chưa tiết lộ chi tiết.
Đằng sau hậu trường, các phòng thí nghiệm AI hàng đầu đối mặt với nhiều thách thức khi phát triển các mô hình ngôn ngữ lớn hơn. Những mô hình này tiêu tốn hàng chục triệu đô la để đào tạo, sử dụng hàng trăm chip cùng lúc, nhưng dễ gặp lỗi phần cứng và thiếu dữ liệu đầu vào chất lượng. Quá trình đào tạo cũng đòi hỏi nguồn năng lượng khổng lồ, đôi khi bị cản trở bởi tình trạng thiếu điện.
TÌM CÁCH ĐỂ AI THÔNG MINH HƠN NỮA, BIẾT SUY NGHĨ "NHƯ CON NGƯỜI"
Để khắc phục, các nhà nghiên cứu đã áp dụng kỹ thuật mới như "tính toán thời gian thử nghiệm," giúp các mô hình suy nghĩ nhiều bước như con người trong giai đoạn "suy luận." Thay vì chọn ngay câu trả lời, các mô hình này đánh giá nhiều khả năng và chọn giải pháp tốt nhất. Phương pháp này cải thiện hiệu suất đáng kể, đặc biệt trong các nhiệm vụ phức tạp như toán học hoặc mã hóa.
Ví dụ, Tiến sĩ Noam Brown từ OpenAI chia sẻ rằng cho mô hình "suy nghĩ" thêm 20 giây trong một ván bài poker mang lại hiệu quả tương tự như tăng kích thước và thời gian đào tạo lên 100.000 lần. OpenAI đã áp dụng kỹ thuật này vào mô hình mới nhất của họ, "o1," với khả năng suy nghĩ đa bước và nhận phản hồi từ các chuyên gia. Mô hình này đánh dấu bước tiến quan trọng trong việc phát triển AI gần hơn với cách tư duy của con người.
Bí quyết của dòng o1, một trong những mô hình AI tiên tiến của OpenAI, là một giai đoạn đào tạo bổ sung được thực hiện trên các mô hình cơ sở như GPT-4. OpenAI có kế hoạch áp dụng kỹ thuật này với các mô hình lớn hơn trong tương lai. Đồng thời, các phòng thí nghiệm AI hàng đầu khác như Anthropic, xAI và Google DeepMind cũng đang phát triển các kỹ thuật tương tự để cải thiện mô hình AI, theo các nguồn tin thân cận.
Kevin Weil, giám đốc sản phẩm của OpenAI, nhận định tại một hội nghị công nghệ rằng họ vẫn có nhiều cơ hội cải thiện mô hình nhanh chóng và khẳng định OpenAI sẽ luôn nỗ lực đi trước các đối thủ. Tuy nhiên, Google, xAI và Anthropic từ chối bình luận về vấn đề này.
Sự thay đổi trong cách phát triển AI đang làm thay đổi bối cảnh cạnh tranh trong ngành công nghiệp phần cứng. Trước đây, nhu cầu chip AI, đặc biệt là từ Nvidia, được thúc đẩy bởi việc đào tạo mô hình khổng lồ. Giờ đây, trọng tâm đang dần chuyển sang các "đám mây suy luận" – các hệ thống phân tán dựa trên đám mây giúp AI thực hiện suy luận nhanh hơn. Điều này có thể tạo ra thách thức mới cho sự thống trị của Nvidia trong thị trường phần cứng AI, đặc biệt là trong lĩnh vực suy luận.
Tuy nhiên, Nvidia vẫn đang dẫn đầu với các chip AI tiên tiến như Blackwell, đáp ứng nhu cầu ngày càng tăng trong giai đoạn suy luận. Tổng giám đốc Jensen Huang của Nvidia đã nhấn mạnh tầm quan trọng của việc đáp ứng nhu cầu này, cho thấy công ty vẫn đang giữ vị thế mạnh mẽ trong ngành.
Tập đoàn công nghệ Nvidia vừa đưa ra một dự báo đầy tham vọng: tổng doanh thu có thể đạt tới 1.000 tỷ USD trong giai đoạn đến năm 2027, khi nhu cầu đối với chip trí tuệ nhân tạo tiếp tục tăng mạnh...
Sự bùng nổ của trí tuệ nhân tạo (AI) đang tạo ra một hệ quả đáng chú ý: các tập đoàn công nghệ lớn gia tăng mạnh việc mua tín chỉ carbon để bù đắp lượng khí thải phát sinh từ quá trình mở rộng hạ tầng phục vụ AI…
Từ tình trạng thiếu RAM toàn cầu đẩy giá console lên cao đến làn sóng mất việc trong ngành, ngành công nghiệp game đang trở thành một trong những “nạn nhân” lớn nhất của cơn bùng nổ AI...
Chính quyền một số địa phương tại Trung Quốc đã nhanh chóng khuyến khích ứng dụng OpenClaw dù có một số nghi ngại liên quan đến công cụ này…
Cơn sốt cài đặt tác nhân AI OpenClaw tại Trung Quốc đang có bước ngoặt trớ trêu: sau khi trả tiền để cài đặt, nhiều người dùng nay lại tiếp tục chi tiền để gỡ bỏ phần mềm này…
Khi các trung tâm dữ liệu AI tiêu thụ hơn một nửa lượng DRAM của thế giới, các hãng máy tính cá nhân như Lenovo, HP, Dell, Asus hay Acer đang chịu áp lực lớn phải tăng giá sản phẩm hoặc cắt giảm cấu hình...
Trung Đông – khu vực tưởng chừng ít liên quan đến ngành chip – thực tế lại nắm giữ nhiều nguyên liệu chiến lược như heli và bromine...
Là thế hệ am hiểu công nghệ và có khẩu vị rủi ro cao, Gen Z đang dần thay đổi thói quen đầu tư khi ưu tiên sử dụng trí tuệ nhân tạo và các diễn đàn trực tuyến để đưa ra quyết định chọn mã cổ phiếu...
Định hướng xây dựng “nền kinh tế thông minh” đang trở thành trụ cột trong chiến lược phát triển mới của Trung Quốc. Nhà đầu tư săn tìm làn sóng cổ phiếu công nghệ mới...
Nhà sản xuất bán dẫn theo hợp đồng lớn nhất thế giới – TSMC – cho biết sẽ tuyển khoảng 8.000 nhân viên trong năm 2026 nhằm đáp ứng nhu cầu mở rộng sản xuất và phát triển các công nghệ bán dẫn thế hệ mới...