Mô hình o1 của OpenAI tiến gần hơn đến trí thông minh giống con người
Mô hình o1 ra đời với khả năng cải thiện lập luận, đánh dấu bước tiến lớn trong hành trình chinh phục công nghệ AI. Dù vậy, nhiều chuyên gia nhận định, chúng ta còn cả hành trình dài phía trước cần chinh phục để chạm tới đỉnh cao Siêu trí tuệ nhân tạo (AGI)…
Business Insider đưa tin, vào ngày 12/9, OpenAI chính thức ra mắt bản thử nghiệm o1-preview và o1-mini cho một số người dùng trả phí (được gọi là nhóm Strawberry). Mô hình có khả năng giải quyết vấn đề phức tạp hơn so với đa số chatbot AI tạo sinh (GenAI) từ trước đến nay.
CEO Sam Altman nêu rõ sự khác biệt lớn nhất của o1 so với phiên bản tiền nhiệm: "Giờ đây, mô hình AI sẽ dành thời gian phân tích kỹ lưỡng hơn, chia vấn đề thành nhiều tầng logic, rồi đưa ra câu trả lời chi tiết và chính xác nhất". Việc phát triển AI có khả năng suy luận và xử lý vấn đề từ lâu đã trở thành mối quan tâm lớn nhất trong ngành, mặt dù vậy, chưa có thành tích ấn tượng nào được ghi nhận cho đến thời điểm hiện tại.
o1 được kỳ vọng trở thành bước tiến quan trọng trong chiến lược định hướng phát triển AI "biết suy nghĩ" của gã khổng lồ trí tuệ nhân tạo Hoa Kỳ, cải thiện khả năng xử lý và lý luận trong nhiều tình huống phức tạp.
MÔ HÌNH o1: BƯỚC TIẾN TRONG SUY LUẬN
OpenAI mô phỏng o1 theo cách con người dành thời gian suy nghĩ trước khi đưa ra kết luận cuối cùng, từ đó tinh chỉnh quá trình trải nghiệm, áp dụng chiến lược đa dạng và nhận diện rõ yếu điểm của từng phương án. Kết quả thu về vô cùng khả quan, công ty hé lộ o1 đã thể hiện xuất sắc trong đa số lĩnh vực như vật lý, hóa học và sinh học, với khả năng xử lý nhiệm vụ tương đương với trình độ Tiến sĩ.
Trong phiên bản thử nghiệm gần nhất, mô hình o1 tỏ ra vượt trội so với ChatGPT ở mọi khía cạnh. Câu trả lời của o1 không chỉ vô cùng chi tiết mà còn kèm theo dẫn chứng thuyết phục hơn so với lời khuyên sơ sài, ít hữu ích của GPT-4o. Ví dụ, đặt trong bối cảnh kỳ thi tuyển chọn Olympic toán quốc tế (IMO), GPT-4o chỉ giải được 13% bài toán, trong khi o1 có thể giải tới 83%. Ông Jim Fan, nhà nghiên cứu cấp cao tại Nvidia, suy luận: “Bước đột phá chủ yếu đến từ quá trình chuyển lượng lớn sức mạnh tính toán từ giai đoạn đào tạo sang giai đoạn suy luận, giúp mô hình hoạt động hiệu quả hơn”.
Ở chiều ngược lại, các nhà phân tích cũng chỉ ra mô hình o1 dường như đang gặp phải tình trạng "tiến một lùi hai". Mặc dù nổi bật với khả năng suy luận sâu sắc và xử lý câu hỏi phức tạp, nhưng mô hình mới nhất của OpenAI lại thiếu một số yếu tố quan trọng mà GPT-4o từng thể hiện rất tốt.
Cụ thể, o1 không trang bị đa dạng công cụ và khả năng đa phương tiện, đồng thời không đạt được tốc độ phản hồi nhanh nhẹn như GPT-4o. Loạt điểm yếu khiến sáng kiến mới chưa thể hoàn toàn vượt qua các phiên bản trước đó. Dù nhận thức được nhiều tính năng chưa hoàn thiện, OpenAI vẫn thể hiện niềm tin tưởng tuyệt đối vào sản phẩm mới bằng cách gửi gắm cái tên “o1”, như biểu tượng của kỷ nguyên đổi mới.
Ông Noam Brown, nhà nghiên cứu chính tại OpenAI, giải thích thêm: “Các mô hình AI hiện nay được thiết kế để có một chuỗi suy nghĩ riêng”. Trước đây, các mô hình AI bị giới hạn bởi chỉ đào tạo dựa trên dữ liệu sẵn có. Tuy nhiên, o1 hoàn toàn có thể mở rộng khả năng suy luận độc lập, cho phép xử lý thông tin mới lạ dù chưa qua đào tạo.
AGI - VẪN CÒN CHẶNG ĐƯỜNG DÀI PHÍA TRƯỚC
Nhiều chuyên gia đồng ý với OpenAI rằng mô hình o1 đánh dấu bước tiến lớn trong hành trình chinh phục AI tạo sinh. Dẫu vậy, nhận định cuối cùng vẫn là còn quá xa vời để đạt đến điểm đích Siêu trí tuệ nhân tạo (AGI).
Cụ thể, nhiều cuộc thử nghiệm cho thấy o1 vẫn lặp lại vô số lỗi sai giống phần lớn phiên bản trước đó, tạo ra nỗi lo ngại về cách mô hình hoạt động trên quy mô diện rộng. Ông Ethan Mollick, Giáo sư Quản trị tại Trường kinh doanh Wharton (Đại học Pennsylvania, Hoa Kỳ), người được mời trải nghiệm mô hình o1 trước ngày ra mắt, đưa ra quan điểm: “Dù có sự cải thiện rõ rệt về khả năng lý luận, sai sót vẫn xảy ra dẫn đến một số kết quả thiếu trọng tâm hoặc không liên quan đến chủ đề được hỏi".
Tương tự, nhà khoa học Jim Fan cũng nhấn mạnh: “Việc áp dụng o1 vào các sản phẩm thực tế sẽ rất khó khăn”. Chính bản thân công ty cũng đánh giá công nghệ mới chỉ đạt giai đoạn 2/5 trong hành trình chinh phục Siêu trí tuệ nhân tạo.
Rõ ràng, o1 là lựa chọn phù hợp cho các câu hỏi có độ khó và phức tạp, nhưng hiện nay, hầu hết người dùng không sử dụng AI tạo sinh cho dạng câu hỏi như vậy.