Mô hình o1 của OpenAI tiến gần hơn đến trí thông minh giống con người
Bảo Ngọc
18/09/2024
Mô hình o1 ra đời với khả năng cải thiện lập luận, đánh dấu bước tiến lớn trong hành trình chinh phục công nghệ AI. Dù vậy, nhiều chuyên gia nhận định, chúng ta còn cả hành trình dài phía trước cần chinh phục để chạm tới đỉnh cao Siêu trí tuệ nhân tạo (AGI)…
Business Insider đưa tin, vào ngày 12/9, OpenAI chính thức ra mắt bản thử nghiệm o1-preview và o1-mini cho một số người dùng trả phí (được gọi là nhóm Strawberry). Mô hình có khả năng giải quyết vấn đề phức tạp hơn so với đa số chatbot AI tạo sinh (GenAI) từ trước đến nay.
CEO Sam Altman nêu rõ sự khác biệt lớn nhất của o1 so với phiên bản tiền nhiệm: "Giờ đây, mô hình AI sẽ dành thời gian phân tích kỹ lưỡng hơn, chia vấn đề thành nhiều tầng logic, rồi đưa ra câu trả lời chi tiết và chính xác nhất". Việc phát triển AI có khả năng suy luận và xử lý vấn đề từ lâu đã trở thành mối quan tâm lớn nhất trong ngành, mặt dù vậy, chưa có thành tích ấn tượng nào được ghi nhận cho đến thời điểm hiện tại.
o1 được kỳ vọng trở thành bước tiến quan trọng trong chiến lược định hướng phát triển AI "biết suy nghĩ" của gã khổng lồ trí tuệ nhân tạo Hoa Kỳ, cải thiện khả năng xử lý và lý luận trong nhiều tình huống phức tạp.
MÔ HÌNH o1: BƯỚC TIẾN TRONG SUY LUẬN
OpenAI mô phỏng o1 theo cách con người dành thời gian suy nghĩ trước khi đưa ra kết luận cuối cùng, từ đó tinh chỉnh quá trình trải nghiệm, áp dụng chiến lược đa dạng và nhận diện rõ yếu điểm của từng phương án. Kết quả thu về vô cùng khả quan, công ty hé lộ o1 đã thể hiện xuất sắc trong đa số lĩnh vực như vật lý, hóa học và sinh học, với khả năng xử lý nhiệm vụ tương đương với trình độ Tiến sĩ.
Trong phiên bản thử nghiệm gần nhất, mô hình o1 tỏ ra vượt trội so với ChatGPT ở mọi khía cạnh. Câu trả lời của o1 không chỉ vô cùng chi tiết mà còn kèm theo dẫn chứng thuyết phục hơn so với lời khuyên sơ sài, ít hữu ích của GPT-4o. Ví dụ, đặt trong bối cảnh kỳ thi tuyển chọn Olympic toán quốc tế (IMO), GPT-4o chỉ giải được 13% bài toán, trong khi o1 có thể giải tới 83%. Ông Jim Fan, nhà nghiên cứu cấp cao tại Nvidia, suy luận: “Bước đột phá chủ yếu đến từ quá trình chuyển lượng lớn sức mạnh tính toán từ giai đoạn đào tạo sang giai đoạn suy luận, giúp mô hình hoạt động hiệu quả hơn”.
Ở chiều ngược lại, các nhà phân tích cũng chỉ ra mô hình o1 dường như đang gặp phải tình trạng "tiến một lùi hai". Mặc dù nổi bật với khả năng suy luận sâu sắc và xử lý câu hỏi phức tạp, nhưng mô hình mới nhất của OpenAI lại thiếu một số yếu tố quan trọng mà GPT-4o từng thể hiện rất tốt.
Cụ thể, o1 không trang bị đa dạng công cụ và khả năng đa phương tiện, đồng thời không đạt được tốc độ phản hồi nhanh nhẹn như GPT-4o. Loạt điểm yếu khiến sáng kiến mới chưa thể hoàn toàn vượt qua các phiên bản trước đó. Dù nhận thức được nhiều tính năng chưa hoàn thiện, OpenAI vẫn thể hiện niềm tin tưởng tuyệt đối vào sản phẩm mới bằng cách gửi gắm cái tên “o1”, như biểu tượng của kỷ nguyên đổi mới.
Ông Noam Brown, nhà nghiên cứu chính tại OpenAI, giải thích thêm: “Các mô hình AI hiện nay được thiết kế để có một chuỗi suy nghĩ riêng”. Trước đây, các mô hình AI bị giới hạn bởi chỉ đào tạo dựa trên dữ liệu sẵn có. Tuy nhiên, o1 hoàn toàn có thể mở rộng khả năng suy luận độc lập, cho phép xử lý thông tin mới lạ dù chưa qua đào tạo.
AGI - VẪN CÒN CHẶNG ĐƯỜNG DÀI PHÍA TRƯỚC
Nhiều chuyên gia đồng ý với OpenAI rằng mô hình o1 đánh dấu bước tiến lớn trong hành trình chinh phục AI tạo sinh. Dẫu vậy, nhận định cuối cùng vẫn là còn quá xa vời để đạt đến điểm đích Siêu trí tuệ nhân tạo (AGI).
Cụ thể, nhiều cuộc thử nghiệm cho thấy o1 vẫn lặp lại vô số lỗi sai giống phần lớn phiên bản trước đó, tạo ra nỗi lo ngại về cách mô hình hoạt động trên quy mô diện rộng. Ông Ethan Mollick, Giáo sư Quản trị tại Trường kinh doanh Wharton (Đại học Pennsylvania, Hoa Kỳ), người được mời trải nghiệm mô hình o1 trước ngày ra mắt, đưa ra quan điểm: “Dù có sự cải thiện rõ rệt về khả năng lý luận, sai sót vẫn xảy ra dẫn đến một số kết quả thiếu trọng tâm hoặc không liên quan đến chủ đề được hỏi".
Tương tự, nhà khoa học Jim Fan cũng nhấn mạnh: “Việc áp dụng o1 vào các sản phẩm thực tế sẽ rất khó khăn”. Chính bản thân công ty cũng đánh giá công nghệ mới chỉ đạt giai đoạn 2/5 trong hành trình chinh phục Siêu trí tuệ nhân tạo.
Rõ ràng, o1 là lựa chọn phù hợp cho các câu hỏi có độ khó và phức tạp, nhưng hiện nay, hầu hết người dùng không sử dụng AI tạo sinh cho dạng câu hỏi như vậy.
Những kỹ năng robot được học rất đa dạng: dọn dẹp nhà cửa, massage, sắp xếp hàng hóa trên kệ siêu thị, sửa chữa kim loại hay làm việc trên dây chuyền công nghiệp…
Thông qua thỏa thuận này, ADI và Empower hỗ trợ định hình kiến trúc cung cấp điện năng cho AI cũng như các ứng dụng đòi hỏi năng lực tính toán cao.
Giải thưởng Khoa học Công nghệ toàn cầu VinFuture vừa khép lại vòng đề cử mùa giải 2026 với 1.819 hồ sơ đến từ khắp thế giới, đồng thời ghi nhận mạng lưới hơn 17.000 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ...
Cuộc thi hướng đến mục tiêu tìm kiếm và hỗ trợ các sáng kiến công nghệ có khả năng ứng dụng thực tiễn để giải quyết những thách thức môi trường cấp bách tại châu Á, đồng thời thúc đẩy tinh thần đổi mới sáng tạo và hợp tác liên ngành trong thế hệ trẻ...
Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...
CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.
CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...
Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...
Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.
Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…