"Review" tính năng “Deep research” của OpenAI giữa cơn sốt DeepSeek
Bảo Ngọc
05/02/2025
Nhà phát triển ChatGPT công bố tính năng AI mới trong bối cảnh thách thức ngày càng tăng từ vô số đối thủ toàn cầu, điển hình nhất là DeepSeek của Trung Quốc…
OpenAI vừa thể hiện nỗ lực đẩy nhanh tiến độ phát triển “AI Agent” (tác nhân trí tuệ nhân tạo) bằng cách giới thiệu công cụ mới có khả năng tạo ra các báo cáo mà hãng tuyên bố là sánh ngang với kết quả của một nhà phân tích nghiên cứu trong thời gian dài, theo The Guardian.
Nhà phát triển ChatGPT cho biết công cụ mới, "Deep research", "hoàn thành nghiên cứu mà con người phải mất nhiều giờ chỉ trong 10 phút". Cụ thể, tính năng có thể hoạt động tự động để "lập kế hoạch và thực hiện lộ trình nhiều bước nhằm tìm dữ liệu cần thiết, đồng thời quay lại và phản ứng với thông tin thời gian thực khi cần thiết".
Thông báo được đưa ra chỉ vài ngày sau khi công ty có trụ sở tại San Francisco tiết lộ sẽ đẩy nhanh quá trình phát hành sản phẩm nhằm đáp lại những tiến bộ gần đây mà đối thủ đến từ Trung Quốc DeepSeek đạt được.
CÁCH SỬ DỤNG “DEEP RESEARCH”
“Deep research” là một tác nhân AI – thuật ngữ chỉ hệ thống tự vận hành có khả năng phân tích thông tin, học hỏi từ kinh nghiệm của chính mình và thực hiện nhiệm vụ thay mặt cho người dùng – được hỗ trợ bởi phiên bản mô hình tiên tiến nhất của OpenAI, o3.
OpenAI nhấn mạnh “Deep research” sẽ tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để tạo ra một "báo cáo toàn diện", sàng lọc qua "lượng lớn" văn bản, hình ảnh và PDF.
Công ty cho biết công cụ mới sẽ có sẵn dưới dạng nút ấn trong ChatGPT, đại diện cho "bước tiến quan trọng" hướng tới mục tiêu phát triển trí tuệ nhân tạo tổng quát (AGI). Theo đó, AGI là thuật ngữ lý thuyết dùng để chỉ hệ thống trí tuệ nhân tạo có thể sánh ngang hoặc thậm chí vượt trội hơn con người trong bất kỳ nhiệm vụ trí tuệ nào.
Thay vì chỉ tạo văn bản, “Deep research” còn hiển thị tóm tắt các bước thực hiện trong thanh bên, kèm theo trích dẫn toàn bộ quy trình nghiên cứu để tham khảo.
Người dùng có thể đặt câu hỏi bằng văn bản, hình ảnh và các tệp bổ sung như PDF hoặc bảng tính để thêm ngữ cảnh, sau đó sẽ mất "khoảng 5 đến 30 phút" để hệ thống phát triển phản hồi được cung cấp trong cửa sổ trò chuyện. OpenAI hứa hẹn trong tương lai, các câu trả lời có thể nhúng cả hình ảnh và biểu đồ. Gã khổng lồ trí tuệ nhân tạo cũng lưu ý một số hạn chế, ví dụ như mô hình "đôi khi gặp ảo giác" và bịa đặt hay gặp khó khăn trong việc phân biệt thông tin có thẩm quyền và tin đồn.
NỖ LỰC GIỮ VỮNG VỊ TRÍ DẪN ĐẦU
Tháng trước, OpenAI đã ra mắt Operator, tác nhân AI mà hãng tuyên bố có thể đặt bàn tại nhà hàng hoặc thực hiện giao dịch mua sắm trực tuyến dựa trên ảnh chụp danh sách mua sắm. Tuy nhiên hiện tại, tính năng chỉ hiển thị trên phiên bản xem trước tại Hoa Kỳ.
Trong video demo phát hành vào cuối tuần trước, OpenAI đã trình bày khả năng của “Deep research” trong việc phân tích thị trường ứng dụng dịch thuật. Như đã nói, công cụ mất từ 5 đến 30 phút để hoàn thành mỗi nhiệm vụ và luôn trích dẫn nguồn cho từng tuyên bố được đưa ra.
Tính năng vận hành trên o3, mô hình "lý luận" mới nhất của OpenAI, được cho là mất nhiều thời gian hơn để xử lý truy vấn so với đa số mô hình thông thường và vẫn chưa phát hành phiên bản đầy đủ.
Mô hình trang bị tính năng đạt độ chính xác là 26,6% khi bật công cụ duyệt và python, cao hơn nhiều so với mức 3,3% của GPT-4o và mô hình có điểm cao thứ hai, phiên bản o3-mini, chỉ được đánh giá ở mức 13%.
OpenAI chia sẻ “Deep research” là công cụ dành cho các chuyên gia làm việc trong lĩnh vực như tài chính, khoa học kỹ thuật, nhưng cũng có thể dùng để kiểm tra hàng loạt giao dịch mua trong một số ngành công nghiệp như ô tô và nội thất.
NGUY CƠ TỪ DEEP RESEARCH
Sức mạnh đầy đủ của mô hình o3 được nêu bật trong Báo cáo An toàn AI Quốc tế vừa công bố vào cuối tháng 1/2025. Tác giả chính của nghiên cứu, ông Yoshua Bengio, cho biết khả năng của mô hình "có thể mang ý nghĩa sâu sắc đối với rủi ro AI". Ông Bengio cho biết o3 đã khiến nhiều chuyên gia, bao gồm cả ông, ngạc nhiên với hiệu suất mạnh mẽ trong một bài kiểm tra lý luận trừu tượng quan trọng.
Trong khi đó, “Deep research” sẽ khả dụng tại Hoa Kỳ cho người dùng gói Pro của OpenAI có giá 200 USD/tháng nhưng giới hạn tối đa 100 truy vấn/tháng. OpenAI nhận định tính năng này "rất tốn điện toán", đòi hỏi nhiều tính toán suy luận hơn khi mất thời gian để nghiên cứu một chủ đề nào đó. Hãng cũng nói rằng tất cả người dùng trả phí sẽ đối mặt với giới hạn truy cập cao hơn trong tương lai khi có phiên bản nhanh hơn, tiết kiệm chi phí hơn.
Ông Andrew Rogoyski, Giám đốc Viện People-Centred AI tại Đại học Surrey (Vương quốc Anh), bày tỏ lo ngại về nguy cơ người dùng sử dụng nguyên văn kết quả từ các công cụ như “Deep research” mà không thực hiện kiểm tra chéo.
Giám đốc Rogoyski cho biết: “Có một vấn đề cơ bản với AI chuyên sâu về kiến thức, đó là con người sẽ phải mất nhiều thời gian và công sức để kiểm tra xem khả năng phân tích của máy có thật sự chính xác hay không”.
Những kỹ năng robot được học rất đa dạng: dọn dẹp nhà cửa, massage, sắp xếp hàng hóa trên kệ siêu thị, sửa chữa kim loại hay làm việc trên dây chuyền công nghiệp…
Thông qua thỏa thuận này, ADI và Empower hỗ trợ định hình kiến trúc cung cấp điện năng cho AI cũng như các ứng dụng đòi hỏi năng lực tính toán cao.
Giải thưởng Khoa học Công nghệ toàn cầu VinFuture vừa khép lại vòng đề cử mùa giải 2026 với 1.819 hồ sơ đến từ khắp thế giới, đồng thời ghi nhận mạng lưới hơn 17.000 đối tác đề cử đến từ 117 quốc gia và vùng lãnh thổ...
Cuộc thi hướng đến mục tiêu tìm kiếm và hỗ trợ các sáng kiến công nghệ có khả năng ứng dụng thực tiễn để giải quyết những thách thức môi trường cấp bách tại châu Á, đồng thời thúc đẩy tinh thần đổi mới sáng tạo và hợp tác liên ngành trong thế hệ trẻ...
Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...
CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.
CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...
Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...
Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.
Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…