"Review" tính năng “Deep research” của OpenAI giữa cơn sốt DeepSeek
Bảo Ngọc
05/02/2025
Nhà phát triển ChatGPT công bố tính năng AI mới trong bối cảnh thách thức ngày càng tăng từ vô số đối thủ toàn cầu, điển hình nhất là DeepSeek của Trung Quốc…
OpenAI vừa thể hiện nỗ lực đẩy nhanh tiến độ phát triển “AI Agent” (tác nhân trí tuệ nhân tạo) bằng cách giới thiệu công cụ mới có khả năng tạo ra các báo cáo mà hãng tuyên bố là sánh ngang với kết quả của một nhà phân tích nghiên cứu trong thời gian dài, theo The Guardian.
Nhà phát triển ChatGPT cho biết công cụ mới, "Deep research", "hoàn thành nghiên cứu mà con người phải mất nhiều giờ chỉ trong 10 phút". Cụ thể, tính năng có thể hoạt động tự động để "lập kế hoạch và thực hiện lộ trình nhiều bước nhằm tìm dữ liệu cần thiết, đồng thời quay lại và phản ứng với thông tin thời gian thực khi cần thiết".
Thông báo được đưa ra chỉ vài ngày sau khi công ty có trụ sở tại San Francisco tiết lộ sẽ đẩy nhanh quá trình phát hành sản phẩm nhằm đáp lại những tiến bộ gần đây mà đối thủ đến từ Trung Quốc DeepSeek đạt được.
CÁCH SỬ DỤNG “DEEP RESEARCH”
“Deep research” là một tác nhân AI – thuật ngữ chỉ hệ thống tự vận hành có khả năng phân tích thông tin, học hỏi từ kinh nghiệm của chính mình và thực hiện nhiệm vụ thay mặt cho người dùng – được hỗ trợ bởi phiên bản mô hình tiên tiến nhất của OpenAI, o3.
OpenAI nhấn mạnh “Deep research” sẽ tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để tạo ra một "báo cáo toàn diện", sàng lọc qua "lượng lớn" văn bản, hình ảnh và PDF.
Công ty cho biết công cụ mới sẽ có sẵn dưới dạng nút ấn trong ChatGPT, đại diện cho "bước tiến quan trọng" hướng tới mục tiêu phát triển trí tuệ nhân tạo tổng quát (AGI). Theo đó, AGI là thuật ngữ lý thuyết dùng để chỉ hệ thống trí tuệ nhân tạo có thể sánh ngang hoặc thậm chí vượt trội hơn con người trong bất kỳ nhiệm vụ trí tuệ nào.
Thay vì chỉ tạo văn bản, “Deep research” còn hiển thị tóm tắt các bước thực hiện trong thanh bên, kèm theo trích dẫn toàn bộ quy trình nghiên cứu để tham khảo.
Người dùng có thể đặt câu hỏi bằng văn bản, hình ảnh và các tệp bổ sung như PDF hoặc bảng tính để thêm ngữ cảnh, sau đó sẽ mất "khoảng 5 đến 30 phút" để hệ thống phát triển phản hồi được cung cấp trong cửa sổ trò chuyện. OpenAI hứa hẹn trong tương lai, các câu trả lời có thể nhúng cả hình ảnh và biểu đồ. Gã khổng lồ trí tuệ nhân tạo cũng lưu ý một số hạn chế, ví dụ như mô hình "đôi khi gặp ảo giác" và bịa đặt hay gặp khó khăn trong việc phân biệt thông tin có thẩm quyền và tin đồn.
NỖ LỰC GIỮ VỮNG VỊ TRÍ DẪN ĐẦU
Tháng trước, OpenAI đã ra mắt Operator, tác nhân AI mà hãng tuyên bố có thể đặt bàn tại nhà hàng hoặc thực hiện giao dịch mua sắm trực tuyến dựa trên ảnh chụp danh sách mua sắm. Tuy nhiên hiện tại, tính năng chỉ hiển thị trên phiên bản xem trước tại Hoa Kỳ.
Trong video demo phát hành vào cuối tuần trước, OpenAI đã trình bày khả năng của “Deep research” trong việc phân tích thị trường ứng dụng dịch thuật. Như đã nói, công cụ mất từ 5 đến 30 phút để hoàn thành mỗi nhiệm vụ và luôn trích dẫn nguồn cho từng tuyên bố được đưa ra.
Tính năng vận hành trên o3, mô hình "lý luận" mới nhất của OpenAI, được cho là mất nhiều thời gian hơn để xử lý truy vấn so với đa số mô hình thông thường và vẫn chưa phát hành phiên bản đầy đủ.
Mô hình trang bị tính năng đạt độ chính xác là 26,6% khi bật công cụ duyệt và python, cao hơn nhiều so với mức 3,3% của GPT-4o và mô hình có điểm cao thứ hai, phiên bản o3-mini, chỉ được đánh giá ở mức 13%.
OpenAI chia sẻ “Deep research” là công cụ dành cho các chuyên gia làm việc trong lĩnh vực như tài chính, khoa học kỹ thuật, nhưng cũng có thể dùng để kiểm tra hàng loạt giao dịch mua trong một số ngành công nghiệp như ô tô và nội thất.
NGUY CƠ TỪ DEEP RESEARCH
Sức mạnh đầy đủ của mô hình o3 được nêu bật trong Báo cáo An toàn AI Quốc tế vừa công bố vào cuối tháng 1/2025. Tác giả chính của nghiên cứu, ông Yoshua Bengio, cho biết khả năng của mô hình "có thể mang ý nghĩa sâu sắc đối với rủi ro AI". Ông Bengio cho biết o3 đã khiến nhiều chuyên gia, bao gồm cả ông, ngạc nhiên với hiệu suất mạnh mẽ trong một bài kiểm tra lý luận trừu tượng quan trọng.
Trong khi đó, “Deep research” sẽ khả dụng tại Hoa Kỳ cho người dùng gói Pro của OpenAI có giá 200 USD/tháng nhưng giới hạn tối đa 100 truy vấn/tháng. OpenAI nhận định tính năng này "rất tốn điện toán", đòi hỏi nhiều tính toán suy luận hơn khi mất thời gian để nghiên cứu một chủ đề nào đó. Hãng cũng nói rằng tất cả người dùng trả phí sẽ đối mặt với giới hạn truy cập cao hơn trong tương lai khi có phiên bản nhanh hơn, tiết kiệm chi phí hơn.
Ông Andrew Rogoyski, Giám đốc Viện People-Centred AI tại Đại học Surrey (Vương quốc Anh), bày tỏ lo ngại về nguy cơ người dùng sử dụng nguyên văn kết quả từ các công cụ như “Deep research” mà không thực hiện kiểm tra chéo.
Giám đốc Rogoyski cho biết: “Có một vấn đề cơ bản với AI chuyên sâu về kiến thức, đó là con người sẽ phải mất nhiều thời gian và công sức để kiểm tra xem khả năng phân tích của máy có thật sự chính xác hay không”.
Trung Quốc tham vọng biến hạ tầng trí tuệ nhân tạo (AI) thành một loại tiện ích công cộng tương tự điện, nước hay viễn thông...
CIVAMS.FACE-FAS, giải pháp chống giả mạo khuôn mặt do CMC ATI phát triển, vượt qua bài đánh giá iBeta Level 1 theo tiêu chuẩn ISO/IEC 30107-3, tiếp tục ghi dấu năng lực AI “Make in Vietnam” trên các bảng xếp hạng quốc tế.
CMC hợp nhất năng lực tư vấn vào CMC TS, bổ nhiệm ông Nguyễn Hải Sơn làm Quyền Tổng Giám đốc, đồng thời đưa AI-X trở thành trục tăng trưởng chính trong chiến lược giai đoạn 2026-2030...
Trung tâm sẽ góp phần củng cố mạng lưới R&D toàn cầu của Qualcomm Technologies thông qua việc tận dụng nguồn nhân lực công nghệ đang trên đà phát triển nhanh chóng tại Việt Nam, đồng thời thúc đẩy các mối quan hệ hợp tác chặt chẽ hơn tại địa phương...
Nghiên cứu mới tại khu vực châu Á - Thái Bình Dương nhấn mạnh vai trò thiết yếu của các công cụ định tuyến theo thời gian thực, cảnh báo an toàn và hướng dẫn bằng giọng nói trong việc hỗ trợ người tham gia giao thông bằng xe hai bánh tại Việt Nam.
Việc kiến tạo hệ sinh thái hạ tầng năng lượng xanh dùng chung đánh dấu bước ngoặt chiến lược nhằm hóa giải "nút thắt" về trạm sạc và đổi pin, tạo động lực thực tế để thúc đẩy lộ trình điện hóa giao thông tại Việt Nam…
Thay vì tiếp tục phụ thuộc vào phương pháp thử-sai truyền thống, các công ty dược đang chuyển hướng sang AI với kỳ vọng tận dụng sức mạnh tính toán để rút ngắn thời gian và tăng xác suất thành công...
Chương trình mang đến cơ hội thực hành trực tiếp trên các trang thiết bị chuyên dụng, làm cầu nối giữa kiến thức học thuật và thực tiễn ngành, đặc biệt là trong khâu đóng gói và kiểm thử chip.
Sự ra đời của công nghệ truyền dẫn âm thanh thế hệ 2.0 với khả năng tích hợp Ethernet liền mạch đang trở thành mắt xích quan trọng giúp các hãng xe tối ưu hóa hạ tầng kết nối và đáp ứng nhu cầu ngày càng cao về giải trí đa phương tiện trên ô tô…
Trước tình trạng thiếu hụt lao động ngày càng trầm trọng, Japan Airlines đã bắt đầu thử nghiệm robot hình người tại sân bay Haneda (Tokyo) nhằm hỗ trợ các công việc mặt đất như bốc xếp hành lý và vệ sinh khoang máy bay…