image Thứ Tư, 10/12/2025

"Đặt lên bàn cân" ưu và nhược điểm của các chatbot AI hàng đầu thế giới

Sơn Trần

26/06/2024

Chia sẻ

Nhóm phóng viên Yahoo Tech đã thực hiện bài đánh giá, so sánh các chatbot như Meta AI, ChatGPT và Google Gemini ở đa số tác vụ hàng ngày mà người dùng hay sử dụng để đánh giá ưu, nhược điểm và tìm ra chatbot thông minh nhất...

Cuộc cạnh tranh giữa ba công cụ lớn AI của Meta, ChatGPT của Open AI và Gemini của Google ngày càng khốc liệt.
Cuộc cạnh tranh giữa ba công cụ lớn AI của Meta, ChatGPT của Open AI và Gemini của Google ngày càng khốc liệt.

Ngành công nghệ đang chứng kiến sự tiến bộ vượt bậc của các chatbot chỉ trong thời gian ngắn. Nhóm phóng viên Yahoo Tech mới đây đã thực hiện bài đánh giá, so sánh từng công cụ ở đa số tác vụ hàng ngày mà người dùng hay sử dụng. Những lĩnh vực được kiểm tra bao gồm email, toán học, công thức nấu ăn, lập trình và một số nhiệm vụ khác.

Từ đó, bài đánh giá sẽ cho biết chatbot AI nào cung cấp câu trả lời toàn diện, chính xác nhất và trích dẫn nguồn khi cần thiết. Trong bài viết này, tác giả sử dụng ChatGPT phiên bản 4.0.

SOẠN THẢO EMAIL

Thử thách đầu tiên của ba công cụ là viết email theo yêu cầu.
Thử thách đầu tiên của ba công cụ là viết email theo yêu cầu.

Nhiều người dùng bắt đầu sử dụng AI để hỗ trợ công việc văn phòng đơn giản, vì vậy nhóm phóng viên yêu cầu cả ba chatbot AI "viết email đề xuất xin gia hạn dự án".

Mỗi chatbot đều xuất sắc cho ra nội dung email tốt, thể hiện rõ tính trang trọng và chuyên nghiệp. Email đều theo dạng mẫu, nghĩa là sau đó người dùng phải cá nhân hóa và bổ sung thêm thông tin liên quan.

Trong thử thách viết email, Meta AI, ChatGPT và Google Gemini đều đạt điểm tuyệt đối. Tất nhiên, đây là yêu cầu cơ bản và dễ thực hiện nhất.

CUNG CẤP CÔNG THỨC NẤU ĂN

Đối với thử thách này, nhóm yêu cầu ba chatbot "cung cấp công thức nấu ớt". Mỗi công cụ đều cho ra công thức nấu chi tiết, tuy nhiên đã có sự khác biệt.

Điểm khác biệt lớn giữa các chatbot là khả năng trích dẫn nguồn công thức. Cả Meta AI và Gemini đều ghi rõ nguồn công thức ở cuối câu trả lời, đồng thời hiển thị liên kết đến trang web được sử dụng. Thậm chí, Gemini còn cung cấp thêm một vài công thức liên quan ở cuối bài.

Tuy nhiên, ChatGPT hoàn toàn không trích dẫn nguồn, câu trả lời chỉ đơn giản là sao chép toàn bộ công thức từ một trang web không rõ ràng. Liệu công cụ có đạo văn không hay tự nghĩ ra công thức? Nếu vậy, ChatGPT có thể mắc lỗi trong quá trình hướng dẫn nấu ăn, gây rủi ro cho người thực hiện khi không thể kiểm tra lại.

Về tác vụ này, nhóm nghiên cứu sẽ sử dụng Gemini hoặc Meta AI để tìm công thức nấu ăn, vì người dùng có thể theo dõi và xác minh nguồn công thức, từ đó đảm bảo an toàn thực phẩm.

TỔNG HỢP TIN TỨC

Tổng hợp tin tức là một trong các tính năng giúp độc giả tiếp cận thông tin nhanh chóng và tiết kiệm thời gian.
Tổng hợp tin tức là một trong các tính năng giúp độc giả tiếp cận thông tin nhanh chóng và tiết kiệm thời gian.

Nhóm thử nghiệm yêu cầu chatbot "cung cấp danh sách tin tức nổi bật mới nhất trong ngày". Cả ba đều thực hiện khá nhanh khi sao chép tiêu đề với một ít nội dung chung của bài báo. Và một lần nữa, sự khác biệt giữa các chatbot AI nằm ở cách công cụ dẫn nguồn tin.

Cả ChatGPT và Meta AI đều liên kết trực tiếp đến trang tin mà công cụ trích dẫn, trong đó ChatGPT còn hiển thị liên kết của nhiều nguồn sau nội dung tiêu đề. Trong khi đó, Gemini nhắc đến các trang tin khác nhau mà công cụ sử dụng nhưng không đính kèm link.

ChatGPT và Meta AI dường như là chatbot tốt nhất khi thực hiện yêu cầu tổng hợp tin tức. Hai công cụ có liên kết rõ ràng đến nguồn thông tin thay vì lấy từ một trang web không xác định và không trích dẫn.

GIẢI BÀI TẬP TOÁN

Ở thử thách này, tác giả đưa ra hai đề toán học: một đại số và một hình học.

Bài toán thứ nhất là "xác định tất cả các giá trị của biểu thức A³ B³ C³ — 3ABC trong đó A, B và C là các số nguyên không âm". Bài toán thứ hai là "cho tam giác ∆ABC, trong đó G là trọng tâm và I là tâm đường tròn nội tiếp. Cho α và β lần lượt là các góc tại đỉnh A và B. Giả sử đoạn thẳng IG song song với AB và β = 2 tan^-1 (1/3). Tìm α".

Trong câu hỏi đại số, cả ba chatbot sử dụng ba phương pháp riêng biệt để giải quyết bài toán và đều cho ra kết quả giống nhau.

Tuy nhiên, chatbot đã gặp không ít khó khăn ở bài toán thứ hai. Ban đầu, ChatGPT giải quyết bài toán khá tốt nhưng đáp án cuối cùng lại không chính xác. Gemini cũng giải quyết bài toán nhưng không đưa ra kết quả cuối cùng. Thay vào đó, công cụ gợi ý lý thuyết và công thức giúp người dùng tự tìm câu trả lời. Chỉ có Meta AI là giải được bài toán, cung cấp kết quả chính xác và các bước rõ ràng.

Nếu bạn đang tìm kiếm chatbot có thể giải bài tập toán học, thì Meta AI là lựa chọn tốt nhất.

KHẢ NĂNG LẬP TRÌNH

Khả năng viết mã của AI gây ra nhiều nỗi lo mất việc.
Khả năng viết mã của AI gây ra nhiều nỗi lo mất việc.

Nhóm phóng viên yêu cầu mỗi chatbot AI lập trình theo đề bài sau:

'Tạo ra phiên bản nâng cấp hơn của trò chơi cờ caro với kích thước 12x12. Trò chơi vẫn sử dụng ký hiệu "x" và "o". Người chơi có thể đặt "x" hoặc "o" vào bất kỳ ô trống nào để ngăn chặn nước đi tiếp theo của đối thủ. Mục tiêu để chiến thắng là trở thành người đầu tiên có ít nhất sáu "x" hoặc "o" trên cùng một hàng, cột hoặc đường chéo trước đối thủ. Lưu ý, người chơi là "x" và người chơi "o" là khác nhau. Hãy lập trình trò chơi này bằng HTML và JavaScript đơn giản. Trò chơi này có tên: Tic-Tac-Go".

Để hoàn thành, mỗi chatbot cần cung cấp mã hoàn chỉnh bằng cả HTML và JavaScript (cấu trúc cơ bản của trang web).

Meta AI và ChatGPT cung cấp chính xác những gì được yêu cầu bằng cả hai ngôn ngữ lập trình. Còn Gemini cho ra kết quả JavaScript nhưng sau đó quyết định thay thế bằng HTML và CSS.

Nếu bạn đang tìm kiếm chatbot AI có thể lập trình thì Meta AI và ChatGPT là lựa chọn phù hợp.

GIẢ LẬP PHỎNG VẤN

Cuối cùng, nhóm phóng viên đề nghị chatbot "thực hiện một buổi phỏng vấn giả định cho vị trí biên tập viên mảng công nghệ tại một cơ quan tạp chí lớn". Với yêu cầu này, mỗi chatbot đều mô phỏng tốt buổi phỏng vấn giữa nhà tuyển dụng và ứng viên. 

Cả ba mô hình giả lập cuộc phỏng vấn theo cách khác nhau, nhưng đều kết thúc với kết quả vui vẻ. Mặc dù người dùng cần bổ sung thêm câu hỏi chi tiết trước khi đưa vào sử dụng thực tế, nhưng đây vẫn là những thông tin giá trị với doanh nghiệp.

 CHATBOT THÔNG MINH NHẤT THEO BÀI TEST

Sau khi kiểm đếm kết quả, về tổng thể Meta AI là chatbot AI tốt nhất. Meta AI có kết quả nhất quán nhất với nhiều yêu cầu khác nhau, giúp công cụ đáng tin cậy hơn so với đối thủ cạnh tranh.

ChatGPT đứng ở vị trí thứ hai bởi tính nhất quán trong câu trả lời khá tốt. Nhóm đánh giá cũng thực hiện thêm so sánh với mô hình cũ 3.5 và nhận thấy có sự cải tiến lớn giữa hai phiên bản. Rõ ràng, OpenAI đang làm tốt qua mỗi bản cập nhật.

Google Gemini xếp cuối bảng bởi công cụ được đánh giá là chatbot AI thiếu nhất quán nhất trong nhóm. Khoảng thời gian ban đầu, khi còn được gọi là Google Bard, công ty đã gặp không ít khó khăn và cho đến ngày nay công cụ vẫn đang cố gắng theo kịp đối thủ.


Các công ty hàng đầu chưa có kế hoạch kiểm soát siêu trí tuệ nhân tạo

Báo cáo Winter AI Safety Index 2025 chỉ ra rằng các công ty AI lớn như OpenAI và Google DeepMind không có chiến lược đáng tin cậy để kiểm soát rủi ro siêu trí tuệ.

14:23 09/12/2025
Singapore triển khai máy tính lượng tử thương mại đầu tiên

Horizon Quantum công bố máy tính lượng tử thương mại đầu tiên tại Singapore, đánh dấu bước tiến quan trọng trong lĩnh vực công nghệ cao.

14:23 09/12/2025
DeepSeek ra mắt V3.2, cạnh tranh GPT-5 và Gemini 3

DeepSeek công bố mô hình V3.2 với khả năng cạnh tranh mạnh mẽ, đạt thành tích cao trong kiểm tra toán học quốc tế, tối ưu hóa hiệu suất tính toán.

14:23 09/12/2025
Từ robot "trí tuệ vật lý" đến trái tim mềm: Bốn đột phá khoa học tái định hình tương lai con người

Tại Tuần lễ Khoa học VinFuture 2025, các nhà khoa học giới thiệu bốn đột phá trong robot, y học và nông nghiệp thông minh, mở ra tương lai mới cho nhân loại.

14:52 02/12/2025
Baidu nổi lên như đại gia mới ngành chip, lấp đầy khoảng trống của Nvidia tại Trung Quốc

Baidu đang nổi lên như đối thủ chính trong ngành chip AI tại Trung Quốc, với mảng chip Kunlunxin dự kiến tăng trưởng mạnh mẽ trong bối cảnh thiếu hụt nguồn cung.

09:29 02/12/2025
Khi mô hình 3 chiều, VR và AI ứng dụng trong phòng phẫu thuật

Startup Holocare phát triển công nghệ VR giúp bác sĩ phẫu thuật mô phỏng cơ quan 3D, nâng cao hiệu quả và an toàn trong ca mổ.

10:48 01/12/2025
Nhóm sinh viên Mỹ sáng chế robot chịu nhiệt hơn 650°C

Nhóm sinh viên Texas phát triển robot FireBot giúp lính cứu hỏa thu thập thông tin trong đám cháy, chịu nhiệt lên đến 650°C, nâng cao an toàn cứu hộ.

10:48 01/12/2025
Điều khiển nhà máy cách xa 300km: Lời giải cho thiếu hụt lao động tại Nhật Bản

NTT và Toshiba đã chứng minh khả năng điều khiển nhà máy từ 300km, mở ra giải pháp mới cho ngành sản xuất Nhật Bản giữa tình trạng thiếu lao động.

19:30 26/11/2025
AI sẽ tái cấu trúc việc làm như thế nào nhìn từ kinh nghiệm thời Internet?

Dự báo tác động của AI đến việc làm qua lăng kính kinh nghiệm từ Internet, từ chuyển đổi nghề nghiệp đến sự xuất hiện công việc mới.

19:30 26/11/2025
Các mô hình AI do Trung Quốc phát triển lần đầu tiên đã vượt Mỹ về lượt tải

Trung Quốc lần đầu tiên vượt Mỹ về lượt tải mô hình AI mở, cho thấy sự thay đổi trong cách sử dụng và phát triển công nghệ trí tuệ nhân tạo toàn cầu.

19:30 26/11/2025