OpenAI ra mắt loạt mô hình GPT-4.1 mới, khả năng lập trình xuất sắc

Thanh Minh, Huyền Thương, Hoàng

15/04/2025

Mục tiêu của nhiều gã khổng lồ công nghệ, bao gồm OpenAI, là xây dựng các mô hình AI có khả năng thực hiện các nhiệm vụ kỹ thuật phần mềm phức tạp…

OpenAI đã công bố một loạt mô hình AI mới mang tên GPT-4.1, bao gồm GPT-4.1, GPT-4.1 mini và GPT-4.1 nano.

Ngày 15/4, OpenAI đã công bố một loạt mô hình AI mới mang tên GPT-4.1, bao gồm GPT-4.1, GPT-4.1 mini và GPT-4.1 nano. Tên gọi “4.1” tiếp tục làm phức tạp hệ thống đặt tên vốn đã rối rắm của công ty.

Các mô hình này được OpenAI tuyên bố là “xuất sắc” trong việc lập trình và tuân thủ hướng dẫn, hiện có thể truy cập qua API của OpenAI nhưng chưa xuất hiện trên ChatGPT.

Điểm nổi bật là các mô hình này có cửa sổ ngữ cảnh lên đến 1 triệu token, tương đương với khả năng xử lý khoảng 750.000 từ trong một lần – dài hơn cả tiểu thuyết “Chiến tranh và Hòa bình”.

CẠNH TRANH TRONG LĨNH VỰC AI LẬP TRÌNH

Sự ra mắt của GPT-4.1 diễn ra trong bối cảnh các đối thủ như Google và Anthropic đang đẩy mạnh phát triển các mô hình lập trình tiên tiến. Google gần đây đã giới thiệu Gemini 2.5 Pro, cũng có cửa sổ ngữ cảnh 1 triệu token và đạt thứ hạng cao trên các bảng xếp hạng lập trình phổ biến. Tương tự, Claude 3.7 Sonnet của Anthropic và mô hình V3 nâng cấp của startup AI Trung Quốc DeepSeek cũng ghi dấu ấn mạnh mẽ.

Mục tiêu của nhiều gã khổng lồ công nghệ, bao gồm OpenAI, là xây dựng các mô hình AI có khả năng thực hiện các nhiệm vụ kỹ thuật phần mềm phức tạp.

Tại một hội nghị công nghệ ở London tháng trước, Giám đốc Tài chính OpenAI Sarah Friar đã chia sẻ tham vọng tạo ra một “kỹ sư phần mềm tự động”. Công ty tuyên bố các mô hình tương lai sẽ có thể lập trình toàn bộ ứng dụng từ đầu đến cuối, bao gồm kiểm tra chất lượng, kiểm tra lỗi và viết tài liệu.

Theo trang TechCrunch, GPT-4.1 là một bước tiến hướng tới mục tiêu này. Người phát ngôn của OpenAI chia sẻ: “Chúng tôi đã tối ưu hóa GPT-4.1 cho các ứng dụng thực tế dựa trên phản hồi trực tiếp từ người dùng, cải thiện các khía cạnh mà lập trình viên quan tâm nhất: lập trình giao diện, giảm thiểu chỉnh sửa không cần thiết, tuân thủ định dạng đáng tin cậy, duy trì cấu trúc và thứ tự phản hồi, sử dụng công cụ ổn định, và hơn thế nữa”. Những cải tiến này giúp các nhà phát triển xây dựng các tác nhân (agent) hiệu quả hơn trong các nhiệm vụ kỹ thuật phần mềm thực tế.

HIỆU SUẤT VÀ CHI PHÍ CỦA GPT-4.1

OpenAI tuyên bố mô hình GPT-4.1 đầy đủ vượt trội hơn các mô hình GPT-4o và GPT-4o mini trên các bài kiểm tra lập trình, bao gồm SWE-bench. Trong khi đó, GPT-4.1 mini và nano được thiết kế để nhanh hơn và hiệu quả hơn, nhưng có phần hy sinh độ chính xác. Đặc biệt, GPT-4.1 nano được quảng bá là mô hình nhanh nhất và rẻ nhất từ trước đến nay của OpenAI.

Về chi phí, GPT-4.1 có giá 2 USD cho mỗi triệu token đầu vào và 8 USD cho mỗi triệu token đầu ra. GPT-4.1 mini rẻ hơn, với 0,40 USD/million token đầu vào và 1,60 USD/million token đầu ra. GPT-4.1 nano là lựa chọn kinh tế nhất, với mức giá chỉ 0,10 USD/million token đầu vào và 0,40 USD/million token đầu ra.

Theo kết quả kiểm tra nội bộ của OpenAI, GPT-4.1 – vốn có khả năng tạo ra nhiều token hơn GPT-4o (32.768 so với 16.384) – đạt điểm từ 52% đến 54,6% trên SWE-bench Verified, một tập hợp con được xác thực bởi con người của SWE-bench.

Tuy nhiên, OpenAI lưu ý rằng một số giải pháp cho các bài kiểm tra SWE-bench Verified không thể chạy trên cơ sở hạ tầng của họ, dẫn đến khoảng điểm dao động. Kết quả này thấp hơn một chút so với Gemini 2.5 Pro của Google (63,8%) và Claude 3.7 Sonnet của Anthropic (62,3%) trên cùng bài kiểm tra.

Trong một đánh giá khác sử dụng Video-MME – bộ dữ liệu đo lường khả năng hiểu nội dung video – GPT-4.1 đạt độ chính xác 72% trong hạng mục video “dài, không phụ đề”, đứng đầu bảng xếp hạng theo OpenAI.

HẠN CHẾ CẦN LƯU Ý CỦA GPT-4.1

Mặc dù GPT-4.1 ghi điểm tốt trên các bài kiểm tra và có “ngày cập nhật kiến thức” mới hơn (đến tháng 6 năm 2024), giúp mô hình này nắm bắt tốt hơn các sự kiện hiện tại, người dùng cần lưu ý rằng ngay cả những mô hình tiên tiến nhất hiện nay vẫn gặp khó khăn với các nhiệm vụ mà chuyên gia con người có thể dễ dàng xử lý.

Nhiều nghiên cứu chỉ ra rằng các mô hình tạo mã thường thất bại trong việc sửa lỗi, thậm chí còn tạo ra các lỗ hổng bảo mật và lỗi mới.

Chính OpenAI cũng thừa nhận rằng GPT-4.1 trở nên kém đáng tin cậy hơn khi xử lý lượng token đầu vào lớn. Trong bài kiểm tra nội bộ OpenAI-MRCR, độ chính xác của mô hình giảm từ khoảng 84% với 8.000 token xuống còn 50% với 1 triệu token. Công ty cũng cho biết GPT-4.1 có xu hướng “theo nghĩa đen” hơn GPT-4o, đôi khi đòi hỏi các câu lệnh rõ ràng và cụ thể hơn từ người dùng.

Với dòng mô hình GPT-4.1, OpenAI tiếp tục khẳng định vị thế trong cuộc đua phát triển AI lập trình, hướng tới việc tạo ra các kỹ sư phần mềm tự động đầy tham vọng.

Từ khóa:

Bằng các kỹ thuật chế tạo tiên tiến, Trung Quốc đã thu nhỏ điện cực cổng của transistor xuống kích thước chỉ 1 nanomet

Trung Quốc phát triển transistor 1 nm nhỏ nhất thế giới, hứa hẹn định hình chip AI thế hệ mới

Các nhà nghiên cứu tại Đại học Bắc Kinh đã phát triển transistor ferroelectric có cổng chỉ 1 nanomet – nhỏ nhất và tiết kiệm năng lượng nhất hiện nay...

16:23 06/03/2026

Một công nhân đang làm việc trên dây chuyền sản xuất của một công ty sản xuất chip bán dẫn tại Suqian, tỉnh Giang Tô.

Kế hoạch 5 năm mới của Trung Quốc nhấn mạnh vào AI, 6G, robot hình người, điện toán lượng tử

Kế hoạch 5 năm được công bố cùng thời điểm khai mạc kỳ họp Quốc hội của Trung Quốc cho thấy tham vọng Bắc Kinh trong việc giành “vị trí chỉ huy” trong cuộc cạnh tranh công nghệ toàn cầu…

16:22 06/03/2026

Vị thế về AI của Việt Nam đang lớn mạnh khi trở thành trung tâm cung ứng toàn cầu nhờ lực lượng lao động trẻ và chi phí hiệu quả

Việt Nam tiên phong tại Đông Nam Á với khung pháp lý AI toàn diện đầu tiên trong khu vực

Tạp chí Mugglehead nhận định, bước đi này đưa Việt Nam vào vị thế dẫn trước các nước láng giềng ASEAN trong việc quản lý sự phát triển nhanh chóng của trí tuệ nhân tạo...

10:24 06/03/2026

Huawei đang cạnh tranh với Nvidia trên thị trường phần cứng trí tuệ nhân tạo toàn cầu.

Huawei trình làng siêu máy tính AI mạnh nhất, thách thức Nvidia trên sân chơi toàn cầu

Lần đầu tiên mang hệ thống Atlas 950 SuperPoD ra ngoài Trung Quốc, Huawei phát tín hiệu quay lại cuộc đua điện toán AI toàn cầu, tự tin có thể cạnh tranh với Nvidia bằng chiến lược “cụm siêu tính toán” thay vì sức mạnh từng con chip đơn lẻ…

22:55 03/03/2026

Định luật Moore cho rằng cứ mỗi hai năm, số lượng transistor (bóng bán dẫn) được tích hợp trong một vi mạch sẽ tăng gấp đôi. Ảnh: Reuters

Bước đột phá công nghệ có thể tạo ra những con chip silicon nhỏ nhất

Khung kim loại – hữu cơ trở thành chất cản quang lý tưởng mới, mở ra khả năng tạo ra những con chip mới nhỏ hơn, có hiệu năng tốt hơn…

22:55 03/03/2026

Bộ trưởng Bộ KHCN Nguyễn Mạnh Hùng trao chứng nhận Đơn vị đồng hành Hệ sinh thái Đổi mới sáng tạo Hà Nội tại Lễ ra mắt công ty Trung tâm Đổi mới sáng tạo Hà Nội (HIC) ngày 26/2/2026

Hà Nội ra mắt Trung tâm Đổi mới Sáng tạo thế hệ mới

Sự kiện mở ra mô hình hợp tác mới giữa Nhà nước - Nhà trường - Doanh nghiệp nhằm thúc đẩy đổi mới sáng tạo, phát triển hệ sinh thái khởi nghiệp công nghệ và hình thành động lực tăng trưởng dựa trên tri thức cho Hà Nội trong giai đoạn mới…

21:49 27/02/2026

Hiện “nghiện mạng xã hội” chưa được công nhận chính thức là một chẩn đoán y khoa riêng biệt trong nhiều hệ thống phân loại bệnh, nhưng được nhiều chuyên gia xếp vào nhóm nghiện hành vi (behavioral addiction), tương tự nghiện game hoặc cờ bạc

Mạng xã hội "gây nghiện" là do thuật toán?

Các tính năng quen thuộc như lướt (infinite scroll), video tự động phát (autoplay), thông báo liên tục và bảng tin cá nhân hóa đang bị cho là có tính cưỡng ép hành vi sử dụng mạng xã hội…

21:48 27/02/2026

Giới nghiên cứu Trung Quốc liên tục ghi nhận kết quả tích cực trong phát triển vật liệu bán dẫn. Ảnh: SCMP

Nhóm nghiên cứu của Trung Quốc công bố tìm ra vật liệu bán dẫn mới

Những vật liệu thế hệ mới có thể mang lại hiệu năng vượt trội cho các dòng chip chiến lược…

18:57 26/02/2026

Robot hình người Trung Quốc trình diễn tại Spring Festival Gala.

Hành trình của robot hình người Trung Quốc: Từ vấp ngã đến nhào lộn đẳng cấp chỉ trong một năm

Robot hình người Trung Quốc vừa gây ấn tượng mạnh tại Spring Festival Gala hồi đầu tuần trước, làm thay đổi rõ rệt cảm nhận của công chúng…

10:37 25/02/2026

Mô hình GPT-4o sẽ chính thức dừng hoạt động vào ngày 13/2 tới. Ảnh: Ink

OpenAI quyết định khai tử mô hình mô hình 4o vì quá nịnh nọt người dùng?

Mô hình 4o của ChatGPT được rất nhiều người dùng ưa chuộng nhưng đây cũng có nhiều tranh cãi liên quan đến xu hướng trả lời nịnh nọt và những tác hại…

10:23 24/02/2026