image Thứ Sáu, 15/08/2025

Khi AI tự xây dựng AI: Những bước tiến công nghệ tiếp theo có thể không đến từ con người

Mai Anh

04/04/2025

Chia sẻ

DeepSeek từng gây chấn động khi công bố mô hình tư duy R1 hồi cuối tháng 1 vừa qua, châm châm ngòi cho những tranh luận gay gắt về cạnh tranh công nghệ Mỹ - Trung và tính hợp lý của các khoản đầu tư vào hạ tầng AI, kéo theo sự sụt giảm mạnh của cổ phiếu nhiều công ty AI hàng đầu.

Nhưng giữa những tranh cãi đó, một xu hướng quan trọng nhất trên hành trình tiến tới trí tuệ nhân tạo tổng quát (AGI) lại ít được bàn tới: vai trò ngày càng lớn của các hệ thống AI trong việc thiết kế, xây dựng và hoàn thiện thế hệ AI kế tiếp. Ngày càng nhiều AI đang tạo ra AI, tác giả George C. Lee II, đồng giám đốc của Viện Goldman Sachs toàn cầu.

Trong báo cáo về R1, DeepSeek đã giải thích cách tận dụng các kỹ thuật như tạo dữ liệu tổng hợp, chưng cất mô hình và học tăng cường do máy vận hành để tạo ra một mô hình vượt trội so với tiêu chuẩn hiện tại. Mỗi phương pháp này đều có thể hiểu theo cách khác là khai thác năng lực của AI hiện có để hỗ trợ đào tạo một phiên bản tiên tiến hơn.

DeepSeek không phải là đơn vị duy nhất sử dụng AI để cải tiến AI. Mark Zuckerberg từng dự đoán, các kỹ sư tầm trung tại Meta có thể sớm bị thay thế bởi AI, và Llama 3 (mô hình ngôn ngữ lớn - LLM của công ty này) “giúp chúng tôi thử nghiệm và lặp lại nhanh hơn, xây dựng những khả năng chúng tôi muốn hoàn thiện và mở rộng trong Llama 4”.

Jensen Huang, CEO Nvidia, cũng từng nói về việc tạo ra môi trường ảo – nơi các hệ thống AI giám sát việc đào tạo các hệ thống robot: “Chúng ta có thể tạo ra vô số vũ trụ song song, cho phép robot học cùng lúc theo 100.000 cách khác nhau”.

Điều này chưa hẳn đã chạm đến ngưỡng “điểm kỳ dị” – khi máy móc thông minh có thể tự sao chép và phát triển – nhưng là một điều mới mẻ và có thể mang tính đột phá.

Dù tiến bộ trong mô hình AI đang diễn ra với tốc độ chóng mặt, vẫn có những ý kiến cho rằng, sự phát triển của “quy luật mở rộng quy mô” (scaling laws) – nguyên lý cho thấy hiệu suất của AI tăng theo lượng dữ liệu, năng lượng và tính toán được cung cấp – có thể đang chậm lại. Nhưng sự ra mắt của DeepSeek, cùng với hàng loạt động thái từ các công ty khác sau đó, cho thấy những nhận định đó có thể đã bị phóng đại.

Trên thực tế, những đổi mới trong phát triển AI đang mở ra những con đường mới – nơi mọi thứ đều do AI tự tạo ra. Tiến bộ không hề chậm lại, mà đang tăng tốc – nhờ AI.

XU THẾ KHÔNG THỂ ĐẢO NGƯỢC

Một trong những phương pháp lâu đời nhất để sử dụng AI tạo ra AI là thông qua dữ liệu tổng hợp, tức là sử dụng dữ liệu do AI tạo ra để tiếp tục đào tạo và tinh chỉnh các hệ thống AI khác.

Cụm từ “dữ liệu tổng hợp” có thể gợi ý rằng, những dữ liệu này kém chất lượng hơn dữ liệu “hữu cơ” (đơn cử như nội dung từ internet). Nhưng thực tế lại chứng minh điều ngược lại.

Tạo dữ liệu tổng hợp cho phép AI tạo ra những ví dụ huấn luyện thực tế, được thiết kế riêng cho các lĩnh vực hoặc tình huống hiếm gặp có thể không xuất hiện nhiều trong các bộ dữ liệu thực tế.

Dù vẫn có giới hạn – một nghiên cứu gần đây cho thấy sau vài vòng tạo dữ liệu tổng hợp, mô hình có thể xuống cấp nhanh chóng – nhưng kỹ thuật này vẫn có thể đẩy nhanh đổi mới trong những lĩnh vực mà thu thập dữ liệu thực rất khó khăn, chẳng hạn như hình ảnh y khoa hoặc mô hình hóa cấu trúc protein để phát triển thuốc mới.

Một trong những phương pháp lâu đời nhất để sử dụng AI tạo ra AI là thông qua dữ liệu tổng hợp. 
Một trong những phương pháp lâu đời nhất để sử dụng AI tạo ra AI là thông qua dữ liệu tổng hợp. 

Một kỹ thuật quan trọng khác mà DeepSeek nhấn mạnh là chưng cất mô hình, trong đó các mô hình lớn – tiêu tốn nhiều tài nguyên tính toán – truyền tải kiến thức và khả năng của chúng sang các mô hình nhỏ hơn, hiệu quả hơn. Phương pháp này giúp phổ biến các năng lực AI trong các mô hình mã nguồn mở, đồng thời, giúp các công ty đưa những khả năng này đến với nhiều người dùng hơn thông qua các phiên bản nhỏ hơn của mô hình có hiệu suất cao. Chưng cất giúp AI dễ mở rộng hơn bằng cách giảm kích thước mô hình, giúp việc tiếp cận và áp dụng dễ dàng hơn.

Hãy tưởng tượng, nếu mỗi sinh viên khi bước vào đại học đều mang theo toàn bộ kiến thức của tất cả sinh viên và giáo sư trước đó. Sau đó, sinh viên này được đưa vào một cuộc thi với hàng trăm sinh viên ảo khác, tất cả đều có cùng kiến thức, nhằm tối ưu hóa một mục tiêu nhất định.

Đây chính là ý tưởng của học tăng cường do máy vận hành – một kỹ thuật trong đó AI tự cải thiện thông qua việc tự chơi, thử nghiệm và tinh chỉnh tư duy của chính mình.

Phương pháp này đã đóng vai trò then chốt trong những đột phá AI nổi tiếng nhất, bao gồm chiến thắng của AlphaGo trước những kỳ thủ cờ vây hàng đầu thế giới. Việc tận dụng AI để tự thiết kế chương trình đào tạo mở ra một hướng phát triển hoàn toàn mới, chỉ bị giới hạn bởi khả năng của những cỗ máy ngày càng thông minh hơn trong việc khám phá điều mới mẻ.

NHỮNG NHÀ KHOA HỌC AI

Một trong những ứng dụng ấn tượng nhất của AI trong việc tinh chỉnh AI là mô hình “đồng khoa học” (co-scientist) của Google Gemini, một hệ thống AI đa tác nhân (multi-agent AI system) được thiết kế để mô phỏng phương pháp khoa học – nhưng ở quy mô và tốc độ siêu việt.

AI đồng khoa học của Google tận dụng kỹ thuật “mở rộng tính toán khi suy luận” (test-time compute scaling), tức là sử dụng thêm tài nguyên tính toán trong quá trình suy luận, để mô phỏng tư duy khoa học, kiểm tra các giả thuyết khác nhau và liên tục tự đánh giá lại quy trình.

Nhờ đó, hệ thống này có thể kết hợp dữ liệu tổng hợp, học tăng cường và điều phối tác nhân AI theo từng lĩnh vực chuyên môn để tạo ra kết quả khoa học.

Hãy hình dung, một đội quân gồm những nhà khoa học có trình độ cao nhất thế giới, không bao giờ mệt mỏi, không bao giờ than phiền và không ngừng cải tiến – đó chính là mô hình này. Dù đây không phải là ví dụ trực tiếp về AI tạo ra AI, nhưng đang cho thấy những con đường mở rộng mới có thể tạo ra cách mạng trong các lĩnh vực khác.

Hãy mở rộng hình dung đó: nếu có một đội ngũ các nhà khoa học máy tính được thiết lập với mục tiêu tối ưu hóa tốc độ phát triển của LLMs? Đây chính là những gì Sakana AI, công ty có trụ sở tại Tokyo, mới công bố: một kỹ sư có tên CUDA AI – một hệ thống AI đa tác nhân hoàn toàn tự động.

Nói cách khác, đây là một hệ thống AI giúp tăng tốc đáng kể các hệ thống AI khác – nhanh hơn 10-100 lần so với phương pháp trước đó. AI đang tự xây dựng chính nó với tốc độ ngày càng nhanh.

Chúng ta phải chấp nhận rằng, con người không thể dự đoán chính xác cách những hệ thống AI này sẽ phát triển và những đổi mới nào có thể xuất hiện. Hầu hết các phát minh đều được sinh ra từ quá trình thử nghiệm và sai sót kéo dài – thường mất nhiều năm hoặc nhiều thập kỷ.

Nhưng những hệ thống AI này đang tái tạo quá trình “thử và sai” thông qua thử nghiệm không ngừng ở quy mô đáng kinh ngạc. Chúng ta hầu như không thể hình dung được khả năng, thậm chí cả sự sáng tạo, mà AI có thể đạt được khi chúng xử lý tính toán và tư duy ở mức độ ngày càng cao – có thể sớm vượt xa khả năng tưởng tượng của con người.

Những người theo dõi tiến bộ công nghệ chắc chắn sẽ chứng kiến một chặng đường đầy biến động trong những năm tới. Ngay cả khái niệm về “nhà sáng tạo” cũng có thể thay đổi, khi ngày càng nhiều đột phá đến không phải từ thành tựu của một cá nhân, mà từ những hệ thống AI liên tục cải tiến.

Trong nhiều thập kỷ qua, con người đã xây dựng ngành khoa học máy tính và AI với hy vọng tạo ra những hệ thống có thể sao chép kiến thức và tư duy tốt nhất của loài người.

Nhưng những diễn biến gần đây cho thấy có thể chúng ta đang tiến gần đến thời điểm AI tự nâng cấp và xây dựng thế hệ kế nhiệm của chính nó. Những nhà phát minh vĩ đại tiếp theo – những người tìm ra phương pháp điều trị y học mới, tạo ra vật liệu mới, giải mã bí ẩn của vũ trụ hay nguyên tử – có lẽ sẽ không còn là con người nữa.


Máy tính lượng tử sắp trở thành hiện thực?

Khám phá sự phát triển của máy tính lượng tử và những thách thức trong cuộc đua công nghệ hiện nay.

17:51 14/08/2025
TikTok ra mắt tính năng “kiểm chứng cộng đồng”: Khi mạng xã hội đặt niềm tin vào trí tuệ số đông

Khám phá tính năng Footnotes mới của TikTok giúp kiểm chứng thông tin từ cộng đồng. Liệu đây có phải là giải pháp chống tin giả hiệu quả?

17:51 14/08/2025
Google DeepMind ra mắt mô hình AI ảo hoạt động như một vệ tinh theo dõi biến đổi khí hậu

Khám phá mô hình AI AlphaEarth Foundations của Google DeepMind giúp theo dõi biến đổi khí hậu và bảo vệ môi trường hiệu quả.

17:51 14/08/2025
Startup Trung Quốc hướng đến tương lai AI điều khiển mọi thiết bị gia đình

Khám phá hệ thống AI Home của Colmo, giải pháp thông minh cho ngôi nhà của bạn. Tìm hiểu thêm ngay!

17:51 14/08/2025
Chi phí cao và lợi nhuận mỏng đang đe dọa các startup lập trình AI

Dù các startup cung cấp các trợ lý lập trình AI rất phổ biến và dường như thu hút lớn sự chú ý của thị trường, đây lại là những công ty làm ăn thua lỗ nặng...

07:00 09/08/2025
Trình duyệt AI của Google và Microsoft liệu có thực sự hữu ích như kỳ vọng?

Hai gã khổng lồ Google và Microsoft vừa chính thức ra mắt thanh tìm kiếm tích hợp trí tuệ nhân tạo (AI), với kỳ vọng sẽ định hình lại cách người dùng truy cập và xử lý thông tin trên Internet. Đội ngũ Euronews Next đã trực tiếp thử nghiệm để kiểm chứng mức độ hiệu quả của những công cụ mới...

07:28 07/08/2025
iOS 26 so với Android 16: Apple và Google đưa điện thoại thông minh đi theo hai hướng hoàn toàn khác nhau

Apple và Google đang theo đuổi hai định hướng hoàn toàn riêng biệt với iOS 26 và Android 16, một bên tập trung vào thiết kế, trong khi bên còn lại dồn toàn lực vào AI…

21:18 04/08/2025
OpenAI mở trung tâm dữ liệu AI đầu tiên tại Châu Âu

Với khoản đầu tư khoảng 1 tỷ USD từ cho giai đoạn đầu tiên, dự án với tên gọi Stargate Norway dự kiến sẽ cung cấp công suất 230 MW, với kế hoạch mở rộng lên 290 MW vào cuối năm 2026...

18:27 01/08/2025
>