image Thứ Bảy, 06/09/2025

Các ông lớn OpenAI, Microsoft, Meta chạy đua tạo mô hình AI giá rẻ

Hoàng Hà

04/03/2025

Chia sẻ

Các công ty lớn như Google, Meta và OpenAI vẫn dẫn đầu, nhưng áp lực từ startup như DeepSeek và xu hướng "chưng cất AI" cho thấy cuộc đua đang thay đổi...

Sự đột phá của DeepSeek đã làm rung chuyển niềm tin vào vị thế dẫn đầu của Thung lũng Silicon
Sự đột phá của DeepSeek đã làm rung chuyển niềm tin vào vị thế dẫn đầu của Thung lũng Silicon

Các công ty hàng đầu về trí tuệ nhân tạo (AI) như OpenAI, Microsoft và Meta đang chuyển hướng sang một kỹ thuật gọi là “chưng cất” (distillation) trong cuộc đua toàn cầu nhằm tạo ra các mô hình AI rẻ hơn, dễ tiếp cận hơn cho người dùng và doanh nghiệp.

Kỹ thuật này trở thành tâm điểm chú ý sau khi DeepSeek – một công ty Trung Quốc – sử dụng nó để xây dựng các mô hình AI mạnh mẽ và hiệu quả từ hệ thống mã nguồn mở của Meta và Alibaba.

Sự đột phá của DeepSeek đã làm rung chuyển niềm tin vào vị thế dẫn đầu của Thung lũng Silicon, khiến giới đầu tư Phố Wall xóa sổ hàng tỷ USD giá trị cổ phiếu của các gã khổng lồ công nghệ Mỹ.

“CHƯNG CẤT” – BÍ QUYẾT THU NHỎ MÔ HÌNH AI

“Chưng cất” là quá trình lấy một mô hình ngôn ngữ lớn – gọi là “mô hình thầy” (teacher model) – chuyên dự đoán từ tiếp theo trong câu, để tạo dữ liệu huấn luyện một mô hình nhỏ hơn – tức “mô hình học sinh” (student model). Qua đó, kiến thức và khả năng dự đoán của mô hình lớn được chuyển giao nhanh chóng sang mô hình nhỏ.

Olivier Godement, trưởng bộ phận sản phẩm nền tảng của OpenAI, mô tả: “Chưng cất giống như phép thuật. Nó lấy một mô hình thông minh khổng lồ để dạy cho một mô hình nhỏ hơn, rất giỏi trong các nhiệm vụ cụ thể, lại siêu rẻ và siêu nhanh khi chạy”.

Dù kỹ thuật này đã được dùng nhiều năm, những tiến bộ gần đây khiến các chuyên gia tin rằng nó sẽ trở thành lợi thế lớn cho các startup, giúp họ xây dựng ứng dụng AI chi phí thấp. Các mô hình ngôn ngữ lớn như GPT-4 của OpenAI, Gemini của Google hay Llama của Meta đòi hỏi dữ liệu khổng lồ và sức mạnh tính toán đắt đỏ để phát triển – ước tính hàng trăm triệu USD, dù các công ty không công bố con số chính xác.

Nhờ chưng cất, doanh nghiệp và nhà phát triển có thể tiếp cận sức mạnh của những mô hình này với chi phí chỉ bằng một phần nhỏ, chạy nhanh trên laptop hay smartphone.

OpenAI đã mở nền tảng chưng cất, cho phép học từ các mô hình lớn như ChatGPT. Microsoft – nhà đầu tư lớn nhất của OpenAI với gần 14 tỷ USD – cũng dùng GPT-4 để chưng cất dòng mô hình nhỏ Phi trong một hợp tác thương mại. Tuy nhiên, OpenAI nghi ngờ DeepSeek đã chưng cất mô hình của họ để tạo ra đối thủ cạnh tranh – hành động vi phạm điều khoản dịch vụ. DeepSeek chưa phản hồi về cáo buộc này.

ƯU ĐIỂM VÀ HẠN CHẾ CỦA MÔ HÌNH CHƯNG CẤT

Mô hình chưng cất mang lại hiệu suất cao với chi phí thấp, nhưng cũng có giới hạn. Ahmed Awadallah từ Microsoft Research giải thích: “Chưng cất là một sự đánh đổi. Khi thu nhỏ mô hình, bạn khó tránh khỏi việc giảm khả năng của nó”. Ví dụ, một mô hình nhỏ qua chưng cất có thể giỏi tóm tắt email, nhưng sẽ kém ở các nhiệm vụ khác như sáng tác văn bản phức tạp.

Khi chi phí giảm, khả năng tiếp cận tăng, tương lai của AI không chỉ nằm ở sức mạnh tính toán mà còn ở sự sáng tạo và linh hoạt trong việc mang công nghệ đến tay người dùng. Hình minh họa về kỹ thuật chưng cất AI
Khi chi phí giảm, khả năng tiếp cận tăng, tương lai của AI không chỉ nằm ở sức mạnh tính toán mà còn ở sự sáng tạo và linh hoạt trong việc mang công nghệ đến tay người dùng. Hình minh họa về kỹ thuật chưng cất AI

David Cox, Phó Chủ tịch mảng mô hình AI tại IBM Research, cho rằng phần lớn doanh nghiệp không cần mô hình khổng lồ. “Các mô hình chưng cất đủ mạnh cho chatbot dịch vụ khách hàng hay chạy trên điện thoại. Nếu rẻ hơn mà vẫn đáp ứng nhu cầu, chẳng có lý do gì không dùng”, ông nói.

Điều này thách thức mô hình kinh doanh của các công ty AI lớn như OpenAI, vốn kiếm lợi nhuận từ sức mạnh tính toán cao. Mô hình nhỏ rẻ hơn, tốn ít tài nguyên hơn, nhưng cũng mang lại doanh thu thấp hơn khi các hãng thường giảm giá dịch vụ cho chúng.

Tuy nhiên, Godement của OpenAI lập luận rằng mô hình lớn vẫn cần thiết cho các nhiệm vụ đòi hỏi trí thông minh cao và độ chính xác tuyệt đối, như y tế hay tài chính – nơi doanh nghiệp sẵn sàng trả phí cao. Ông nhấn mạnh: “Mô hình lớn cũng là nền tảng để khám phá khả năng mới, sau đó chưng cất cho mô hình nhỏ hơn.”

CẠNH TRANH GAY GẮT VÀ CÂU HỎI VỀ TƯƠNG LAI AI

Sự trỗi dậy của DeepSeek đặt ra vấn đề bảo vệ công nghệ. OpenAI đã lập đội giám sát, có thể khóa tài khoản nếu nghi ngờ ai đó tạo dữ liệu hàng loạt để huấn luyện đối thủ – như họ tin DeepSeek đã làm. Nhưng Douwe Kiela từ Contextual AI nhận xét: “OpenAI cố gắng ngăn chưng cất từ lâu, nhưng rất khó tránh hoàn toàn”.

Chưng cất còn là thắng lợi cho mô hình mã nguồn mở. DeepSeek công khai mô hình của mình, theo tinh thần mà Yann LeCun – nhà khoa học AI trưởng của Meta – ủng hộ: “Mã nguồn mở cho phép mọi người hưởng lợi từ tiến bộ của nhau”.

Nhưng điều này cũng đặt ra câu hỏi về lợi thế tiên phong. Chuyên gia Cox từ IBM cảnh báo: “Bạn có thể chi hàng tỷ USD để dẫn đầu, nhưng đối thủ nhanh chóng bắt kịp nhờ chưng cất. Đây là một sân chơi kinh doanh đầy thách thức”.

Các công ty lớn như Google, Meta và OpenAI vẫn dẫn đầu, nhưng áp lực từ startup như DeepSeek và xu hướng chưng cất cho thấy cuộc đua AI đang thay đổi. Khi chi phí giảm, khả năng tiếp cận tăng, tương lai của AI không chỉ nằm ở sức mạnh tính toán mà còn ở sự sáng tạo và linh hoạt trong việc mang công nghệ đến tay người dùng.


Siết xuất khẩu, các tập đoàn khai thác đất hiếm của Trung Quốc đồng loạt báo lãi

Cổ phiếu các tập đoàn đất hiếm Trung Quốc tăng mạnh nhờ chính sách siết xuất khẩu. Tìm hiểu chi tiết trong bài viết này.

22:43 05/09/2025
Trung Quốc thúc đẩy làn sóng xuất khẩu ra toàn cầu nhờ "lực lượng lao động robot" giá rẻ

Khám phá cách Trung Quốc sử dụng robot giá rẻ để tăng cường xuất khẩu toàn cầu và duy trì lợi thế sản xuất.

14:43 04/09/2025
Hoa Kỳ ra chính sách “gây khó” cho TSMC, SK Hynix và Samsung khi sản xuất chip tại Trung Quốc

Khám phá chính sách mới của Mỹ đối với TSMC, Samsung và SK Hynix trong sản xuất chip tại Trung Quốc. Đọc ngay!

14:43 04/09/2025
Kỷ nguyên phần mềm tống tiền do AI tạo ra đã đến

Khám phá sự gia tăng ransomware do AI tạo ra, tội phạm mạng ngày càng tinh vi và cách họ thực hiện các cuộc tấn công hiệu quả.

17:01 03/09/2025
Triển vọng tăng trưởng của Nvidia "lung lay" bởi tình hình bất ổn tại Trung Quốc

Cổ phiếu Nvidia giảm nhẹ do lo ngại về doanh số tại Trung Quốc. Khám phá triển vọng tăng trưởng AI của công ty.

23:13 29/08/2025
Trung Quốc đẩy nhanh thương mại hóa các mô hình AI

Khám phá cách Trung Quốc đang thương mại hóa mô hình AI với chi phí đào tạo giảm mạnh, mở rộng ứng dụng trong nhiều lĩnh vực.

23:13 29/08/2025
Malaysia ra mắt bộ xử lý AI biên đầu tiên

Malaysia công bố bộ xử lý AI đầu tiên, khẳng định vị thế trong chuỗi cung ứng chip toàn cầu. Tìm hiểu thêm về bước tiến này!

00:37 29/08/2025
Trung Quốc đang tìm cách tăng gấp ba sản lượng chip AI

Khám phá kế hoạch của Trung Quốc trong việc tăng sản lượng chip AI gấp ba lần vào năm tới để cạnh tranh với các đối thủ phương Tây.

00:37 29/08/2025
Các nhà sản xuất chip, máy chủ Trung Quốc bước vào "siêu chu kỳ" nhờ AI

Khám phá sự bùng nổ trong ngành sản xuất chip và máy chủ Trung Quốc nhờ AI. Đầu tư hàng tỷ USD đang thay đổi cục diện công nghệ.

18:28 27/08/2025
Chiến lược sản xuất iPhone tại Ấn Độ của Apple gặp khó

Chiến lược sản xuất iPhone tại Ấn Độ của Apple gặp khó khăn do triệu hồi kỹ sư Trung Quốc. Tìm hiểu nguyên nhân và tác động ngay!

18:28 27/08/2025