Lịch trình làm việc từ một nhân viên Alibaba cho thấy tham vọng LLM của Trung Quốc
Bảo Ngọc
02/03/2024
Nhiều công ty công nghệ Trung Quốc đang tập hợp tất cả nguồn lực và nhân tài nhằm thu hẹp khoảng cách với OpenAI…
Bài đăng trên mạng xã hội X gần đây của một nhà nghiên cứu đang làm việc tại Alibaba cung cấp góc nhìn sơ bộ hiếm hoi về công cuộc phát triển mô hình ngôn ngữ lớn (LLM) tại gã khổng lồ thương mại điện tử, đồng thời cũng nằm trong số những big tech Trung Quốc đang cố gắng bắt kịp khả năng của ChatGPT, theo TechCrunch.
VĂN HOÁ LÀM VIỆC TẠI HAI ĐẦU THẾ GIỚI
Ông Binyuan Hui, nhà nghiên cứu phụ trách xử lý ngôn ngữ tự nhiên tại nhóm dự án mô hình ngôn ngữ lớn Qwen thuộc Alibaba, đã chia sẻ lịch trình hàng ngày trên mạng xã hội X, đáp trả bài đăng của nhà nghiên cứu OpenAI Jason Wei đã lan truyền gần đây.
Một ngày điển hình của các nhà nghiên cứu cho thấy những điểm tương đồng nổi bật, với thời gian thức dậy lúc 9 giờ sáng và đi ngủ vào khoảng 1 giờ đêm. Cả hai đều bắt đầu ngày mới bằng các cuộc họp, sau đó là thời gian coding, đào tạo mô hình và chuyên tâm nghiên cứu cùng đồng nghiệp. Ngay cả sau khi về nhà, nhiều chuyên gia vẫn tiếp tục chạy thử nghiệm vào ban đêm và suy ngẫm về phương pháp cải thiện mô hình trước khi đi ngủ.
Sự khác biệt đáng chú ý là ở cách nhân viên hai công ty mô tả thời gian giải trí. Nhà nghiên cứu Hui, nhân viên của Alibaba, đã đề cập đến thói quen đọc thêm nhiều tài liệu nghiên cứu và lướt X để cập nhật “những gì đang xảy ra trên thế giới”. Và tất nhiên, Hui không uống một ly rượu sau khi về đến nhà như Wei từ OpenAI.
Chế độ làm việc cường độ cao không phải là điều đáng ngạc nhiên trong bối cảnh chạy đua LLM khốc liệt hiện tại của Trung Quốc, nơi những tài năng công nghệ sở hữu bằng đại học hàng đầu đang gia nhập các gã khổng lồ để xây dựng mô hình AI mang tính cạnh tranh.
Ở khía cạnh nhất định, lịch trình khắt khe của Binyan Hui dường như phản ánh động lực cá nhân mong muốn vượt xa các big tech ở Thung lũng Silicon trong lĩnh vực AI. Lịch trình có vẻ khác với giờ làm việc “996” gắn liền với nhiều cơ sở loại hình kinh doanh internet “truyền thống” hơn của Trung Quốc, thường xuyên được áp dụng trong một số ngành khác, chẳng hạn như trò chơi điện tử và thương mại điện tử.
Được biết, 996 là thuật ngữ chỉ văn hoá làm việc của người dân Trung Quốc với phương thức và chế độ làm việc khắt khe từ 9 giờ sáng đến 9 giờ tối, liên tục 6 ngày trong một tuần.
Quả thực, ngay cả nhà đầu tư AI và nhà khoa học máy tính nổi tiếng Kai-Fu Lee cũng đã đánh đổi và nỗ lực rất nhiều để chạm tới thành công. Khi phóng viên của TechCrunch phỏng vấn ông Lee về kỳ lân LLM 01.AI mới thành lập vào tháng 11 năm ngoái, ông đã thừa nhận vấn đề làm thêm giờ xuất hiện thường xuyên nhưng nhân viên vẫn sẵn sàng làm việc chăm chỉ. Thời điểm đó, nhân viên công ty đã nhắn tin cho ông lúc 2:15 sáng để bày tỏ sự phấn khích khi được trở thành một phần sứ mệnh của 01.AI.
CHẠY ĐUA LLM TẠI TRUNG QUỐC
Một số biểu hiện bên ngoài về tinh thần làm việc mãnh liệt nói lên tính cấp thiết của mục tiêu mà các công ty Trung Quốc đặt ra và tốc độ mà các công ty đó triển khai LLM.
Ví dụ, dự án Qwen đã tạo nguồn mở cho một loạt mô hình nền tảng được đào tạo bằng cả dữ liệu tiếng Anh và tiếng Trung. Số lượng tham số - con số biểu thị kiến thức mà mô hình thu được từ dữ liệu đào tạo nhằm đưa ra phản hồi phù hợp theo ngữ cảnh - là 72 tỷ. Làm phép so sánh đơn giản, GPT3 từ OpenAI được cho là có 175 tỷ tham số; GPT4, LLM mới nhất của công ty, có 1,7 nghìn tỷ.
Nhóm nghiên cứu cũng đã nhanh chóng giới thiệu một số ứng dụng thương mại. Tháng 4 năm ngoái, Alibaba bắt đầu tích hợp Qwen vào nền tảng truyền thông doanh nghiệp DingTalk và nhà bán lẻ trực tuyến Tmall.
Cho đến nay, chưa có nhà lãnh đạo thực sự nào xuất hiện trong không gian LLM Trung Quốc. Hầu hết quỹ đầu tư mạo hiểm cũng như nhà đầu tư doanh nghiệp đều đặt cược vào nhiều người chơi trên thị trường. Bên cạnh công cuộc xây dựng LLM nội bộ, Alibaba còn tích cực đầu tư vào các công ty khởi nghiệp như Moonshot AI, Zhipu AI, Baichuan và 01.AI.
Đối mặt với bối cảnh cạnh tranh, Alibaba đang cố gắng khẳng định vị trí tiên phong trên thị trường. Vào tháng 12 vừa qua, đại gia công nghệ Trung Quốc đã phát hành LLM khả dụng với một số ngôn ngữ Đông Nam Á. Với tên gọi SeaLLM, mô hình có khả năng xử lý thông tin bằng tiếng Việt, tiếng Indonesia, tiếng Thái, tiếng Mã Lai, tiếng Khmer, tiếng Lào, tiếng Tagalog và tiếng Miến Điện. Trước đó, thông qua hoạt động kinh doanh điện toán đám mây và mua lại nền tảng thương mại điện tử Lazada, Alibaba đã tạo dựng được dấu ấn khá lớn trong khu vực và được dự đoán hoàn toàn có khả năng quảng bá SeaLLM cho nhiều dịch vụ trong tương lai.
Từ khóa:
Thương vụ này được cho là có thể huy động từ 40 tỷ đến 80 tỷ USD – con số đủ để đưa SpaceX vào nhóm những đợt IPO lớn nhất từng được thực hiện trên toàn cầu…
GAM Esports vừa gia nhập danh sách 40 câu lạc bộ thuộc Chương trình Đối tác 20 triệu USD của Esports Foundation, tiếp cận mạng lưới hơn 300 triệu người hâm mộ toàn cầu...
Sora nhanh chóng phải dừng lại khi tài nguyên được công ty mẹ ưu tiên sử dụng vào mục đích khác trong bối cảnh đối thủ cạnh tranh ngày càng mạnh…
Cuộc khủng hoảng nguồn cung naphtha – nguyên liệu đầu vào quan trọng của ngành hóa dầu và sản xuất bán dẫn – đang lan rộng khắp châu Á trong bối cảnh căng thẳng địa chính trị tại Trung Đông leo thang...
Điểm gây tranh cãi lớn nhất chính là cơ cấu sở hữu: TCL nắm 51% cổ phần, trong khi Sony giữ 49%...
Chi tiêu vốn (capex) của các nhà mạng quốc doanh Trung Quốc được dự báo sẽ giảm xuống mức thấp nhất trong vòng 15 năm vào năm 2026, khi làn sóng đầu tư cho hạ tầng 5G đã đi qua giai đoạn cao trào...
Các cố vấn chính phủ Trung Quốc cảnh báo việc phát triển và ứng dụng AI nếu thiếu kiểm soát có thể gây ra những hệ lụy nghiêm trọng về việc làm và an ninh dữ liệu. Họ kêu gọi thiết lập các “lằn ranh đỏ” cho công nghệ này…
Làn sóng niêm yết của các công ty lượng tử diễn ra trong bối cảnh thị trường toàn cầu đầy biến động, khi các xung đột địa chính trị làm suy giảm niềm tin của nhà đầu tư, đặc biệt với các tài sản rủi ro cao như công nghệ mới nổi…
Nguyên nhân đến từ một nghiên cứu mới của Google Research, cho thấy các trung tâm dữ liệu AI trong tương lai có thể cần ít bộ nhớ hơn đáng kể so với kỳ vọng trước đó...
Một báo cáo mới từ Human Security cho thấy lưu lượng truy cập do AI và bot tạo ra đã vượt qua con người, đánh dấu bước ngoặt lớn của Internet trong kỷ nguyên trí tuệ nhân tạo...