Meta ra mắt mô hình AI Llama mạnh nhất với sự hỗ trợ của Nvidia và đối tác đám mây
Hạnh Đặng
26/07/2024
Meta chính thức công bố phiên bản mới nhất của Llama AI - Llama 3.1. Đây là mô hình AI được cho là lớn nhất, thông minh nhất của Meta từ trước đến nay, đặc biệt tiếp tục duy trì mã nguồn mở…
Vừa qua, Meta đã công bố phiên bản mới nhất của mô hình trí tuệ nhân tạo Llama, có tên là Llama 3.1. Công nghệ Llama mới có ba phiên bản khác nhau, trong đó có một mô hình được đánh giá là thông minh và tân tiến nhất của Meta từ trước đến nay . Giống như một số phiên bản tiền nhiệm, mô hình mới ra mắt tiếp tục sử dụng mã nguồn mở, do đó cá nhân, tổ chức có thể truy cập miễn phí, theo CNBC.
Phiên bản mô hình ngôn ngữ lớn (LLM) lần này nhấn mạnh khoản đầu tư khổng lồ mà CEO Mark Zuckerberg sẵn sàng "xuống tay" nhằm theo kịp xu hướng với những công ty khởi nghiệp hàng đầu như OpenAI và Anthropic hay những gã khổng lồ công nghệ như Google và Amazon.
Thông báo cũng cho thấy mối quan hệ đối tác ngày càng phát triển tốt đẹp giữa Meta và Nvidia. Nvidia là đối tác quan trọng của Meta, cung cấp cho công ty mẹ Facebook chip điện toán (GPU) đào tạo mô hình AI, bao gồm cả phiên bản mới Llama.
Với OpenAI, công ty đặt mục tiêu doanh thu bằng cách bán quyền truy cập vào LLM độc quyền hoặc cung cấp dịch vụ công nghệ. Còn Meta không có kế hoạch kinh doanh ở mảng này, người phát ngôn Meta khẳng định trong cuộc họp báo.
Thay vào đó, tương tự khi phát hành Llama 2 vào mùa hè năm ngoái, Meta duy trì hợp tác với một số công ty công nghệ, cung cấp cho khách hàng quyền truy cập Llama 3.1 thông qua nền tảng điện toán đám mây tương ứng, và bán công cụ quản lý, bảo mật hoạt động kèm phần mềm mới. Một số trong số 25 đối tác doanh nghiệp liên quan đến Llama của Meta bao gồm Amazon Web Services, Google Cloud, Microsoft Azure, Databricks và Dell.
Trong cuộc họp báo cáo kết quả hoạt động trước đây, Giám đốc điều hành Meta Mark Zuckerberg nói với giới phân tích rằng công ty có một số nguồn doanh thu từ quan hệ đối tác Llama. Tuy nhiên, người phát ngôn của Meta cho biết bất kỳ lợi ích tài chính nào cũng chỉ là gia tăng.
Thay vào đó, Meta tin rằng bằng cách đầu tư vào Llama, công nghệ AI liên quan và cung cấp dịch vụ miễn phí thông qua mã nguồn mở, hãng có thể thu hút nhân tài, giảm chi phí đầu tư cơ sở hạ tầng điện toán hay vô vàn lợi ích khác.
Sự ra mắt của Llama 3.1 diễn ra ngay trước hội nghị về đồ họa máy tính tiên tiến, nơi CEO Zuckerberg và Giám đốc Điều hành Nvidia Jensen Huang dự kiến cùng nhau đối thoại.
Gã khổng lồ mạng xã hội Hoa Kỳ là một trong những khách hàng top đầu của Nvidia, không điều hành dịch vụ đám mây phục vụ lợi ích bản thân doanh nghiệp mà cần chip mới để đào tạo mô hình AI, vốn được sử dụng nội bộ. Phiên bản lớn nhất Llama 3.1 mới công bố được đào tạo trên 16.000 bộ xử lý đồ họa H100 của Nvidia.
MỐI QUAN HỆ GIỮA HAI ÔNG LỚN
Đối với Nvidia, kế hoạch Meta đào tạo mô hình nguồn mở để các doanh nghiệp sử dụng và tùy chỉnh sao cho phù hợp mà không phải trả phí hay xin phép, có thể mở rộng việc sử dụng chip của Nvidia và duy trì nhu cầu ở mức cao.
Xây dựng mô hình nguồn mở có thể tiêu tốn hàng trăm triệu hoặc hàng tỷ USD. Không có nhiều công ty có khả năng tài chính để phát triển và vận hành mô hình như vậy với số tiền đầu tư khổng lồ. Google và OpenAI, mặc dù là khách hàng của Nvidia nhưng vẫn giữ kín các mô hình tiên tiến nhất.
Mặt khác, Meta cần một nguồn cung cấp GPU đáng tin cậy nhằm đào tạo mô hình ngày càng mạnh mẽ. Giống như Nvidia, Meta cố gắng xây dựng hệ sinh thái các nhà phát triển ứng dụng AI với phần mềm nguồn mở, ngay cả khi công ty cung cấp dịch vụ miễn phí và rất tốn kém để xây dựng.
Ông Ash Jhaveri, Phó Chủ tịch quan hệ đối tác AI Meta trả lời báo chí rằng tiếp cận nguồn mở mang lại nhiều lợi ích cho Meta, cho phép nhà phát triển tiếp cận công cụ nội bộ và mời họ xây dựng nền tảng. Ông nhận định điều này có lợi cho Meta vì công ty tận dụng được những cải tiến do cộng đồng mã nguồn mở thực hiện.
Trong một bài đăng trên blog, CEO Zuckerberg cho hay công ty đang thực hiện "cách tiếp cận khác" trong việc phát hành Llama và "chúng tôi đang tích cực xây dựng mối quan hệ đối tác để nhiều công ty trong hệ sinh thái cũng có thể cung cấp chức năng độc đáo cho khách hàng".
Vì Meta không phải là nhà cung cấp doanh nghiệp nên nếu có nhu cầu, công ty sẽ giới thiệu những tổ chức quan tâm Llama đến một trong số đối tác chẳng hạn như Nvidia.
Phiên bản lớn nhất của dòng Llama 3.1 được gọi là Llama 3.1 405B. Mô hình ngôn ngữ này chứa 405 tỷ tham số - biến số quyết định kích thước tổng thể của mô hình và lượng dữ liệu có thể xử lý.
Một LLM lớn với lượng tham số khủng có thể thực hiện nhiệm vụ phức tạp hơn so với LLM nhỏ, chẳng hạn như hiểu ngữ cảnh trong nội dung văn bản dài, giải phương trình toán và thậm chí tạo ra dữ liệu tổng hợp để cải thiện một số mô hình AI nhỏ hơn.
Meta đồng thời phát hành các phiên bản nhỏ hơn là Llama 3.1 8B và Llama 3.1 70B. Về cơ bản, chúng là phiên bản nâng cấp của mô hình tiền nhiệm, cung cấp năng lượng cho chatbot và trợ lý mã hóa phần mềm.
Người phát ngôn của Meta cho biết, người dùng WhatsApp và Meta.AI tại Hoa Kỳ có thể linh hoạt chuyển đổi giữa LLM Llama 3.1 khổng lồ với phiên bản nhỏ hơn để nhận câu trả lời phù hợp nhất.
Dù đã đẩy mạnh mở rộng sản xuất, các hãng chip lớn nhất thế giới cũng chỉ có thể đáp ứng khoảng 60% nhu cầu thị trường. Tình trạng thiếu hụt chip nhớ toàn cầu được dự báo sẽ kéo dài ít nhất đến năm 2027…
AI khiến nhiều kỹ sư phần mềm lo ngại mất việc, nhưng thực tế cho thấy điều ngược lại: nhu cầu tuyển dụng vẫn tăng, còn vai trò của lập trình viên được tái định hình thay vì bị thay thế…
Trung Quốc đang đẩy mạnh nhập khẩu thiết bị sản xuất chip từ Đông Nam Á, đặc biệt là Singapore và Malaysia...
Một báo cáo mới cho thấy các nền tảng thương mại điện tử của những “ông lớn” công nghệ châu Á như TikTok, Sea và Alibaba đang kiểm soát tới 99% thị phần tại ASEAN…
Căng thẳng leo thang tại Trung Đông đang đặt ngành công nghệ châu Á trước nguy cơ gián đoạn sâu rộng, khi nguồn cung LNG và helium bị siết chặt…
Đây là một phần chiến dịch làm sạch không gian mạng của Trung Quốc, được triển khai thường niên từ năm 2020. Trong chiến dịch năm ngoái, hơn 73.000 phòng livestream và 24.000 tài khoản đã bị xử lý...
Mỹ và EU đang căng thẳng vì án phạt mà châu Âu áp lên các Big Tech của Mỹ, hiện đã vượt 7 tỷ USD. Đây được xem là cuộc đối đầu mới trong kỷ nguyên AI...
Trung Quốc đang cung cấp cơ hội lớn, đãi ngộ cao, môi trường thuận lợi, nhờ đó, làn sóng “hồi hương” của nhân tài AI Trung Quốc đang diễn ra mạnh mẽ…
Ngành công nghiệp bán dẫn toàn cầu được dự báo sẽ đạt quy mô doanh thu lên tới 1,3 nghìn tỷ USD trong năm 2026, đánh dấu mức tăng trưởng mạnh nhất trong hơn hai thập kỷ qua...
Hơn 100.000 tuyển thủ từ 100 quốc gia và vùng lãnh thổ tham gia vòng loại sẽ tranh tài ở 16 bộ môn để giành suất dự Esports Nations Cup 2026 đầu tiên…