Mô hình AI nguồn mở Llama 3 đủ mạnh để đưa Meta dẫn đầu cuộc đua AI

H Hạ Chi

09:08, 20/04/2024

Chọn cỡ chữ

Meta mới đây đã ra mắt phiên bản cập nhật của mô hình Llama AI miễn phí, Llama 3. Hay chính xác hơn, gã khổng lồ này mới phát hành hai mô hình thuộc dòng Llama 3 mới, mô hình còn lại vẫn đang trong quá trình đào tạo…

Meta ra mắt mô hình nguồn mở Llama AI 3.

Hai mô hình mới – Llama 3 8B chứa 8 tỷ tham số và Llama 3 70B chứa 70 tỷ tham số, là “bước nhảy vọt lớn” về mô hình ngôn ngữ lớn của Meta. Mô hình Llama 3 còn lại với kích thước hơn 400 tỷ tham số vẫn đang được gã khổng lồ đào tạo. Mô hình này được tiết lộ có khả năng “giao tiếp bằng nhiều ngôn ngữ”, thu thập nhiều dữ liệu hơn và hiểu nhiều phương thức khác bên cạnh văn bản...

Meta viết trong một bài đăng trên blog: “Mục tiêu của chúng tôi trong tương lai gần là làm cho Llama 3 trở nên đa ngôn ngữ và đa phương thức, có khả năng hiểu ngữ cảnh dài hơn và tiếp tục cải thiện hiệu suất tổng thể trên các mô hình ngôn ngữ lớn cốt lõi như lý luận và mã hóa”.

Theo công bố của Meta, Llama 3 8B vượt trội hơn các mô hình mở khác như Mistral 7B của Mistral và Gemma 7B của Google, trên ít nhất chín tiêu chuẩn AI: MMLU (lượng kiến thức), ARC (khả năng tiếp thu), DROP (khả năng lý luận), GPQA (kiến thức vật lý và hóa học), HumanEval (bài kiểm tra tạo mã), GSM-8K (bài toán đố), MATH (một chuẩn mực toán học khác), AGIEval (bộ bài kiểm tra giải quyết vấn đề) và BIG-Bench Hard (đánh giá lý luận thông thường). Trong khi đó, Llama 3 70B đánh bại Gemini 1.5 Pro trên các tiêu chuẩn MMLU, HumanEval và GSM-8K.

Mặc dù vậy, theo Techcrunch, tính hữu ích của các tiêu chuẩn này vẫn còn đang được tranh luận. Nhưng dù sao, chúng vẫn là một trong những tiêu chuẩn để các công ty AI như Meta đánh giá mô hình của họ.

THỊ TRƯỜNG MÔ HÌNH AI KHÔNG NGỪNG BIẾN ĐỘNG

Meta được các nhà quan sát đánh giá là một trong những Big Tech dẫn đầu trong việc sẵn sàng chi tiêu cho việc đào tạo và chạy các mô hình nguồn mở. Vào tháng 1, Mark Zuckerberg thông tin Meta đang chi hàng tỷ USD cho chip Nvidia AI, đến cuối năm 2024, cơ sở hạ tầng máy tính của công ty sẽ bao gồm 350.000 chiếc H100. Xong, Meta vẫn cam kết cung cấp trải nghiệm miễn phí các mô hình cho người dùng.

"Meta không tiết lộ chi tiết cụ thể về loại dữ liệu nào được sử dụng để đào tạo Llama 3, ngoài việc nhấn mạnh rằng mô hình được đào tạo dựa trên “nhiều loại dữ liệu công khai”, bao gồm các bài đăng công khai trên Facebook và Instagram".

Thế nhưng thị trường mô hình mở cũng đang dần sôi động với sự xuất hiện của Mistral. Mistral có trụ sở tại Paris, được sáng lập bởi các cựu nhà nghiên cứu của Meta. Công ty này đã tạo ra cú nổ đầu tiên vào tháng 6/2023, sau đó tiếp tục tích cực phát hành nhiều mô hình nguồn mở và được đón nhận nồng nhiệt.

Trong khi đó, các mô hình độc quyền do OpenAI, Google và Anthropic ngày càng nâng cấp thêm nhiều khả năng hơn. Hai tháng trước, Google đã phát hành Gemma, các mô hình mở được xây dựng từ nghiên cứu và công nghệ tương tự như Gemini độc quyền của hãng.

Bên cạnh đó, cuộc “đi săn” nhân tài AI tiếp tục nóng lên, với sự cạnh tranh khốc liệt giữa các nhà nghiên cứu hàng đầu và nhiều cựu kỹ sư của Big Tech nhảy việc thành lập công ty khởi nghiệp của riêng họ. Thời gian gần đây, Fortune đưa tin Meta đã chảy máu chất xám AI, khi một số lãnh đạo cấp cao, bao gồm cả giám đốc cấp cao về AI tạo sinh đã rời đi.

LLAMA 3 SẼ ĐƯỢC TÍCH HỢP VÀO LOẠT ỨNG DỤNG CỦA META

Meta cho biết các mô hình Llama 3 — hiện có sẵn để tải xuống và hỗ trợ trợ lý Meta AI trên Facebook, Instagram, WhatsApp, Messenger và web. “Chúng tôi tin rằng Meta AI hiện là trợ lý AI thông minh nhất mà bạn có thể tự do sử dụng”, Giám đốc điều hành Meta Mark Zuckerberg cho biết trong thông báo.

Mô hình này cũng sẽ sớm được tích hợp vào trình quản lý trên nhiều nền tảng đám mây bao gồm AWS, Databricks, Google Cloud, Hugging Face, Kaggle, WatsonX của IBM, Microsoft Azure, NIM và Snowflake của Nvidia.

Mô hình ngôn ngữ lớn mới được Meta chọn lọc đào tạo từ dữ liệu của nhiều ngôn ngữ.

Meta không tiết lộ chi tiết cụ thể về loại dữ liệu nào được sử dụng để đào tạo Llama 3, ngoài việc nhấn mạnh rằng mô hình được đào tạo dựa trên “nhiều loại dữ liệu công khai”, bao gồm các bài đăng công khai trên Facebook và Instagram.

Họ cho biết tập dữ liệu huấn luyện mới lớn gấp bảy lần so với tập dữ liệu được sử dụng để huấn luyện phiên bản trước đó, Llama 2 và bao gồm số lượng mã nhiều gấp bốn lần. Hơn 5% tập dữ liệu huấn luyện Llama 3 bao gồm “dữ liệu chất lượng cao từ 30 ngôn ngữ khác không phải tiếng anh”. Meta cũng cho biết họ đã tận dụng dữ liệu tổng hợp, tức là dữ liệu do AI tạo ra để tạo các tài liệu dài hơn.

“Chúng tôi nhận thấy rằng các thế hệ Llama trước đó rất giỏi trong việc xác định dữ liệu chất lượng cao, vì vậy chúng tôi đã sử dụng Llama 2 để xây dựng các bộ phân loại chất lượng văn bản”, Meta giải thích.

Meta cho biết họ đã phát triển các quy trình lọc dữ liệu mới để nâng cao chất lượng dữ liệu đào tạo mô hình, đồng thời phát triển cặp công cụ Llama Guard và CybersecEval để ngăn chặn việc lạm dụng và tạo văn bản không phù hợp từ Mô hình Llama 3 và những mô hình khác. Công ty cũng đang phát hành một công cụ mới, Code Shield, được thiết kế để phát hiện mã từ các mô hình AI tạo sinh có thể gây ra các lỗ hổng bảo mật.

Đọc bài theo từ khoá

Mới nhất trên VnEconomy

Bất động sản 12:54, 28/07/2026

TP. Hồ Chí Minh đề xuất nâng trần thu nhập mua nhà ở xã hội lên 60 triệu đồng/tháng

Đọc ngay

Tài chính 12:52, 28/07/2026

Sửa đổi Luật Các tổ chức tín dụng 2024: Chuyển trọng tâm sang quản trị rủi ro hệ thống

Đọc ngay

Chứng khoán 12:06, 28/07/2026

Dòng tiền nội ngoại cùng bắt đáy mạnh, cổ phiếu chứng khoán bùng nổ

Đọc ngay

Doanh nghiệp 11:49, 28/07/2026

"Taste Europe!" mang "tinh hoa" ẩm thực châu Âu đến Vietfood & Beverage 2026

Đọc ngay

Đọc tiếp

Trang bị các “giác quan” cho nhà máy sản xuất để doanh nghiệp Việt tham gia sâu chuỗi cung ứng toàn cầu

Khi chuỗi cung ứng toàn cầu tái cấu trúc, Việt Nam có cơ hội lịch sử để trở thành điểm đến của sản xuất hiện đại, ứng dụng công nghệ cao. Tuy nhiên, thực tế hiện nay, các doanh nghiệp sản xuất Việt Nam đang đối mặt với áp lực, thách thức lớn về khả năng giám sát hoạt động theo thời gian thực và đáp ứng các tiêu chuẩn truy xuất nguồn gốc ngày càng nghiêm ngặt từ thị trường quốc tế.

CXMT trở thành công ty giá trị nhất Trung Quốc sau màn chào sàn bùng nổ nhờ cơn sốt AI

Nhu cầu bùng nổ từ trí tuệ nhân tạo (AI) đang tạo động lực tăng trưởng mạnh cho ngành chip nhớ toàn cầu. Hưởng lợi từ xu hướng này, hãng sản xuất chip nhớ Trung Quốc ChangXin Memory Technologies (CXMT) đã tăng hơn 500% ngay trong phiên chào sàn, vượt ICBC để trở thành doanh nghiệp có giá trị vốn hóa lớn nhất Trung Quốc đại lục…

Apple vượt Nvidia về vốn hóa, trở thành công ty đắt giá nhất thế giới

Kết thúc phiên giao dịch ngày thứ Hai (27/7), Apple vượt qua Nvidia để giành lấy vị trí công ty niêm yết đắt giá nhất thế giới...

Niềm tin số: Nền tảng còn thiếu trong chuyển đổi ngành sản xuất Việt Nam

Trên khắp Việt Nam, các doanh nghiệp sản xuất đang đẩy mạnh chuyển đổi số nhằm nâng cao vị thế trong chuỗi giá trị toàn cầu. Từ ngành điện tử, ô tô đến bán dẫn và công nghệ cao, các công cụ như mô phỏng, cộng tác trên nền tảng đám mây và thiết kế dựa trên dữ liệu đang trở thành nền tảng nâng cao năng lực cạnh tranh và đáp ứng các tiêu chuẩn quốc tế.

Nhật Bản ra mắt "tủ lạnh cho người" giá 241 triệu đồng

Một doanh nghiệp Nhật Bản vừa giới thiệu buồng làm mát cá nhân được ví như "tủ lạnh cho người", giúp hạ thân nhiệt người ngồi bên trong chỉ sau vài phút…

Xem thêm

Sản phẩm - Thị trường Tài sản số Dịch vụ số Start-up Quản trị số

Đừng bỏ lỡ

Kinh tế số

Lợi nhuận ngành sản xuất chip Trung Quốc tăng hơn 2.500%

Đọc ngay

Kinh tế số

Lợi nhuận ngành sản xuất chip Trung Quốc tăng hơn 2.500%

Đọc ngay

Kinh tế số

Cơ chế phân bổ ngân sách giai đoạn bộ ngành, địa phương chưa có quỹ phát triển khoa học, công nghệ

Đọc ngay

Kinh tế số

Nhật Bản ra mắt "tủ lạnh cho người" giá 241 triệu đồng

Đọc ngay

Kinh tế số

Trang bị các “giác quan” cho nhà máy sản xuất để doanh nghiệp Việt tham gia sâu chuỗi cung ứng toàn cầu

Đọc ngay

Thế giới

Apple vượt Nvidia về vốn hóa, trở thành công ty đắt giá nhất thế giới

Đọc ngay

Đón đọc Tạp chí Kinh tế Việt Nam số 30-2026

Mời quý độc giả đón đọc Tạp chí Kinh tế Việt Nam số 30-2026 phát hành ngày 27/07/2025 với nhiều chuyên mục hấp dẫn...

Công nghệ viễn thám nền tảng của cơ sở hạ tầng toàn cầu

Lâm nghiệp hiện là ngành sản xuất duy nhất có phát thải ròng âm. Ảnh: Hạnh Vân

Thiếu hạ tầng kỹ thuật, khó giao dịch carbon với thị trường quốc tế

Các cam kết trong Nghị định thư Montreal nhằm quản lý, loại trừ các chất làm suy giảm tầng ôzôn.

Lộ trình chuyển đổi cho doanh nghiệp theo Nghị định thư Montreal

Những cam kết trong Nghị định thư Montreal đặt ra bài toán phải chuyển đổi công nghệ cho các doanh nghiệp lĩnh vực điều hòa không khí di động, không khí gia dụng; lĩnh vực thiết bị lạnh công nghiệp, lạnh thương mại. Dự án "Quản lý bền vững các chất được kiểm soát theo Nghị định thư Montreal" vừa chính thức được khởi động nhằm hỗ trợ doanh nghiệp chuyển đổi, đáp ứng các cam kết quốc tế.

Chọn cỡ chữ

Meta mới đây đã ra mắt phiên bản cập nhật của mô hình Llama AI miễn phí, Llama 3. Hay chính xác hơn, gã khổng lồ này mới phát hành hai mô hình thuộc dòng Llama 3 mới, mô hình còn lại vẫn đang trong quá trình đào tạo…

THỊ TRƯỜNG MÔ HÌNH AI KHÔNG NGỪNG BIẾN ĐỘNG

LLAMA 3 SẼ ĐƯỢC TÍCH HỢP VÀO LOẠT ỨNG DỤNG CỦA META

Đọc bài theo từ khoá

Vietnam Economic Times

Tạp chí Kinh tế Việt Nam

Askonomy