Google ra mắt mô hình AI nguồn mở Gemma

26/02/2024

Google tiết lộ sẽ ra mắt mô hình AI nguồn mở miễn phí nhằm cạnh tranh với các mô hình từ Meta và một số công ty khởi nghiệp AI được tài trợ tốt như Mistral và Hugging Face…

Google ra mắt mô hình AI nguồn mở Gemma

Mô hình nguồn mở AI này có tên là Gemma, được mở cho các nhà phát triển và nhà nghiên cứu AI sử dụng và phân phối lại cho mục đích thương mại. Động thái này đã thay đổi cái nhìn của công chúng với gã khổng lồ này–từng bị chỉ trích vì công nghệ AI khép kín trong khi toàn ngành mở rộng hợp tác để nghiên cứu AI.

Trong khi, Gemini, mô hình ngôn ngữ của Google cạnh tranh với ChatGPT của OpenAI, được xây dựng dựa trên mô hình nhẹ; Gemma có hai kích cỡ, phiên bản nhỏ hơn và lớn hơn với tên gọi lần lượt là Gemma 2B và 7B, có thể chạy trực tiếp trên máy tính xách tay hay máy tính để bàn. Mô hình mở này sẽ giúp các nhà phát triển và nhà nghiên cứu xây dựng các hệ thống AI khác.

PHÂN CỰC NGUỒN MỞ VÀ ĐÓNG TRONG CUỘC ĐUA AI

Trong khi các công ty như Meta, Hugging Face và Mistral ủng hộ quyền truy cập nguồn mở, giúp công nghệ này phổ biến rộng rãi dưới danh nghĩa hợp tác và tiến bộ khoa học. Ở phía ngược lại, các công ty như Google và OpenAI , lại ủng hộ việc nghiên cứu khép kín độc quyền được kiểm soát chặt chẽ với lý do là giảm thiểu rủi ro và có thể ngăn chặn hành vi lạm dụng dễ dàng hơn.

Bộ phận điện toán đám mây AWS của Amazon cũng đã đứng giữa cả hai phe, ban đầu thân thiện với những người chơi nguồn mở như Hugging Face và sau đó ký kết hợp tác với Anthropic, công ty cung cấp các mô hình độc quyền.

Khi Google phát hành phiên bản Gemini mới nhất, được gọi là Gemini 1.5, công ty chỉ cung cấp phần mềm cho các nhà phát triển và khách hàng trên nền tảng đám mây của Google. Tuy nhiên, Gemma thì khác, điều này cho thấy một chiến lược mở rộng cho Google. Thậm chí, nhà khoa học trưởng của Meta, Yann LeCun từng chia sẻ với Forbes trong một cuộc phỏng vấn vào tháng 11: “Họ ngày càng trở nên ít cởi mở hơn. Tôi nghĩ nó sẽ làm chậm tiến độ trong toàn bộ lĩnh vực”.

GEMMA VƯỢT QUA HIỆU SUẤT CỦA CÁC MÔ HÌNH MỞ KHÁC

Các mô hình Gemma có hai kích cỡ: Gemma 2B bao gồm mạng lưới thần kinh với 2 tỷ biến có thể điều chỉnh, được gọi là tham số và Gemma 7B là mạng lưới thần kinh với 7 tỷ tham số. Theo đó, Gemma 2B và 7B đều đạt được hiệu suất tốt nhất trong phân khúc đối với kích thước của chúng so với các mẫu mở khác. Và các mẫu Gemma có khả năng chạy trực tiếp trên máy tính xách tay hoặc máy tính để bàn của nhà phát triển. Đáng chú ý, Gemma vượt qua các mô hình lớn hơn đáng kể về các điểm chuẩn chính trong khi vẫn tuân thủ các tiêu chuẩn khắt khe về kết quả đầu ra an toàn và có trách nhiệm.

Trong buổi ra mắt Gemma gần đây, Google cũng đã phát hành API với các công cụ và hướng dẫn để xây dựng an toàn với mô hình.

Ông Tris Warkentin, Giám đốc quản lý sản phẩm tại Google DeepMind, cho biết Google hy vọng bằng cách cung cấp cả mô hình độc quyền và nguồn mở, Google có thể thu hút nhiều khách hàng hơn để xây dựng các ứng dụng AI của họ hoàn toàn trong Nền tảng đám mây của Google.

Gã khổng lồ này cho biết các mô hình Gemma dựa trên một số nguyên tắc giống như các mô hình Gemini, nhưng các mô hình Gemini được thiết kế để nhập và xuất dữ liệu âm thanh, dữ liệu hình ảnh và văn bản, trong khi các mô hình Gemma chỉ có văn bản. Gemini đa ngôn ngữ, trong khi Gemma sẽ chỉ có tiếng Anh.

RỦI RO TIỀM ẨN CỦA MÔ HÌNH NGUỒN MỞ

Google đã cố gắng khẳng định trách nhiệm của mình so với các đối thủ cạnh tranh khác khi nói đến sự an toàn của các mô hình AI mà hãng đang phát hành. Mặc dù vậy, rõ ràng các mô hình nguồn mở nguy hiểm hơn các mô hình độc quyền. Rất khó để ngăn chặn kẻ xấu sử dụng mô hình cho mục đích bất chính, chẳng hạn như tạo mã phần mềm độc hại.

Các nhà nghiên cứu tại Đại học Carnegie Mellon năm ngoái đã chỉ ra rằng nếu họ có quyền truy cập vào cài đặt mạng lưới thần kinh của mô hình ngôn ngữ nguồn mở, họ có thể tạo ra phần mềm tự động thiết kế các lời nhắc có thể vượt qua các rào cản của cả mô hình nguồn mở đó. cũng như hầu hết các mô hình độc quyền. Điều này thậm chí có thể dễ dàng hơn nếu các mô hình có một số điểm tương đồng, như Google đã nói rằng Gemma và Gemini khá tương đồng với nhau.

TRÁCH NHIỆM CỦA GOOGLE VỚI MÔ HÌNH MỞ MỚI

Ông Warkentin, Giám đốc quản lý sản phẩm tại Google DeepMind cho biết thử nghiệm an toàn của Gemma thậm chí còn rộng hơn so với mô hình Gemini của Google.

Chính vì vậy, Google cho biết họ đã xây dựng Gemma với những biện pháp bảo vệ mạnh mẽ nhất có thể với công nghệ nguồn mở, bao gồm kỹ thuật tự động lọc ra một số thông tin cá nhân nhất định và dữ liệu nhạy cảm khác khỏi các tập huấn luyện; phương pháp học tập tăng cường và tinh chỉnh sâu rộng từ phản hồi của con người (RLHF) để điều chỉnh các mô hình với các hành vi có trách nhiệm.

Google cho biết họ đã phát hành Gemma cùng với các hướng dẫn về việc sử dụng và triển khai mô hình một cách có trách nhiệm cũng như một kỹ thuật mới để xây dựng các bộ lọc an toàn mà những người sử dụng mô hình có thể áp dụng để giúp chặn mọi đầu ra có vấn đề từ mô hình.

Jeanine Banks, Phó chủ tịch kiêm Tổng giám đốc và người đứng đầu bộ phận quan hệ phát triển tại Google, cho biết công ty có các điều khoản và điều kiện cấp phép rộng rãi cấm các lập trình viên sử dụng Gemma cho bất kỳ mục đích bất chính nào. Đây là một trong những lý do công ty thích gọi Gemma là “mô hình mở” để phân biệt với phần mềm “nguồn mở” truyền thống. Khác với việc Meta đưa ra các điều khoản cấp phép nhằm ngăn cản các đối thủ Big Tech sử dụng các mô hình nguồn mở Llama 2, Gemma không có những hạn chế thương mại như vậy.

Từ khóa:

Lãnh đạo UBND Thành phố Hà Nội và Tập đoàn Công nghệ CMC ký kết Bản ghi nhớ hợp tác giai đoạn 2026-2030, thúc đẩy chuyển đổi số, chuyển đổi AI và đổi mới sáng tạo.

Hà Nội hợp tác với các doanh nghiệp công nghệ, phát triển chính quyền số, thành phố AI

Trong khuôn khổ hội nghị công bố quy hoạch tổng thể Thủ đô Hà Nội tầm nhìn 100 năm và xúc tiến đầu tư năm 2026, UBND Thành phố Hà Nội đã ký kết thỏa thuận hợp tác với các doanh nghiệp công nghệ hàng đầu Việt Nam về phát triển khoa học, công nghệ và đổi mới sáng tạo, chuyển đổi số.

11:04 27/06/2026

World Cup hiện đại không chỉ còn là cuộc tranh tài giữa những ngôi sao bóng đá hàng đầu thế giới mà còn trở thành sân khấu lớn nhất của trí tuệ nhân tạo và dữ liệu.

World Cup thời AI: Hàng nghìn lao động dữ liệu phía sau sân cỏ

Không chỉ phục vụ các đội bóng, nguồn dữ liệu còn cung cấp cho các đài truyền hình, ngành công nghiệp trò chơi điện tử và đặc biệt là thị trường cá cược thể thao toàn cầu...

10:28 25/06/2026

Tổng thống Mỹ Donald Trump vừa ký hai sắc lệnh hành pháp nhằm thúc đẩy phát triển công nghệ lượng tử. Ảnh: Reuters

Tổng thống Trump đặt mục tiêu Mỹ sở hữu máy tính lượng tử mạnh vào năm 2028

Hoa Kỳ cũng nhấn mạnh nhu cầu tăng cường hợp tác quốc tế về bảo vệ quyền sở hữu trí tuệ và an ninh chuỗi cung ứng trong lĩnh vực lượng tử...

16:29 24/06/2026

Các học viên của Văn phòng Chính phủ thực hành ứng dụng AI vào các tình huống nghiệp vụ thực tế theo phương châm “Học để ứng dụng ngay”

Văn phòng Chính phủ bồi dưỡng chuyển đổi AI trong công tác hành chính và tham mưu tổng hợp

Thông qua chương trình, học viên được trang bị kiến thức, kỹ năng và phương pháp ứng dụng chuyển đổi AI vào thực tiễn công tác hành chính, tham mưu tổng hợp.

15:53 20/06/2026

Ngày 1/6, Spacesail phóng thành công hai vệ tinh bằng tên lửa tái sử dụng của Trung Quốc, chỉ hơn một tuần trước khi SpaceX IPO

SpaceX IPO, Trung Quốc tăng tốc xây dựng “chòm sao Internet” trên quỹ đạo

SpaceX của Elon Musk vừa chính thức niêm yết với mức định giá kỷ lục 1.800 tỷ USD, đánh dấu cột mốc mới của ngành công nghiệp vũ trụ thương mại toàn cầu. Tuy nhiên, khi giới đầu tư tập trung vào thành công của Starlink, một đối thủ mới từ Trung Quốc đang âm thầm mở rộng hiện diện trên thị trường quốc tế...

18:11 16/06/2026

Việc thành lập phòng thí nghiệm mới cũng phản ánh chiến lược tự chủ công nghệ ngày càng quyết liệt của Bắc Kinh

Trung Quốc ra mắt phòng thí nghiệm quang học, cung cấp năng lượng cho AI bằng ánh sáng

Phòng thí nghiệm trọng điểm về chip và hệ thống điện toán quang tử tích hợp của Trung Quốc đã được thành lập, đánh dấu bước đi mới nhất trong nỗ lực duy trì tham vọng AI của nền kinh tế lớn thứ hai thế giới.

18:10 16/06/2026

Hiện nay, ChatGPT vẫn giữ vị trí dẫn đầu trong lĩnh vực chatbot AI. Tuy nhiên, khoảng cách với các đối thủ đang dần thu hẹp.

ChatGPT đạt 1 tỷ người dùng hàng tháng, vượt kỷ lục Google Maps

ChatGPT của OpenAI đã cán mốc 1 tỷ người dùng hàng tháng chỉ sau 3,5 năm ra mắt, trở thành ứng dụng tăng trưởng nhanh nhất trong lịch sử Internet...

18:10 16/06/2026

Công nghệ lượng tử dựa trên silicon có thể tận dụng nhiều quy trình sản xuất vốn đã được phát triển trong ngành bán dẫn truyền thống

Trung Quốc tuyên bố tự chủ vật liệu lõi cho máy tính lượng tử, lần đầu sản xuất hàng loạt silicon-28

Một viện nghiên cứu đã sản xuất thành công silicon-28 có độ tinh khiết đồng vị vượt 99,99%, đánh dấu lần đầu tiên Trung Quốc sở hữu năng lực sản xuất độc lập và quy mô lớn loại vật liệu chiến lược này...

15:58 16/06/2026

Nhận thức người dùng là “lá chắn” trong cuộc chiến chống gian lận tài chính thời AI

Dù lừa đảo trực tuyến tại Việt Nam có dấu hiệu giảm nhiệt, các hình thức gian lận ngày càng tinh vi như “gian lận ủy quyền thanh toán” vẫn đặt ra thách thức lớn cho ngành tài chính. Các chuyên gia cho rằng bên cạnh công nghệ bảo mật, nâng cao nhận thức người dùng là yếu tố then chốt trong phòng chống lừa đảo…

10:50 12/06/2026

SpaceX vừa lần đầu công bố thiết kế vệ tinh trung tâm dữ liệu AI trên quỹ đạo mang tên AI1

SpaceX hé lộ trung tâm dữ liệu AI đầu tiên trên quỹ đạo

Dự án điện toán ngoài không gian hiện đóng vai trò trung tâm trong câu chuyện tăng trưởng mà SpaceX đang trình bày với giới đầu tư...

16:28 11/06/2026