Nhiều công nghệ mới được giới thiệu trong Hội nghị Nhà phát triển Google I/O

Bảo Ngọc
Chia sẻ

Loạt sản phẩm trí tuệ nhân tạo, từ tính năng tìm kiếm và trò chuyện mới đến phần cứng AI dành cho khách hàng trên nền tảng đám mây…vừa được Google giới thiệu trong Hội nghị Nhà phát triển I/O thường niên năm nay.

CEO Google Sundar Pichai phát biểu tại Hội nghị Nhà phát triển Google I/O năm nay.
CEO Google Sundar Pichai phát biểu tại Hội nghị Nhà phát triển Google I/O năm nay.

Loạt sản phẩm ấn tượng nhấn mạnh sự tập trung của công ty vào AI và quyết tâm vượt qua các đối thủ cạnh tranh, chẳng hạn như OpenAI, theo CNBC.

Nhiều tính năng hoặc công cụ mà Google tiết lộ chỉ đang trong giai đoạn thử nghiệm hoặc giới hạn sử dụng cho nhà phát triển, nhưng giới điệu mộ vẫn có thể hình dung rõ nét về cách gã khổng lồ công nghệ đặt cược vào trí tuệ nhân tạo. Trước đó, Google kiếm tiền từ AI chủ yếu thông qua phương thức tính phí nhà phát triển sử dụng mô hình của hãng và từ khách hàng trả tiền cho dịch vụ Gemini Advanced (khoảng 19,99 USD mỗi tháng).

Nhiều đối thủ cạnh tranh của Google cũng tỏ rõ quyết tâm trong cuộc đua công nghệ. Đầu tháng này, startup Anthropic được Amazon hậu thuẫn vừa công bố mô hình AI dành cho doanh nghiệp đầu tiên của hãng và một ứng dụng iPhone miễn phí. Trong khi đó, ngay đầu tuần này, OpenAI đã ra mắt mô hình AI mới và phiên bản ChatGPT dành cho máy tính để bàn, cùng với giao diện người dùng cập nhật.

Cùng tìm hiểu tất tần tật công nghệ mà gã khổng lồ tìm kiếm vừa công bố trong Hội nghị Nhà phát triển thường niên Google I/O năm nay.

PHIÊN BẢN CẬP NHẬT NHIỀU TÍNH NĂNG AI MỚI CỦA GEMINI

Google giới thiệu bản cập nhật cho Gemini 1.5 Pro, mô hình AI của hãng, sẽ sớm có thể xử lý nhiều dữ liệu hơn. Ví dụ, công cụ có thể tóm tắt tới 1.500 trang văn bản do người dùng tải lên.

Gemini 1.5 Pro được trang bị khả năng xử lý dữ liệu mạnh mẽ hơn. 
Gemini 1.5 Pro được trang bị khả năng xử lý dữ liệu mạnh mẽ hơn. 

Ngoài ra, hãng cũng giới thiệu mô hình Gemini 1.5 Flash AI mới được cho là tiết kiệm chi phí hơn và hữu ích đối với tác vụ nhỏ như tóm tắt nhanh cuộc hội thoại, tạo chú thích cho hình ảnh và video hay truy xuất dữ liệu từ tệp tài liệu lớn.

Giám đốc Điều hành Google Sundar Pichai rất tự hào về cải tiến trong tính năng dịch thuật của Gemini, đồng thời cho biết công cụ đã sẵn sàng cho tất cả các nhà phát triển toàn thế giới với 35 tùy chọn ngôn ngữ. Đặc biệt, khi tích hợp với Gmail, Gemini 1.5 Pro có thể phân tích các tệp PDF và video đính kèm, đưa ra bản tóm tắt một cách chính xác. Điều đó có nghĩa là, nếu bạn bỏ lỡ chuỗi email dài trong kỳ nghỉ, Gemini hoàn toàn có thể tóm tắt hòm thư bao gồm cả tệp đính kèm, giúp bạn cập nhật thông tin nhanh nhất sau khi quay trở lại làm việc.

Bản cập nhật mới của Gemini cũng hữu ích trong việc tìm kiếm và truy xuất Gmail. Ví dụ mà công ty đưa ra, nếu bạn đang so sánh giá từ nhiều nhà thầu khác nhau để sửa sang căn nhà của mình và cần bản tóm tắt trước khi quyết định lựa chọn, Gemini có thể gửi lại báo giá chi tiết cùng ngày bắt đầu dự kiến ​​​​được cung cấp trong các email khác nhau.

Google kỳ vọng mục tiêu cuối cùng là Gemini sẽ thay thế Google Assistant trên điện thoại Android, chứng tỏ đây là đối thủ cạnh tranh đáng gờm với Siri trên iPhone của Apple.

TỔNG QUAN VỀ GOOGLE VEO, IMAGEN 3 VÀ AUDIO

Tại sự kiện, Google công bố “Veo”, mô hình mới nhất giúp khởi tạo video độ phân giải cao và Imagen 3, mô hình chuyển văn bản thành hình ảnh chất lượng cao cấp nhất hiện nay, hứa hẹn mang tới hình ảnh sống động như thật.

Google trình làng một số công cụ sáng tạo video và hình ảnh. 
Google trình làng một số công cụ sáng tạo video và hình ảnh. 

Bộ công cụ sẵn sàng cho một số nhà sáng tạo được chọn vào đầu tuần tới và sẽ có mặt trên Vertex AI, nền tảng học máy của Google cho phép nhà phát triển đào tạo và vận hành ứng dụng trí tuệ nhân tạo.

Công ty cũng giới thiệu “Audio Overviews”, tính năng tạo cuộc thảo luận bằng âm thanh dựa trên dữ liệu nhập văn bản. Ví dụ, nếu bạn tải tài liệu lên, chatbot có thể nói cho bạn về bản tóm tắt tài liệu đó. Mọi câu trả lời của mô hình đều thực hiện thông qua âm thanh tương tác.

Ngoài ra, công ty cũng giới thiệu “AI Sandbox”, bộ công cụ AI tổng hợp giúp sản xuất nhạc và âm thanh gốc dựa trên văn bản yêu cầu từ người dùng.

Tuy nhiên, đa số công cụ AI sáng tạo như chatbot và trình tạo hình ảnh đều đang liên tiếp gặp vấn đề về độ chính xác.

Phó Chủ tịch cấp cao Prabhakar Raghavan chia sẻ với nhân viên Google vào tháng trước rằng các đối thủ cạnh tranh “có thể thu hút người dùng tham gia sử dụng mô hình, nhưng sau đó người dùng vẫn tìm đến Google để xác minh thông tin vừa đọc có phải nguồn đáng tin cậy hay không”.

Ngược lại, đầu năm nay, Google đã giới thiệu trình tạo hình ảnh do Gemini cung cấp. Người dùng phát hiện ra nhiều điểm không phản ánh chính xác dữ liệu lịch sử lan truyền trực tuyến và hãng phải thu hồi tính năng này ngay sau đó. Google cho biết sẽ khởi chạy lại công cụ trong một vài tuần tới. 

TÍNH NĂNG TÌM KIẾM MỚI

Gã khổng lồ công nghệ tuyên bố sẽ ra mắt "AI Overviews" tích hợp trong Google Search vào đầu tuần tới tại Hoa Kỳ. Theo bà Liz Reid, người đứng đầu Google Search, AI Overviews sẽ hiển thị bản tóm tắt nhanh các câu trả lời cho một số câu hỏi tìm kiếm phức tạp nhất. Ví dụ, nếu người dùng tìm kiếm cách tốt nhất để làm sạch ủng da, trang kết quả có thể hiển thị “AI Overviews” trên cùng với quy trình làm sạch gồm đầy đủ các bước, được thu thập từ thông tin tổng hợp trên nhiều trang web khác nhau.

AI Overviews còn được trang bị khả năng lập kế hoạch giống như trợ lý ảo. Công ty giải thích rằng người dùng có thể tìm kiếm nội dung như “Tạo thực đơn 3 ngày cho nhóm 5 người dễ chuẩn bị” và công cụ sẽ đưa ra một menu với nhiều công thức nấu ăn đa dạng.

Theo chiến lược “đa phương thức” hoặc tích hợp hình ảnh và video nhiều hơn trong công cụ AI tổng hợp, Google cho biết sẽ bắt đầu thử nghiệm khả năng người dùng đặt câu hỏi thông qua video, chẳng hạn như quay phim sự cố với sản phẩm, tải lên và yêu cầu công cụ tìm kiếm tìm ra vấn đề. Trong ví dụ, Google chiếu cảnh người dùng quay phim máy ghi âm bị hỏng và hỏi tại sao thiết bị không hoạt động. Google Search đã tìm đúng kiểu máy ghi âm và cho rằng thiết bị có thể trục trặc do không được lắp đúng cách.

PROJECT ASTRA

Project Astra là cập nhật mới nhất của Google đối với sản phẩm trợ lý AI đang được đơn vị DeepMind xây dựng. 

Trong video demo được trình bày tại Google I/O, trợ lý ảo – thông qua video và âm thanh, thay vì giao diện chatbot – có thể giúp người dùng gợi nhớ nơi họ để đồ vật, xem lại thông tin cá nhân, thậm chí trả lời câu hỏi về tên bộ phận bất kỳ của sản phẩm, khi sản phẩm đó xuất hiện trong video.

Bản demo sử dụng Project Astra. 
Bản demo sử dụng Project Astra. 

Google nhấn mạnh chatbot thực sự hữu ích khi cho phép người dùng “nói chuyện một cách tự nhiên và không trả lời chậm trễ”. Cuộc trò chuyện trong video demo diễn ra theo thời gian thực, không có độ trễ. 

Giám đốc Điều hành DeepMind Demis Hassabis cho biết trong khuôn khổ Hội nghị rằng “việc giảm độ trễ trong thời gian phản hồi đòi hỏi nhiều kỹ thuật khó nhằn”.

CEO Pichai hy vọng Project Astra sẽ được tích hợp trong Gemini vào cuối năm nay.

PHẦN CỨNG AI

Google cũng vừa công bố Trillium, bộ xử lý TPU hay còn gọi là bộ xử lý tensor thế hệ thứ sáu – phần cứng không thể thiếu khi vận hành hoạt động AI phức tạp – sẵn sàng phục vụ khách hàng trên nền tảng đám mây vào cuối năm nay.

Tuy nhiên, TPU không nhằm mục đích cạnh tranh với các chip khác, chẳng hạn như đơn vị xử lý đồ hoạ của Nvidia. CEO Pichai cũng lưu ý trong I/O rằng Google Cloud sẽ bắt đầu cung cấp GPU Blackwell của Nvidia vào đầu năm 2025.

Trước đó, vào tháng 3, Nvidia tiết lộ Google sẽ sử dụng nền tảng Blackwell cho “nhiều hoạt động triển khai nội bộ khác nhau và trở thành một trong những nhà cung cấp đám mây đầu tiên ra mắt các phiên bản được hỗ trợ bởi Blackwell”. Quyền truy cập vào hệ thống Nvidia đồng thời giúp Google cung cấp các công cụ quy mô lớn cho nhà phát triển doanh nghiệp xây dựng mô hình LLM.

Trong bài phát biểu, Giám đốc Pichai khẳng định “mối quan hệ đối tác lâu dài của Google với Nvidia”. Hai công ty đã hợp tác hơn một thập kỷ và ông hy vọng Nvidia vẫn sẽ tiếp tục đồng hành cùng Google trong thập kỷ tới.

Khởi nghiệp

Hồ sơ Startup

Citigo là công ty công nghệ cung cấp những giải pháp đơn giản với chi phí tiết kiệm, giúp khách hàng nâng cao hiệu quả kinh doanh. Citigo hướng tới tầm nhìn trở thành công ty cung cấp giải pháp công nghệ cho doanh nghiệp phổ biến tại Đông Nam Á
ESBT là công ty hoạt động trọng lĩnh vực công nghệ thông tin, chúng tôi xây dựng những sản phẩm phần mềm cho cộng đồng và cung cấp dịch vụ phát triển phần mềm cho các doanh nghiệp
Lozi là một trong những ứng dụng thương mại điện tử được yêu thích nhất tại Việt Nam, kết nối hàng triệu người mua và người bán nhằm phục vụ nhu cầu mua bán trực tuyến ngày càng cao. Không chỉ là một cầu nối thương mại điện tử đáng tin cậy, Lozi còn cung cấp dịch vụ giao hàng nhanh chóng và tiện lợi chỉ trong 1 giờ, đem đến cho khách hàng những trải nghiệm mua sắm trực tuyến hiệu quả và tối ưu
Bắt nguồn từ mong muốn mang chất lượng dạy Tiếng Anh tại Trường Quốc tế đến với mọi học sinh Việt Nam, để các bạn nhỏ dù không có điều kiện kinh tế theo học tại các Trường Quốc Tế hay Trung Tâm đắt tiền vẫn có thể sử dụng Tiếng Anh tốt như người bản ngữ. Đây chính là hành trang chuẩn bị cho các em tương lai vươn ra thế giới. Chính vì lý do trên, đội ngũ sáng lập đã bắt tay vào xây dựng sản phẩm đầu tiên có tên “Chương trình học Tiếng Anh Online EDUPIA”.
Công ty TNHH SA-ACH định vị về lĩnh vững trồng rừng, phát triển gồm 3 loại cây và bốn tầng cây trên một hecta đất nhằm tạo hệ sinh thái bền vững, và nâng cao thu nhập cho bà con