OpenAI đẩy cuộc đua AI lên bậc thang mới, ra mắt công cụ Sora tạo video từ text

Thanh Minh, Huyền Thương, Hoàng

16/02/2024

Hiện tại, OpenAI vẫn chưa phát hành Sora ra công chúng mà chỉ chia sẻ công nghệ này với một nhóm nhỏ các học giả và các nhà nghiên cứu bên ngoài…

Hình ảnh trong video do OpenAI tạo ra về một phụ nữ bước đi trên đường phố Tokyo

Vào tháng 4, một công ty khởi nghiệp ở New York có tên Runway AI đã tiết lộ công nghệ cho phép mọi người tạo video. Các video chỉ dài 4 giây, bị mờ, giật, méo và khó chịu. Nhưng đó là dấu hiệu rõ ràng cho thấy công nghệ trí tuệ nhân tạo sẽ tạo ra những video ngày càng thuyết phục trong những tháng và năm tới.

Chỉ 10 tháng sau, công ty khởi nghiệp OpenAI ở San Francisco đã tiết lộ một hệ thống tương tự có thể tạo ra các video như thể được lấy ra từ một bộ phim Hollywood. OpenAI đã trình diễn một số video ngắn - được tạo trong vài phút - về những con voi ma mút lông xù chạy qua đồng cỏ đầy tuyết, hay video về một con quái vật nhìn chằm chằm vào một ngọn nến đang tan chảy và khung cảnh đường phố Tokyo dường như được quay bởi một chiếc máy ảnh sà ngang qua thành phố.

SORA, CÔNG CỤ TẠO VIDEO TỪ TEXT CỦA OPENAI

OpenAI, công ty đứng sau chatbot ChatGPT và trình tạo ảnh tĩnh DALL-E, nằm trong số nhiều công ty đang chạy đua để cải tiến loại trình tạo video tức thời này. Bên cạnh OpenAI là các công ty khởi nghiệp như Runway và những gã khổng lồ công nghệ như Google và Meta, chủ sở hữu của Facebook và Instagram. Công nghệ này có thể tăng tốc công việc của các nhà làm phim dày dạn kinh nghiệm, đồng thời thay thế hoàn toàn các nghệ sĩ kỹ thuật số ít kinh nghiệm hơn.

Nó cũng có thể trở thành một cách nhanh chóng và ít tốn kém để tạo ra thông tin sai lệch trực tuyến, khiến việc xác định đâu là sự thật trên internet càng trở nên khó khăn hơn.

Oren Etzioni, giáo sư chuyên về trí tuệ nhân tạo tại Đại học Washington, cho biết: “Tôi thực sự lo sợ rằng loại công nghệ này sẽ ảnh hưởng đến một cuộc bầu cử có tính cạnh tranh sít sao”. Ông cũng là người sáng lập True Media, một tổ chức phi lợi nhuận hoạt động nhằm xác định thông tin sai lệch trực tuyến trong các chiến dịch chính trị.

OpenAI gọi hệ thống mới của mình là Sora, theo từ tiếng Nhật có nghĩa là bầu trời. Nhóm đằng sau công nghệ này, bao gồm các nhà nghiên cứu Tim Brooks và Bill Peebles, đã chọn cái tên này vì nó “gợi lên ý tưởng về tiềm năng sáng tạo vô hạn”.

Video này được OpenAI tạo ra bằng công cụ Sora, theo câu lệnh: “Đoàn voi ma mút lông khổng lồ bước qua một đồng cỏ đầy tuyết, bộ lông dài của chúng tung bay nhẹ trong gió khi chúng bước đi, cây cối phủ đầy tuyết, những ngọn núi phủ tuyết ấn tượng ở phía xa, ánh sáng giữa buổi chiều, những đám mây mỏng manh và bầu trời trên cao tạo ra ánh sáng ấm áp, chế độ xem camera ấn tượng với hình ảnh loài động vật có vú lớn di chuyển"

Trong một cuộc phỏng vấn, họ cũng cho biết công ty vẫn chưa phát hành Sora ra công chúng vì họ vẫn đang nỗ lực tìm hiểu mối nguy hiểm của hệ thống. Thay vào đó, OpenAI đang chia sẻ công nghệ này với một nhóm nhỏ các học giả và các nhà nghiên cứu bên ngoài khác, những người sẽ là “red team”, một thuật ngữ chỉ việc tìm kiếm những cách công cụ có thể bị lạm dụng.

Tiến sĩ Brooks nói: “Mục đích ở đây là đưa ra một bản xem trước về những gì sắp xảy ra, để mọi người có thể thấy được khả năng của công nghệ này - và chúng tôi có thể nhận được phản hồi”.

OpenAI đã gắn thẻ các video do hệ thống tạo ra bằng các hình mờ để xác định chúng được tạo bởi A.I. Nhưng công ty thừa nhận rằng những hình ảnh mờ xác định video đó do AI tạo ra vẫn có thể bị “lách luật”. Hơn nữa, người xem cũng khó phát hiện ra các hình mờ đó.

SORA CÓ THỂ TẠO RA NHỮNG VIDEO “ĐẸP NHƯ TRONG PHIM HOLLYWOOD”

Hệ thống này là một ví dụ về AI tổng quát, có thể tạo văn bản, hình ảnh và âm thanh ngay lập tức. Giống như các A.I sáng tạo khác. công nghệ, hệ thống của OpenAI học hỏi bằng cách phân tích dữ liệu kỹ thuật số - trong trường hợp này là video và chú thích mô tả nội dung của những video đó.

OpenAI từ chối cho biết hệ thống đã học được bao nhiêu video hoặc chúng đến từ đâu, ngoại trừ việc cho biết khóa đào tạo bao gồm cả video có sẵn công khai và video được cấp phép từ chủ sở hữu bản quyền. Công ty nói rất ít về dữ liệu được sử dụng để đào tạo công nghệ của mình, rất có thể là vì họ muốn duy trì lợi thế so với các đối thủ cạnh tranh - và đã bị kiện nhiều lần vì sử dụng tài liệu có bản quyền.

Sora tạo video dựa trên những mô tả ngắn, chẳng hạn như “một thế giới giấy thủ công được thể hiện tuyệt đẹp về một rạn san hô, với nhiều loài cá và sinh vật biển đầy màu sắc”. Mặc dù các video có thể rất ấn tượng nhưng chúng không phải lúc nào cũng hoàn hảo và có thể bao gồm những hình ảnh lạ và phi logic. Ví dụ: hệ thống gần đây đã tạo một video quay cảnh ai đó đang ăn bánh quy - nhưng chiếc bánh quy vẫn không nhỏ hơn chút nào dù bị ăn.

DALL-E, Midjourney và các công cụ tạo ảnh tĩnh khác đã được cải tiến nhanh chóng trong vài năm qua đến mức hiện nay chúng đang tạo ra những hình ảnh gần như không thể phân biệt được với ảnh chụp. Điều này khiến việc xác định thông tin sai lệch trực tuyến trở nên khó khăn hơn và nhiều nghệ sĩ kỹ thuật số phàn nàn rằng điều đó khiến họ khó tìm được việc làm hơn.

Reid Southen, một nghệ sĩ ý tưởng phim ở Michigan, cho biết: “Tất cả chúng tôi đều cười vào năm 2022 khi Midjourney lần đầu tiên ra mắt và nói: 'Ồ, thật dễ thương'”. “Bây giờ mọi người đang mất việc vì Midjourney.”

Từ khóa:

Lãnh đạo và đại diện 29 quốc gia dự lễ ký Hiệp định thành lập Tổ chức Hợp tác AI thế giới (World AI Cooperation Organization - WAICO). Ảnh: Xinhua.

Tổ chức Hợp tác Trí tuệ nhân tạo thế giới được thành lập, kỳ vọng thúc đẩy quản trị AI toàn cầu

Tổ chức Hợp tác Trí tuệ nhân tạo thế giới (WAICO) hướng tới mục tiêu thúc đẩy hợp tác quốc tế và quản trị toàn cầu về trí tuệ nhân tạo (AI), bảo đảm AI mang lại lợi ích, an toàn và công bằng...

10:54 21/07/2026

Trung Quốc vừa hoàn thành ca phẫu thuật thương mại đầu tiên trên thế giới sử dụng thiết bị giao diện não - máy tính. Ảnh: Getty Images

Trung Quốc hoàn thành ca cấy ghép giao diện não-máy tính thương mại đầu tiên trên thế giới

Trung Quốc vừa ghi dấu một cột mốc mới trong lĩnh vực giao diện não - máy tính (Brain-Computer Interface - BCI) khi thực hiện thành công ca phẫu thuật thương mại đầu tiên trên thế giới sử dụng một thiết bị BCI xâm lấn đã được cơ quan quản lý cấp phép lưu hành…

22:11 19/07/2026

AI đang mở ra một cuộc cạnh tranh mới. Ảnh: Forbes

AI chuyển sang cuộc đua mới: Lớn nhất không còn là “tốt nhất”

Thay vì chỉ chạy đua xây dựng những mô hình ngày càng lớn và đắt đỏ, các doanh nghiệp hiện quan tâm nhiều hơn đến các mô hình thông minh và hiệu quả nhất…

16:39 16/07/2026

StepFun, startup được Tencent hậu thuẫn, đã giới thiệu mẫu StepX Neo. Ảnh: SCMP

Startup Trung Quốc ra smartphone AI đầu tiên trên thế giới

Trong khi Apple và OpenAI vướng vào cuộc chiến pháp lý liên quan đến phần cứng AI, startup StepFun của Trung Quốc đã giới thiệu mẫu smartphone được xây dựng hoàn toàn xoay quanh các AI agent, thay vì chỉ bổ sung các tính năng AI lên nền tảng di động truyền thống…

16:39 16/07/2026

Giống sắn được phát triển từ nghiên cứu của GS. Lê Huy Hàm hội tụ đồng thời nhiều đặc tính ưu việt: Kháng bệnh khảm lá, cho năng suất tinh bột cao và có kiểu hình thân thẳng. Ảnh: Quỹ Thiện tâm.

Mạng lưới khoa học quốc tế: "Hạ tầng mềm" cho đổi mới sáng tạo Việt Nam

Từ nghiên cứu vật liệu, nông nghiệp, y tế đến chuyển đổi xanh, ngày càng nhiều kết nối giữa các nhà khoa học quốc tế và các nhóm nghiên cứu trong nước đang được chuyển hóa thành những dự án hướng trực tiếp vào các bài toán phát triển của Việt Nam...

16:38 16/07/2026

Airbus dự báo thế giới sẽ cần khoảng 42.060 máy bay mới trong 20 năm tới.

Công nghệ máy bay mở ra mạng lưới hàng không mới

Những bước tiến về hiệu quả khai thác, tầm bay và khả năng tiết kiệm nhiên liệu của máy bay thế hệ mới đang làm thay đổi cách ngành hàng không phát triển mạng lưới kết nối trên toàn cầu...

15:20 10/07/2026

WAIC năm nay, diễn ra từ ngày 17-20/7 tại Thượng Hải, được xem là một trong những sự kiện AI lớn nhất châu Á. Ảnh: SCMP

Trung Quốc phô diễn sức mạnh AI, hé lộ điện thoại AI Agent đầu tiên thế giới

Hội nghị Trí tuệ nhân tạo Thế giới (World Artificial Intelligence Conference - WAIC) 2026 sẽ trở thành sân khấu để Trung Quốc trình làng hàng loạt công nghệ AI thế hệ mới, từ hạ tầng tính toán quy mô lớn đến các thiết bị AI dành cho người dùng cuối…

11:49 09/07/2026

Trung Quốc đang nổi lên như một trong những động lực tăng trưởng quan trọng nhất của ngành robotaxi. Ảnh: SCMP

Thị trường robotaxi toàn cầu có thể đạt 1.000 tỷ USD vào năm 2040

Dự kiến chi phí linh kiện cho mỗi chiếc xe taxi tự lái sản xuất tại Trung Quốc sẽ giảm xuống còn từ 35.000 đến 40.000 đô la Mỹ vào năm 2027…

16:33 07/07/2026

Đại sứ quán Đan Mạch tại Việt Nam và Bảo hiểm Xã hội (BHXH) Việt Nam vừa ký kết Biên bản ghi nhớ (MoU) giai đoạn 2026–2028

Đan Mạch và Việt Nam thúc đẩy y tế số, nâng cao chất lượng chăm sóc sức khỏe

Hợp tác giữa Đại sứ quán Đan Mạch và Bảo hiểm Xã hội Việt Nam bước vào giai đoạn hợp tác mới 2026–2028 với trọng tâm là phát triển y tế số, ứng dụng dữ liệu y tế và kinh tế y tế trong hoạch định chính sách…

16:33 07/07/2026

Nhu cầu về các giải pháp an ninh mạng đang tăng mạnh, đặc biệt khi các quy định về an ninh thông tin và bảo vệ dữ liệu ngày càng chặt chẽ

Doanh nghiệp Việt trước thách thức kép về an ninh mạng từ bên ngoài và trong nội bộ

Trong bối cảnh nền kinh tế số tại Việt Nam phát triển với tốc độ chóng mặt, khối lượng dữ liệu được tạo ra tăng lên vượt bậc, khiến dữ liệu trở thành tài sản giá trị nhưng cũng dễ bị thất thoát và lạm dụng hơn bao giờ hết.

16:33 07/07/2026