Быстрее, чем когда-либо: новая модель от OpenAI генерирует видео в 50 раз быстрее

Исследователи из команды OpenAI представили новую модель непрерывной согласованности во времени (sCM), которая способна генерировать видеоматериалы в 50 раз быстрее, чем существующие модели. Эта разработка была представлена в статье, опубликованной на сервере препринтов arXiv, и описана в статье на сайте компании.

Новая модель, разработанная Чэн Лу и Ян Сун, представляет собой тип переменной генеративной модели, которая использует диффузионные методы для обучения приложений ИИ. Такие модели обычно включают три основных компонента: прямые и обратные процессы и процедуру выборки. Они широко используются для создания визуальной продукции, такой как видео и изображения, а также применяются в других областях, например, в создании аудио.

Быстрее, чем когда-либо: новая модель от OpenAI генерирует видео в 50 раз быстрее — Источник: DALL-E

Традиционные модели диффузии требуют сотен шагов для генерации конечного результата, что занимает несколько минут. В отличие от этого, новая модель Лу и Сун выполняет всю работу всего за два шага, что радикально сокращает время генерации видео без потери качества.

Новая модель использует более 1,5 миллиарда параметров и может создать видео за доли секунды на компьютере с одним графическим процессором A100. Это примерно в 50 раз быстрее, чем существующие модели. Исследователи подчёркивают, что их модель требует гораздо меньше вычислительной мощности, чем другие модели, что является постоянной проблемой для приложений ИИ.

Новая модель уже прошла бенчмаркинг для сравнения результатов с другими моделями, включая те, которые используются в настоящее время, и те, которые разрабатываются другими командами.

«Наша новая модель представляет собой значительный шаг вперёд в области генеративного ИИ. Мы верим, что она откроет новые возможности для создания реальных приложений на базе искусственного интеллекта, которые могут работать в реальном времени», — отметили Чэн Лу и Ян Сун.

Эта разработка имеет значительные перспективы для различных областей, включая создание видео, изображений и аудио, а также для приложений ИИ в целом. Быстрая генерация видео может быть полезна в таких областях, как кинопроизводство, реклама и образование. Кроме того, снижение вычислительной мощности, необходимой для работы модели, может сделать её более доступной для широкого круга пользователей.

Источник

Техноблог

Быстрее, чем когда-либо: новая модель от OpenAI генерирует видео в 50 раз быстрее

Кроссовер Geely размером с Monajro и запасом хода 1420 км дешевле 17 тыс. долларов. Geely Galaxy Starship 7 EM-i появился у дилеров в Китае

Самый уродливый автомобиль в этом году. Китайцы раскритиковали новый Geely Okavango Exclusive

В Белоруссии стартовали продажи Voyah Free 318 — кроссовер удивил своей низкой ценой

Новый претендент на звание самого мощного смартфона в мире: Redmi K80 Pro набирает почти 3,2 млн баллов в AnTuTu

Представлен Kia EV9 GT: полный привод, 508 л.с., адаптивная подвеска, 4,3 с до 96,5 км/ч и симулятор бензинового мотора

Geely Monjaro и тут первый. Это самый востребованный у россиян новый автомобиль с автоматом

Кроссовер Geely размером с Monajro и запасом хода 1420 км дешевле 17 тыс. долларов. Geely Galaxy Starship 7 EM-i появился у дилеров в Китае

Самый уродливый автомобиль в этом году. Китайцы раскритиковали новый Geely Okavango Exclusive

В Белоруссии стартовали продажи Voyah Free 318 — кроссовер удивил своей низкой ценой

Новый претендент на звание самого мощного смартфона в мире: Redmi K80 Pro набирает почти 3,2 млн баллов в AnTuTu