AI-генерация B-roll для видео через Gemini, GPT и Veo

Кейс из публичной библиотеки n8n.io. Русское саммари сгенерировано автоматически (GPT-4o-mini). Авторские заметки о применении в реальной практике — отдельно в разделе /notes/ (готовится).

Описание

Шаблон запускается вручную и берёт заданный URL исходного видео, поэтому это не полноценный конвейер загрузки контента. Видео скачивается и анализируется через Gemini 2.5 Flash для поиска эмоциональных пиков, хуков и таймкодов. Затем OpenAI-модели выбирают несколько лучших моментов и формируют подробные промпты для генерации B-roll. Veo 3 через Google Cloud создаёт короткие AI-видеофрагменты, которые сохраняются в Google Cloud Storage. На выходе пользователь получает агрегированный список URL сгенерированных клипов в Telegram.

Как устроено

Ключевая логика построена на Manual Trigger, HTTP Request/JWT для Google API, OpenAI, Google Cloud Storage, цикле обработки элементов, Wait/Switch для ожидания генерации и Telegram для доставки результата. Состояние фактически держится внутри батчевого цикла и последующей агрегации ссылок, внешнего хранилища прогресса или очереди нет. HITL-этапа для утверждения выбранных моментов или промптов не предусмотрено, что рискованно для брендового контента. Явной промышленной обработки ошибок, ретраев, лимитов стоимости и модерации результата по описанию не видно. Расписания нет: видео URL задаётся в настройках, запуск ручной.

Применение

Генерация B-roll для YouTube-видео
Подготовка дополнительных кадров для подкастов и интервью
Создание визуальных вставок для коротких клипов
Автоматизация постпродакшена образовательных видео
Прототипирование AI-видеопроизводства на базе Veo

Стек / ноды

OpenAI Google Cloud Storage Telegram HTTP Request JWT Manual Trigger Wait Switch Loop Over Items

Источник: https://n8n.io/workflows/15146/ · Оригинальный автор: Koulikas Giannis