Описание
Шаблон запускается вручную и берёт заданный URL исходного видео, поэтому это не полноценный конвейер загрузки контента. Видео скачивается и анализируется через Gemini 2.5 Flash для поиска эмоциональных пиков, хуков и таймкодов. Затем OpenAI-модели выбирают несколько лучших моментов и формируют подробные промпты для генерации B-roll. Veo 3 через Google Cloud создаёт короткие AI-видеофрагменты, которые сохраняются в Google Cloud Storage. На выходе пользователь получает агрегированный список URL сгенерированных клипов в Telegram.
Как устроено
Ключевая логика построена на Manual Trigger, HTTP Request/JWT для Google API, OpenAI, Google Cloud Storage, цикле обработки элементов, Wait/Switch для ожидания генерации и Telegram для доставки результата. Состояние фактически держится внутри батчевого цикла и последующей агрегации ссылок, внешнего хранилища прогресса или очереди нет. HITL-этапа для утверждения выбранных моментов или промптов не предусмотрено, что рискованно для брендового контента. Явной промышленной обработки ошибок, ретраев, лимитов стоимости и модерации результата по описанию не видно. Расписания нет: видео URL задаётся в настройках, запуск ручной.
Применение
- Генерация B-roll для YouTube-видео
- Подготовка дополнительных кадров для подкастов и интервью
- Создание визуальных вставок для коротких клипов
- Автоматизация постпродакшена образовательных видео
- Прототипирование AI-видеопроизводства на базе Veo