Кейс из публичной библиотеки n8n.io. Русское саммари сгенерировано автоматически (GPT-4o-mini). Авторские заметки о применении в реальной практике — отдельно в разделе /notes/ (готовится).

Описание

Шаблон запускается через Webhook и принимает аудио или текстовый запрос от клиента. Аудио распознаётся через Sarvam AI, затем OpenAI формирует ответ с учётом сценария по недвижимости и условий эскалации. После этого ответ преобразуется обратно в речь через Sarvam AI и возвращается через Respond to Webhook. Данные лида и детали обращения записываются в Google Sheets. На выходе получается голосовой или текстовый ответ клиенту и строка в таблице для дальнейшей обработки.

Как устроено

Ключевая связка построена вокруг Webhook, HTTP Request к Sarvam AI для STT/TTS, OpenAI для генерации ответа и Google Sheets для логирования. Условия маршрутизации реализованы через If, включая проверку распознавания и эскалационные признаки. Заявленная память диалога, судя по списку нод, вероятно хранится в Code или передаётся во входных данных, отдельного устойчивого хранилища состояния нет. Полноценного HITL-процесса не видно: есть логика эскалации, но нет интеграции с телефонией, CRM, Slack или очередью операторов. Расписания нет, сценарий работает по входящим webhook-событиям.

Применение

  • Приём голосовых заявок по объектам недвижимости
  • Квалификация лидов на тамильском языке
  • Голосовой FAQ по ценам, локациям и доступности объектов
  • Первичная обработка обращений перед передачей в CRM
  • Тестирование STT/TTS-сценариев для локальных языков

Стек / ноды

Webhook Respond to Webhook HTTP Request OpenAI Google Sheets Sarvam AI
Источник: https://n8n.io/workflows/15300/ · Оригинальный автор: Dinakar Selvakumar