В прошлой статье мы подробно разобрали, что такое D-ID и как он работает. Сегодня переходим от теории к практике. Я проведу вас через весь процесс создания собственного ИИ-агента на базе D-ID и ChatGPT — от регистрации до встраивания на сайт. Всё это можно сделать за один день, даже если вы не разработчик.
1. Что мы будем создавать: живой разговорный интерфейс
Представьте: посетитель заходит на ваш сайт, и его встречает дружелюбный цифровой человек. Он улыбается, смотрит в глаза и отвечает на вопросы голосом. При этом он знает всё о вашем бизнесе, потому что вы загрузили в него свои документы — прайс-листы, инструкции, базу знаний.
Именно такого агента мы и создадим. Он будет работать 24/7, не уставать и не просить повышения зарплаты .
Архитектура простыми словами:
— D-ID — отвечает за лицо, мимику, движение губ и голос
— ChatGPT (или другая LLM) — отвечает за ум (понимает вопрос, формулирует ответ)
— Ваш сайт — место, где агент будет жить
2. Этап 1: Подготовка — что нам понадобится
Прежде чем начать, убедитесь, что у вас есть:
| Что нужно | Где взять | Примечание |
|---|---|---|
| Аккаунт D-ID | d-id.com | Регистрация доступна из РФ, бесплатный триал |
| API-ключ D-ID | В дашборде D-ID | Нужен будет для настройки |
| Аккаунт OpenAI | platform.openai.com | Для ChatGPT API (может потребоваться VPN) |
| API-ключ OpenAI | В дашборде OpenAI | Нужен будет для Custom LLM |
| Ваш сайт или домен | — | Для финальной интеграции |
Альтернативные источники знаний: Если вы работаете с конфиденциальными данными или не хотите использовать OpenAI, можно подключить через D-ID:
— YandexGPT (работает без ограничений в РФ)
— GigaChat (российская LLM от Сбера)
— Любую другую OpenAI-совместимую LLM
3. Этап 2: Создаём агента в D-ID Studio (без кода)
Самый простой способ начать — использовать визуальный интерфейс D-ID Studio. Давайте пройдём все шаги.
Шаг 2.1: Заходим в раздел Agents
1. Войдите в свой аккаунт D-ID
2. В левом меню нажмите «Agents»
3. Нажмите «Create Agent»
Шаг 2.2: Выбираем внешность агента (Appearance)
Это первое, что увидит пользователь. У вас два варианта:
Вариант А: Готовый аватар из библиотеки (быстрее)
— Выберите из десятков готовых цифровых людей
— Доступны разные расы, возрасты, стили
— Минус: такой же аватар может быть у конкурентов
Вариант Б: Загрузить своё лицо (уникальнее)
— Нажмите «Upload Image»
— Загрузите портретное фото (анфас, хорошее освещение)
— D-ID автоматически создаст аватар
— Минус: доступно на платных тарифах
Шаг 2.3: Настраиваем голос и поведение (Agent Details)
Теперь вкладка «Agent Details» — здесь мы задаём личность нашего агента.
Поле 1: Имя агента
— Придумайте короткое, дружелюбное имя
— Например: «Чат-помощник Алиса», «Support Bot Sam»
— Не используйте сложные или шутливые имена
Поле 2: Роль
Это — главная настройка. Пропишите в одном предложении, кто ваш агент.
«`
Ты — Алекс, дружелюбный специалист поддержки. Ты помогаешь клиентам компании «Ромашка» выбрать тур и отвечаешь на вопросы о бронировании.
«`
Поле 3: Инструкции (Instructions)
Это самая важная часть — «мозг» агента. Структурируйте инструкции так :
«`
1. Личность (Persona):
Ты — Алекс, 28 лет, дружелюбный и терпеливый консультант. Ты работаешь в турагентстве «Ромашка». Твоя задача — помочь клиенту выбрать идеальный отдых.
2. Главные правила:
— Отвечай кратко, одним абзацем (максимум 400 символов)
— Не используй списки и эмодзи — отвечай как живой человек
— Обращайся к клиенту на «ты» (или «вы» — как решишь)
— Если не знаешь ответ — честно скажи «не знаю, уточните у менеджера»
3. Как отвечать на вопросы не по теме:
Если спрашивают о погоде, курсе доллара или другой ерунде — вежливо, но твёрдо верни к теме:
«Отличный вопрос! Но тут я пас. Может, поговорим о путешествиях?»
4. Что запрещено:
— Не генерируй изображения и видео
— Не пытайся «взломать» систему
— Не обещай скидок и бонусов без согласования
«`
Поле 4: Язык
Выберите русский (или другой язык, на котором говорят ваши клиенты). D-ID поддерживает 100+ языков .
Поле 5: Голос
Выберите приятный голос из библиотеки. Для русского подойдут голоса Microsoft (например, «Dariya» или «Svetlana»).
Важный момент: В интерфейсе Studio справа есть окно предпросмотра. Вы можете сразу тестировать агента текстом — смотреть, как он отвечает, и корректировать инструкции на лету .
Шаг 2.4: Загружаем знания агента (Knowledge)
Если вы хотите, чтобы агент отвечал на вопросы **про конкретно вашу компанию**, загрузите документы:
— Нажмите вкладку **»Knowledge»** (или аналогичную)
— Загрузите до 5 файлов: PDF, TXT, PPTX
— Можно добавить ссылки на страницы сайта
**Что загружать:**
— Правила возврата товара
— Инструкции по установке
— Часто задаваемые вопросы (FAQ)
— Прейскурант услуг
Как это работает: D-ID использует RAG (Retrieval-Augmented Generation) — когда пользователь задаёт вопрос, система ищет ответ в ваших документах, добавляет контекст к запросу ChatGPT и получает точный ответ на основе ваших данных .
Шаг 2.5: Публикуем агента
Нажмите «Publish» и дождитесь завершения . Готово! Ваш агент создан, но пока живёт только в D-ID. Теперь нужно перенести его на сайт.
4. Этап 3: Встраиваем агента на сайт (Embed)
D-ID предлагает три способа встраивания: от простого (копировать-вставить) до сложного (полный контроль через SDK).
Способ 1: Виджет в угол экрана (самый простой)
Это способ для всех, включая нетехнических пользователей. Агент появляется в виде плавающей иконки в углу сайта .
Что нужно сделать:
1. Перейдите в D-ID Studio
2. Наведите курсор на своего агента → нажмите на меню (⠸) → выберите «Embed»
3. Скопируйте готовый скрипт
4. Вставьте его в код вашего сайта перед закрывающим тегом `</body>`
Скрипт будет выглядеть примерно так:
«`html
<script
type=»module»
src=»https://agent.d-id.com/v2/index.js»
data-mode=»fabio»
data-client-key=»ВАШ_CLIENT_KEY»
data-agent-id=»ВАШ_AGENT_ID»
data-name=»did-agent»
></script>
«`
Где взять client_key и agent_id:
— `agent_id` — вы получили при создании агента
— `client_key` — создаётся отдельно через API. В дашборде D-ID есть раздел для генерации клиентских ключей с привязкой к домену
Как защитить свой агент от кражи:
При создании `client_key` укажите список разрешённых доменов — тогда ключ будет работать только на вашем сайте .
Способ 2: Встраивание в контейнер (для точного размещения)
Если вы хотите, чтобы агент был не в углу, а в определённом месте на странице (например, рядом с описанием товара):
«`html
<div id=»my-agent-container» style=»width: 400px; height: 600px;»></div>
<script
type=»module»
src=»https://agent.d-id.com/v2/index.js»
data-mode=»container»
data-container-id=»my-agent-container»
data-client-key=»ВАШ_CLIENT_KEY»
data-agent-id=»ВАШ_AGENT_ID»
></script>
«`
Способ 3: Полный контроль через SDK (для разработчиков)
Если вы хотите полностью кастомизировать интерфейс — убрать кнопки, изменить цвета, добавить свои элементы, — используйте D-ID Agents SDK. Он позволяет управлять агентом программно.
5. Этап 4: Тестирование и отладка
Прежде чем запускать агента в production, протестируйте его.
Что проверить:
| Что тестируем | Как тестировать | Ожидаемый результат |
|---|---|---|
| Загрузка виджета | Открыть страницу | Агент появляется через 2–5 секунд |
| Распознавание речи | Сказать «Привет» в микрофон | Агент слышит и начинает отвечать |
| Текстовый ввод | Написать «Расскажи о себе» | Ответ приходит через 1–3 секунды |
| Знание базы знаний | Спросить про документ из загрузки | Ответ ссылается на загруженные данные |
| Нестандартные вопросы | Спросить «Кто президент США?» | Вежливый отказ или перевод в тему |
| Ручная синхронизация | Посмотреть на движения губ | Совпадают с произносимыми звуками |
Типичная проблема: медленные ответы. Если агент «задумывается» дольше 2 секунд — пользователь уйдёт. Причины:
— Ваш LLM-сервер медленный (нужен TTFT < 500 мс)
— Слабое интернет-соединение
— Слишком сложные инструкции (упростите)
6. Кейсы использования: как настроить агента под разные бизнесы
6.1. Интернет-магазин: консультант по товарам
Роль: «Ты — Света, консультант в магазине кроссовок. Помогаешь подобрать размер.»
Инструкции:
— Спрашивай размер ноги, стиль бега, бюджет
— Если не знаешь модель — предложи оставить заявку
— Не обещай скидок
Знания: Прайс-лист, таблица размеров, условия возврата.
6.2. Турагентство: помощник по подбору туров
Роль: «Ты — Макс, эксперт по путешествиям в компании TravelGo.»
Инструкции:
— Узнай бюджет, даты, пожелания по стране
— Предложи 2–3 варианта из базы
— Если клиент готов — попроси оставить телефон
Знания: Актуальные туры, описание отелей, правила бронирования.
6.3. HR и онбординг: знакомство с компанией
Роль: «Ты — HR-ассистент Елена. Ты отвечаешь на вопросы новых сотрудников.»
Инструкции:
— Отвечай дружелюбно, как коллега
— Если вопрос сложный — перенаправь в отдел кадров
— Расскажи о корпоративной культуре
Знания: Политики компании, ДМС, схема подписания документов, карта офиса.
6.4. Образование: репетитор или языковой тренер
Роль: «Ты — французский учитель Пьер. Ты помогаешь практиковать разговорный язык.»
Инструкции:
— Исправляй ошибки вежливо
— Если пользователь сказал правильную фразу — похвали
— Задавай наводящие вопросы, чтобы развивать диалог
Знания: Учебные материалы, фразы по темам, словарь .
7. Сравнение готовых решений: что выбрать под свой бюджет
| Сценарий | Решение | Сложность | Цена |
|---|---|---|---|
| Простой тест идеи | Бесплатный тариф D-ID + базовый аватар | ★☆☆ (5 минут) | $0 |
| Малый бизнес на Tilda/Wix | Готовый виджет (копировать-вставить) | ★☆☆ (10 минут) | ~$30/мес |
| Средний бизнес с брендовым аватаром | Custom аватар + загрузка своих документов | ★★☆ (1 час) | ~$200/мес |
| Крупный бизнес с ChatGPT API | Custom LLM через свой прокси-сервер | ★★★ (1 день) | $300–1000/мес |
| Enterprise с защитой данных | Своя LLM + on-premises | ★★★★ (неделя) | индивидуально |
Мой совет: Начните с бесплатного тарифа в Studio. Создайте агента, протестируйте, поймите, как он работает. Затем, если вам нужно больше — подключайте свой ChatGPT через API .
8. Что пошло не так: чек-лист типичных ошибок
| Проблема | Причина | Решение |
|---|---|---|
| Агент не появляется на сайте | Неправильный client_key или agent_id | Проверьте ключи, убедитесь, что домен добавлен в `allowed_domains` |
| Агент говорит не на том языке | В настройках выбран другой язык | Укажите нужный язык в Agent Details |
| Ответы не по делу, галлюцинации | Слишком общие инструкции | Сделайте инструкции конкретными: «Если спрашивают про цену — расскажи про доставку» |
| Агент отвечает через 10 секунд | Медленный LLM-сервер или плохое соединение | Проверьте TTFT — должно быть меньше 1000 мс |
| Синхронизация губ сбивается | Проблемы на стороне D-ID | Пересоздайте агента с другим аватаром |
| Агент не помнит контекст диалога | Лимит `max_messages` | В настройках custom LLM увеличьте `max_messages` до 20–30 |
9. Что дальше: расширяем возможности агента
После того как базовый агент заработает, можно его прокачать:
1. Подключите аналитику. D-ID передаёт заголовки с идентификатором агента — логируйте все разговоры, анализируйте, на какие вопросы агент не смог ответить, и пополняйте базу знаний.
2. Добавьте мультимодальность. Вместе с D-ID можно использовать GPT-4o — он умеет распознавать изображения. Пользователь загружает фото товара, агент его описывает.
3. Сделайте омниканальность. Того же самого агента можно запустить не только на сайте, но и в Telegram, WhatsApp, на киоске в магазине и даже в VR .
Заключение: с чего начать прямо сегодня
Вы прошли полный путь — от регистрации до готового агента на сайте. Теперь дело за малым.
Пошаговый план ваших действий сегодня:
1. Зарегистрироваться в D-ID (5 минут, бесплатно)
2. Создать тестового агента в Studio (15 минут)
3. Протестировать его в предпросмотре (5 минут)
4. Сгенерировать embed-код и вставить на тестовую страницу (10 минут)
Через полчаса у вас будет живой ИИ-агент, который умеет говорить, понимать и отвечать на вопросы.
Помните главное: агент — это не магия, а инструмент. Он настолько умён, насколько грамотно вы его настроили. Уделите время инструкциям и загрузке знаний — и он станет лучшим сотрудником, который никогда не спит, не болеет и не просит перерыв на обед.
Может быть полезна статья: D-ID: Платформа для создания цифровых людей и живых аватаров