
27 апреля 2026
Обновление моделей
Seedance 2.0, Kling 3 и GPT Image 2 — новое поколение видео и изображений
Добавили три флагманских модели нового поколения: Seedance 2.0 с нативным аудио, Kling 3 с мульти-шотом и видео-референсами и GPT Image 2 с улучшенным фотореализмом и точным текстом. Разбираем, что нового и какие настройки появились внутри.
Seedance 2.0 — премиум-видео с нативным аудио
Новое поколение видеомодели от ByteDance. Поддерживает Text-to-Video и Image-to-Video, генерирует ролики до 15 секунд и сама подбирает оптимальный формат под содержимое.
Главная особенность — нативный звук. Модель создаёт голос, звуковые эффекты и фоновую музыку синхронно с видео, а не накладывает аудио постфактум.
Мультимодальные референсы
До 9 изображений, 3 видео и 3 аудио. Ссылайтесь в промпте через [Image1], [Video1], [Audio1].
Адаптивный формат
Авто-выбор соотношения сторон или ручной режим: 16:9, 9:16, 1:1, 4:3, 3:4, 21:9.
Длительность
Авто или вручную от 4 до 15 секунд.
Разрешение
480p — быстрее, 720p — лучше качество.
Image-to-Video
Можно задать первый и последний кадр для контроля перехода.
Нативное аудио
Чекбокс «Генерировать аудио» — синхронный звук без отдельных шагов.
Подходит для рекламных роликов, видео для соцсетей и любых сцен, где важна синхронизация звука и картинки.
Kling 3 — мульти-шот и видео-референс
Свежее поколение Kling от Kuaishou. Доступно для Text-to-Video и Image-to-Video, поддерживает разрешение до 4K и длительность до 15 секунд.
В Kling 3 появилась возможность собирать ролик из нескольких сцен в одном запросе и переносить стиль или движение из готового видео.
Режимы качества
Standard (720p), Pro (1080p) и 4K. Режим 4K несовместим с видео-референсом.
До 7 референсных изображений
Ссылайтесь в промпте как <<<image_1>>>, <<<image_2>>> и т. д.
Видео-референс
MP4/MOV до 200 МБ. Режим Feature — переносит стиль и камеру, Base — редактирует видео по промпту.
Сохранить оригинальный звук
Подхватывает аудио из видео-референса вместо генерации нового.
Длительность
Слайдер от 3 до 15 секунд.
Нативное аудио
Чекбокс «Генерировать аудио» — звук синхронно с видео. Несовместимо с видео-референсом.
Multi-shot (JSON)
До 6 шотов в одном ролике. Каждый шот — { "prompt": "...", "duration": N }, сумма равна общей длительности.
Negative Prompt
Поле для исключений — что не должно появляться в кадре.
Хороший выбор для нарративных видео, рекламных сценариев и продуктовых роликов, где нужна склейка нескольких кадров без ручного монтажа.
GPT Image 2 — фотореализм и точный текст
Обновлённая модель генерации изображений от OpenAI. Сильнее справляется с фотореализмом, точно выводит текст на картинке и подходит для инфографики и UI-мокапов.
Доступна в двух режимах: создание изображения с нуля и редактирование загруженных изображений по описанию.
Промпт
Описание сцены. Текст на изображении берите в кавычки, чтобы модель воспроизвела его точно.
Референсные изображения
До 10 изображений — для редактирования, переноса стиля, персонажей или композиции.
Соотношение сторон
1:1, 3:2 или 2:3.
Качество
Авто, Быстрое, Среднее, Высокое. Выше качество — медленнее генерация.
Количество вариантов
От 1 до 10 за один запрос.
Формат файла
WebP — компактный размер, PNG — максимальная совместимость, JPEG.
Фон
Авто или Непрозрачный. Прозрачный фон GPT Image 2 не поддерживает.
Модерация
Авто или Менее строгая.
В режиме редактирования загрузите одно или несколько изображений и опишите изменения текстом — модель аккуратно правит нужные детали и сохраняет композицию.
Как попробовать
Seedance 2.0 — на странице Video, в селекторе моделей в категории Image-to-Video и Text-to-Video Kling 3 — в той же странице Video, выбирайте «Kling v3 Omni» GPT Image 2 — на странице Image, в селекторе моделей создания и редактирования В Flow все три модели доступны в соответствующих видео- и image-блоках