Реализация AI-редактирования видео в мобильном приложении

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Предлагаемые услуги

Показано 1 из 1 услугВсе 1735 услуг

Реализация AI-редактирования видео в мобильном приложении

Сложная

~1-2 недели

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
756
Разработка мобильного приложения для компании XOOMER
624
Разработка мобильного приложения для компании RHL
1054
Разработка мобильного приложения для компании ZIPPY
947
Разработка мобильного приложения для компании Affhome
874
Разработка мобильного приложения для компании FLAVORS
445

Показать больше работ

Реализация AI-редактирования видео в мобильном приложении

AI-редактирование видео — широкий термин, который на практике распадается на несколько отдельных функций: автоматическое удаление пауз и слов-паразитов, замена фона, цветокоррекция по референсу, умная обрезка под формат, автонарезка хайлайтов. Каждая функция требует своего технического решения.

Автовырезка пауз и слов-паразитов

Это, пожалуй, самая востребованная функция для контент-мейкеров. Пользователь записывает разговорное видео, AI удаляет все паузы длиннее 0.5 сек и слова «эм», «ну», «как бы».

Пайплайн:

Транскрибируем аудио через Whisper API (OpenAI) или Deepgram
Получаем JSON с timestamps каждого слова
Находим паузы и слова из стоп-листа
Генерируем FFmpeg cut-list и собираем итоговое видео

# Backend: генерация FFmpeg фильтра из транскрипции Whisper
def build_cut_filter(transcript_words, pause_threshold=0.5, filler_words=None):
    filler_words = filler_words or {"эм", "ну", "вот", "как бы", "типа"}
    segments_to_keep = []
    prev_end = 0.0

    for i, word in enumerate(transcript_words):
        gap = word["start"] - prev_end
        if gap > pause_threshold:
            # Пауза — пропускаем
            pass
        if word["word"].lower().strip(".,!?") in filler_words:
            continue
        segments_to_keep.append((word["start"], word["end"]))
        prev_end = word["end"]

    # Конвертируем в FFmpeg select/aselect фильтр
    filter_parts = "+".join(
        f"between(t,{s},{e})" for s, e in merge_segments(segments_to_keep, gap=0.05)
    )
    return f"select='{filter_parts}',setpts=N/FRAME_RATE/TB"

Whisper word_timestamps=True даёт точность ±20 ms — достаточно для плавных cuts. На мобиле: загружаем видео, запускаем backend-задачу, получаем обработанный файл. Всё обработанное видео воспроизводим через AVPlayer/ExoPlayer.

Замена фона в видео

Сложнее, чем кажется. Для статичной камеры — portrait segmentation через MediaPipe Selfie Segmentation (30 fps real-time на современных устройствах). Для движущейся камеры с объектами — SAM 2 (Segment Anything Model 2) через API.

MediaPipe на Android:

val options = ImageSegmenterOptions.builder()
    .setBaseOptions(BaseOptions.builder().useGpu().build())
    .setOutputCategoryMask(false)
    .setOutputConfidenceMasks(true)
    .build()
val segmenter = ImageSegmenter.createFromOptions(context, options)

Результат — маска уверенности 0..1. Применяем к каждому кадру через Metal/Vulkan, заменяем фон на статичное изображение или видео-фон. При 1080p 30fps — требуется GPU рендеринг, CPU не справится.

Серверная обработка (SAM 2): лучшее качество для сложных сцен, но 2–5 минут на минуту видео даже на A100.

Умная обрезка под формат (Auto Reframe)

Конвертация 16:9 в 9:16 с умным кропом — задача object tracking. Adobe Premiere Pro называет это Auto Reframe. На мобиле реализуем через:

Face detection по каждому keyframe (каждые 0.5 сек) — VNDetectFaceRectanglesRequest
Построение trajectory движения субъекта
Плавное панорамирование кадра с EasingCurve (не резкие jump cuts)
FFmpeg crop фильтр с динамическими параметрами

# FFmpeg: кроп с движением (x меняется от 0 до 540 за 10 сек)
ffmpeg -i input.mp4 \
  -vf "crop=608:1080:'min(max(cx-304,0),672)':0" \
  -c:v libx264 output_9x16.mp4

Где cx — x-координата субъекта из tracking data. Реализация: Python-скрипт на backend генерирует FFmpeg команду с нужными параметрами, выполняет её, возвращает результат.

AI цветокоррекция

По референс-фото — CinematicLUT через Core Image на iOS (100 ms на кадр). По текстовому описанию («сделай как утренний золотой час») — вызов к backend с LUT-генерацией через Stable Diffusion + ControlNet Color Pipeline.

Применение LUT ко всему видео через FFmpeg: -vf lut3d=lut_file.cube. Создание .cube файла из референс-изображения — специализированный алгоритм на Python/OpenCV.

Мобильный редактор: архитектурные решения

Timeline editor на мобиле — нетривиальная UI-задача. Минимальный стек:

iOS: AVMutableComposition для timeline, AVVideoComposition для эффектов, AVAssetExportSession для экспорта
Android: MediaCodec + MediaMuxer для низкоуровневой обработки, или Transformer из Media3 (ExoPlayer) — проще для типичных задач

Media3 Transformer позволяет применять эффекты (обрезка, скорость, цвет) в одном проходе с GPU-ускорением через OpenGL ES. На практике удобнее, чем самостоятельная работа с MediaCodec.

Сроки

Одна функция (авторезка пауз или замена фона) — 1–2 недели. Полноценный AI-редактор с несколькими функциями, timeline и экспортом — 6–10 недель. Стоимость рассчитывается индивидуально.