
В условиях роста глобального потребления контента и спроса на неанглоязычный контент, превышающего спрос на англоязычные фильмы и шоу, IMAX использует искусственный интеллект для масштабирования локализации оригинального контента.
Согласно отчету PwC, в 2023 году индустрия развлечений и медиа выросла на 5% до $2,8 трлн. Ожидается, что отрасль продолжит свое расширение, хотя и со скромными среднегодовыми темпами роста, составляющими почти 4% до 3,4 триллиона долларов в течение следующих пяти лет. Неанглоязычный контент быстро растет даже на англоязычных рынках, включая США, Великобританию, Австралию и Канаду. В прошлом году Netflix сообщил о 90-процентном росте количества зрителей неанглоязычного контента в Великобритании за последние три года.
IMAX учел все это и сейчас изучает возможность локализации с использованием ИИ, чтобы привлечь больше зрителей.
В понедельник канадская продюсерская компания, известная своими огромными кинотеатрами и захватывающими фильмами, объявила о своем партнерстве с дубайским стартапом Camb.ai для использования ее речевых моделей искусственного интеллекта для перевода оригинального контента, включая документальные фильмы.
Camb.ai, который уже внедрил дубляж с использованием искусственного интеллекта и перевод речи для спортивных мероприятий и лиг в прямом эфире, включая Открытый чемпионат Австралии, Евровидение и Высшую футбольную лигу, предлагает свою модель Boli для перевода речи в текст и Mars для эмуляции речи. Модели доступны через платформу стартапа DubStudio, которая поддерживает 140 языков, включая различные языки с низким уровнем ресурсов, о которых нет значительных данных в Интернете.
«У таких компаний, как OpenAI и Anthropic, другое видение общества», — сказал Акшат Пракаш, соучредитель и технический директор Camb.ai, в эксклюзивном интервью. «Они пытаются построить модели, которые были бы очень горизонтальными и могли бы охватывать широкий спектр задач… Нам вообще не обязательно это делать. Некоторые из наших моделей содержат менее 100 миллионов параметров и являются суперспециализированными».
Пракаш, бывший инженер Apple, который работал с командой, разрабатывающей модели искусственного интеллекта и машинного обучения для Siri, в прошлом году вместе со своим отцом Авнишем Пракашем основал Camb.ai.
«Мы находимся на расстоянии одного поколения и растем в Индии. С разницей в тридцать лет мы столкнулись с одними и теми же языковыми проблемами», — рассказал TechCrunch технический директор.
Он сказал, что Camb.ai предварительно обучил 70% своих моделей с использованием наборов данных, имеющих академическую лицензию и которые можно использовать в коммерческих целях. Остальные 30% включают в себя точную настройку данных, которые компания получает от первых партнеров, которые используют ее модели для дублирования и перевода на основе искусственного интеллекта.
«Чего мы не делаем, и мы были очень осторожны и полностью избегали этого, так это потенциального отказа от Интернета», — заявил Пракаш. «Некоторые компании считают, что им это сойдет с рук, потому что они создают приложение или инструмент, ориентированный на потребителя, и считают, что спарсить, например, 10 петабайт Интернета — это нормально».
Camb.ai использует «трехуровневый» подход для обеспечения перевода на основе ИИ, включающий базовый уровень моделей Boli и Mars, уровень инфраструктуры, на котором размещаются эти модели ИИ, а затем платформу DubStudio для внешнего интерфейса.
В отличие от других моделей на основе искусственного интеллекта, Boli от Camb.ai принимает входные речевые токены, создает выходные текстовые токены на переведенном языке и сохраняет нюансы, утверждает Пракаш. Как только Боли генерирует текст, Mars переводит его в речь, используя тот же входной аудиосигнал, чтобы зафиксировать качество реального звука, включая окружающие звуки, например, фоновую оценку аплодисментов аудитории во время спортивных мероприятий, сказал он.
Пракаш рассказал TechCrunch, что технология Camb.ai обеспечивает перевод речи на 10 языков одновременно с задержкой от 20 до 30 секунд, которую можно покрыть задержкой потоковой передачи и трансляции от 30 до 40 секунд.
IMAX будет поэтапно внедрять переводы с использованием искусственного интеллекта, начиная с языков с высокими ресурсами. Развертывание происходит после внутреннего тестирования технологии Camb.ai на исходном контенте.
«Хотя мы находимся только на начальной стадии партнерства, мы продолжим работать вместе, чтобы лучше изучить его потенциал и то, как оно может наилучшим образом продвинуть нас вперед», — сказал Марк Велтон, президент IMAX Global Theaters.
Велтон отметил, что внедрение ИИ поможет сэкономить на затратах на перевод, не раскрывая подробностей.
В настоящее время команда Camb.ai состоит из 50 человек. В феврале компания привлекла 4 миллиона долларов в рамках посевного раунда, проведенного Courtside Ventures. Пракаш рассказал TechCrunch, что стартап закрывает более крупный раунд перед Серией А, чтобы расширить свой охват и численность персонала.