На этой неделе на VidCon YouTube объявил, что интегрирует новый инструмент на базе искусственного интеллекта, который будет автоматически дублировать видео на других языках, тем самым помогая создателям и зрителям преодолеть языковой барьер. Эта функция разрабатывалась в течение многих лет как часть Googleинкубатора Area 120 для экспериментальных проектов, о котором было объявлено в прошлом году в рамках активизации усилий компании по внедрению функций, основанных на искусственном интеллекте, во всех своих продуктах и услугах.
Новый инструмент под названием «Вслух» позволяет создателям «быстро и легко дублировать свои видео на несколько языков, открывая знания, которые сегодня могут быть заперты в одном языке». Google ожидает, что эта функция сделает дублирование более доступным для создателей, которые считают слишком сложным или слишком дорогим дублирование своих видео на несколько языков. Для тех, кто интересуется, как все это работает, на официальном сайте Aloud говорится, что инструмент сначала транскрибирует видео, а затем позволяет создателю просматривать и редактировать транскрипцию. Затем он переводит и дублирует видео на целевой язык перед публикацией создателем.
В заявлении к Грань, Амджад Ханиф из YouTube сказал, что эта функция в настоящее время тестируется с сотнями авторов по всему миру. Он добавил, что в настоящее время он поддерживает только несколько языков, и ожидается, что в будущем будет добавлено больше. Ранее компания объявила, что при запуске Aloud будет доступен только на английском, испанском и португальском языках, а хинди, индонезийский и другие языки, как ожидается, будут добавлены в список в ближайшем будущем.
Вслух — это очень крутое использование ИИ, которое должно помочь создателям охватить более широкую аудиторию. По словам Ханифа, компания работает не только над тем, чтобы переведенные звуковые дорожки звучали как голос создателя, но и над тем, чтобы сделать дублированный контент более выразительным. Кроме того, планируется ввести синхронизацию губ, чтобы видео выглядело более естественно. Однако эти функции появятся только в следующем году, поэтому на данный момент видео будет рассинхронизировано со звуком, а дублированный голос будет звучать относительно механически.