
[ad_1]
Ключевые выводы
- Sora, вероятно, будет дорогостоящим и будет тщательно изучен перед выпуском на рынок.
- Microsoft и Google конкурируют в сфере преобразования текста в видео.
- Все компании спешат разрабатывать модели искусственного интеллекта для генерации видео.
Недавно OpenAI представила Sora как настоящую модель преобразования текста в видео, и вместе с этим возник ряд вопросов относительно социального воздействия, которое может иметь такой инструмент. Возможность с легкостью создавать аутентично выглядящие видео поднимает вопросы относительно целостности видео как формы доказательства, а также поднимает вопросы о том, где OpenAI вообще обучал свою модель.
Конечно, Sora, скорее всего, станет инструментом, защищенным OpenAI. Я подозреваю, что все созданное будет подвергаться тщательному изучению со стороны сотрудников компании, когда оно в конечном итоге выйдет на рынок, и я также подозреваю, что поначалу это будет довольно дорого. При этом он может быть первым в своем роде, но почти наверняка не последним.
Мы можем извлечь уроки из истории
GoogleMicrosoft и другие уже пытаются сделать то же самое
Как и в случае с первым запуском ChatGPT, Microsoft и Google оба изо всех сил пытались приступить к работе над чем-то похожим. Microsoft использовала технологию GPT OpenAI для создания так называемого Bing Chat, тогда как Google быстро запустил Барда — можно сказать, слишком быстро. Остальная часть отрасли также потерпела крах: сотни моделей искусственного интеллекта, созданные как компаниями, так и стартапами, вышли на рынок и были опубликованы на таких платформах, как Hugging Face.
В случае с Сорой это почти наверняка имеет тот же эффект. Может быть, не на том же уровне, что и наличие Google впервые за всю историю поставил под сомнение собственную смертность в поисках, но настолько, что компании боятся отставания и не хотят этого допустить. Сора имеет далеко идущие последствия для будущего видео. Google, Microsoft и другие тоже захотят получить кусок пирога. Невозможно предсказать будущее, полностью основываясь на прошлом, но мы можем сделать некоторые довольно хорошие предположения.
При этом я подозреваю, что в ближайшем будущем Sora будет окружена открытыми бесплатными моделями, которые сможет использовать каждый, и это повлечет за собой опасность злоупотреблений. Stable Video Diffusion уже работает, но он медленный, короткий и требует исходного изображения для анимации. Это не модель преобразования текста в видео, как у Соры, но она может стать такой в будущем. Основа почти готова, и даже шестисекундные видеоролики могут быть убедительными.
Что будет дальше?
Другие приходят
Источник: ОпенАИ
Несмотря ни на что, приходят другие. Стартапы будут стараться быть первыми, Microsoft уже заявила, что у нее будет своя версия Sora, и я очень в этом сомневаюсь. Google хочет остаться в стороне. По мере распространения технологий будет трудно избежать распространения фейковых видео. Что это означает для будущего обмена информацией, политики и других отраслей, не совсем ясно, но я не подозреваю, что оно будет хорошим.
Когда такие компании, как Mistral, запускают свою модель искусственного интеллекта Mixtral под лозунгом раскрепощенного искусственного интеллекта без каких-либо ограничений, это сигнализирует о нескольких вещах. Хотя технически он может способствовать инновациям, он открыт для злоупотреблений. Текст есть текст, и это не так уж и вредно, но подобное отношение к созданию видео может создать огромные проблемы в будущем для всех, даже для самых ярых сторонников такой открытой технологии.
[ad_2]