Sora — первая настоящая модель преобразования текста в видео, но не последняя.

    0
    1


    Ключевые выводы

    • Sora, вероятно, будет дорогостоящим и будет тщательно изучен перед выпуском на рынок.
    • Microsoft и Google конкурируют в сфере преобразования текста в видео.
    • Все компании спешат разрабатывать модели искусственного интеллекта для генерации видео.


    Недавно OpenAI представила Sora как настоящую модель преобразования текста в видео, и вместе с этим возник ряд вопросов относительно социального воздействия, которое может иметь такой инструмент. Возможность с легкостью создавать аутентично выглядящие видео поднимает вопросы относительно целостности видео как формы доказательства, а также поднимает вопросы о том, где OpenAI вообще обучал свою модель.

    Конечно, Sora, скорее всего, станет инструментом, защищенным OpenAI. Я подозреваю, что все созданное будет подвергаться тщательному изучению со стороны сотрудников компании, когда оно в конечном итоге выйдет на рынок, и я также подозреваю, что поначалу это будет довольно дорого. При этом он может быть первым в своем роде, но почти наверняка не последним.


    Мы можем извлечь уроки из истории

    GoogleMicrosoft и другие уже пытаются сделать то же самое

    Логотипы ChatGPT, Copilot и Gemini на плетёном фоне


    Как и в случае с первым запуском ChatGPT, Microsoft и Google оба изо всех сил пытались приступить к работе над чем-то похожим. Microsoft использовала технологию GPT OpenAI для создания так называемого Bing Chat, тогда как Google быстро запустил Барда — можно сказать, слишком быстро. Остальная часть отрасли также потерпела крах: сотни моделей искусственного интеллекта, созданные как компаниями, так и стартапами, вышли на рынок и были опубликованы на таких платформах, как Hugging Face.

    В случае с Сорой это почти наверняка имеет тот же эффект. Может быть, не на том же уровне, что и наличие Google впервые за всю историю поставил под сомнение собственную смертность в поисках, но настолько, что компании боятся отставания и не хотят этого допустить. Сора имеет далеко идущие последствия для будущего видео. Google, Microsoft и другие тоже захотят получить кусок пирога. Невозможно предсказать будущее, полностью основываясь на прошлом, но мы можем сделать некоторые довольно хорошие предположения.


    При этом я подозреваю, что в ближайшем будущем Sora будет окружена открытыми бесплатными моделями, которые сможет использовать каждый, и это повлечет за собой опасность злоупотреблений. Stable Video Diffusion уже работает, но он медленный, короткий и требует исходного изображения для анимации. Это не модель преобразования текста в видео, как у Соры, но она может стать такой в ​​будущем. Основа почти готова, и даже шестисекундные видеоролики могут быть убедительными.

    Что будет дальше?

    Другие приходят

    Проводник из видеороликов Sora OpenAI, сгенерированный ИИ

    Источник: ОпенАИ

    Несмотря ни на что, приходят другие. Стартапы будут стараться быть первыми, Microsoft уже заявила, что у нее будет своя версия Sora, и я очень в этом сомневаюсь. Google хочет остаться в стороне. По мере распространения технологий будет трудно избежать распространения фейковых видео. Что это означает для будущего обмена информацией, политики и других отраслей, не совсем ясно, но я не подозреваю, что оно будет хорошим.


    Когда такие компании, как Mistral, запускают свою модель искусственного интеллекта Mixtral под лозунгом раскрепощенного искусственного интеллекта без каких-либо ограничений, это сигнализирует о нескольких вещах. Хотя технически он может способствовать инновациям, он открыт для злоупотреблений. Текст есть текст, и это не так уж и вредно, но подобное отношение к созданию видео может создать огромные проблемы в будущем для всех, даже для самых ярых сторонников такой открытой технологии.

    Предыдущая статьяHuawei Матепад 11 Pro Пользователи 2022 теперь могут устанавливать значки Edraw из
    Следующая статьяHonor запустить MagicBook Pro 16 ноутбуков с искусственным интеллектом в следующем месяце в Китае
    Петр Григорин
    Интересуется софтом, разработкой и использование новых приложений, технология искусственного интеллекта. Этот писатель - человек с техническими знаниями, который увлечен разработкой программного обеспечения и использованием новых приложений. Его особенно интересуют технологии искусственного интеллекта и то, как они могут быть использованы для улучшения различных отраслей промышленности и повседневной жизни. Обладая прочной основой в области информатики и острым взглядом на инновации, этот писатель обязательно привнесет ценные идеи и соображения в любую дискуссию на эти темы. Пишет ли он о последних открытиях в области ИИ или исследует потенциал новых программных инструментов, его работа обязательно будет увлекательной и заставляющей задуматься.