
Ранее на этой неделе расследование показало, что Apple и другие технологические гиганты использовали субтитры YouTube для обучения своих моделей ИИ. Это включало более 170 000 видеороликов от таких исполнителей, как MKBHD, Mr. Beast и других. Затем Apple использовала этот набор данных для обучения своих моделей OpenELM с открытым исходным кодом, которые были выпущены еще в апреле.
Apple теперь подтвердила 9to5MacОднако OpenELM не поддерживает ни одну из функций искусственного интеллекта или машинного обучения, включая Apple Intelligence.
Apple заявляет, что создала модель OpenELM как способ внести вклад в исследовательское сообщество и способствовать разработке больших языковых моделей с открытым исходным кодом. В прошлом исследователи Apple описывали OpenELM как «современную модель открытого языка».
По словам Apple, OpenELM был создан только для исследовательских целей, а не для использования в качестве источника питания для функций Apple Intelligence. Модель была опубликована с открытым исходным кодом и широко доступна, в том числе на веб-сайте Apple’s Machine Learning Research.
Поскольку OpenELM не используется как часть Apple Intelligence, это означает, что набор данных «YouTube Subtitles» не используется для питания Apple Intelligence. В прошлом Apple заявляла, что модели Apple Intelligence обучались «на лицензированных данных, включая данные, выбранные для улучшения определенных функций, а также общедоступные данные, собранные нашим веб-сканером».
Наконец, Apple также сообщила мне, что у нее нет планов по созданию новых версий модели OpenELM.
Как Проводной Ранее на этой неделе сообщалось, что такие компании, как Apple, Anthropic и NVIDIA, использовали этот набор данных «YouTube Subtitles» для обучения своих моделей ИИ. Этот набор данных является частью более крупной коллекции под названием «The Pile» от некоммерческой организации EleutherAI.