[ad_1]
Мнение Мы балансируем на пороге золотого века искусственного интеллекта. Это должно быть правдой, нам постоянно говорят. Проповедником на этой неделе является компания Samsung, которая заявляет, что интегрировала процессоры с памятью для достижения звездных показателей ИИ: «Примерно вдвое выше производительность в рекомендательных приложениях на основе ИИ и на 40% снизилось энергопотребление в масштабах всей системы».
Нет причин сомневаться в этом. Одним из недостатков памяти с высокой пропускной способностью (HBM) является то, что для передачи большого количества данных через очень быструю внешнюю шину требуется много энергии, а преимущество архитектуры процессора в памяти (PIM) заключается в том, что данные могут переходите от ОЗУ к ЦП и обратно без особого толчка. Если бы Лос-Анджелес был лондонским районом рядом с Ислингтоном, вся эта угрюмая молодежь, предлагающая свои сценарии, могла бы перестать беспокоиться о своих углеродных следах.
Но почему Samsung указывает ИИ? Физика HBM-PIM не заботится о том, выполняете ли вы массовый параллельный анализ изображений с использованием машинного обучения, рендеринга фильма о супергероях или просто просматриваете миллионы записей клиентов в поисках кого-то, кому можно продать обновление тарифного плана для телефона.
AI / ML здесь – примерный пример, потому что он уникально хорош для извлечения выгоды из обработки на месте, то есть обработки на месте не будет так хорошо для других вещей.
С 1960-х годов для высокопроизводительных вычислений было трюизмом, что реальным ограничивающим фактором является пропускная способность, а не вычислительная мощность. Компьютеры бесполезны без данных, и хотя вы можете использовать всевозможные трюки, чтобы сделать ЦП маленьким и быстрым, вы по определению раздвигаете границы того, что вы можете сделать в небольшом масштабе. И ваши данные живут в большем масштабе и будут поступать медленнее.
PIM AI может скрыть это, потому что он выполняет полезную работу с большими наборами данных, которые, тем не менее, могут уместиться в сегодняшней большой памяти, но это чистокровное приложение, которое требует ухода и настройки. Не может быть и скаковой лошади, и телеги.
Играть в игры
Мы знаем, как это ограничивает ситуацию, потому что это уже произошло. Давайте посмотрим на графические процессоры, которые наглядно иллюстрируют напряженность между рынками и технологиями. Игры движут рынком графических процессоров, на который приходится основная часть их архитектурных особенностей – массивно-параллельные геометрические вычисления, жестко привязанные к очень быстрой памяти, и растущий набор уловок машинного обучения, позволяющих угадывать, как что-то будет выглядеть, без выполнения всех математических расчетов.
Есть и другие области вычислительных задач, которые достаточно хорошо вписываются в эту модель, определенно лучше, чем в универсальной модели ЦП фон Неймана. Таким образом, графические процессоры находят применение в центрах обработки данных для решения конкретных задач машинного обучения, в научных суперкомпьютерах и, увы, в криптомолинах валютных шахт.
У этих областей есть общая черта, заключающаяся в том, что они имеют смысл даже при высоком уровне знаний, необходимом для того, чтобы они работали хорошо, и только при наличии такого опыта. Для вертикалей графических процессоров нет магазина приложений или Steam; вы рассчитываете заплатить за разработку, чтобы каждая задача работала. Ваш дорогой комнатный обогреватель Nvidia в целом не делает ваш компьютер быстрее, даже несмотря на то, что у него больше терафлопс, чем мир знал в 1985 году.
Это глубоко расстраивает. Из всех ресурсов вычислительной техники, которым не хватает ресурсов, чрезвычайная человеческая смекалка стоит на одном уровне с успешными чипами Intel, отличными от x86. Некоторые очень многообещающие секторы, такие как суперкомпьютеры FPGA, действительно столкнулись с трудностями из-за этого. На бумаге вы можете создать превосходный компьютер, на котором вы можете полностью перенастроить оборудование для реализации ваших алгоритмов на собственном кристалле; просто не хватает людей, которые знают, как этого добиться. Массовому рынку нужны инструменты, которые умные люди могут использовать, чтобы делать продукты лучше, чем обычно.
Даже там, где графические процессоры просто делают графику, этого на самом деле не произошло. От архитектуры к архитектуре, даже от модели к модели, различия в аппаратном обеспечении затрудняют поддержку стека, которая является высокопроизводительной, надежной, эффективной и переносимой.
Однажды проделанная работа часто требует повторения. Идея заключалась в том, что развитие низкоуровневых API-интерфейсов снизит потребность в драйверах для выполнения всей тяжелой работы, а разработчики смогут вводить новшества, не будучи обязанными производителям графических процессоров правильно создавать свое чертово программное обеспечение. Этого не произошло. По-прежнему проще создавать оборудование с большим потенциалом, чем писать компиляторы, которые его выпускают.
Это то, что может помешать таким усилиям, как AI-in-RAM. Многие из них будут хорошо работать на богатых нишевых рынках, но мы не сможем использовать ИИ без надлежащих универсальных инструментов. Эти инструменты не появятся без надлежащих стандартов, которые предоставят им широкий набор целевых платформ и возможность долгосрочной окупаемости инвестиций в оборудование нескольких поколений. Никто не говорит об этих стандартах. Каждый поставщик продает собственное оборудование искусственного интеллекта в виде графических процессоров, микросхем памяти, средств обработки видео на мобильных телефонах, в той или иной нише ускорения.
Нам нужен этот универсальный рынок ИИ, потому что его будущее будет фантастическим. Кто не хочет иметь графическую программу, которая будет реагировать на команду «нарисуйте мне изображение Алана Тьюринга, получающего CBE от королевы, который для этого случая вооружен мечом, усеянным кристаллом Xeon», и пусть это сработает. независимо от того, где живет аппаратное обеспечение ИИ?
Наше актуальное кроссплатформенное графическое программное обеспечение в наши дни? Мутантное потомство MS Paint. Это далеко от Золотого века искусственного интеллекта. Пока производители оборудования не приложат больше усилий для разработки программного обеспечения, общения друг с другом и создания архитектур с учетом общих, а не лучших случаев, мы не доберемся до этого в ближайшее время. ®
[ad_2]