Производители смартфонов всё активнее внедряют крупные языковые модели непосредственно в мобильные устройства, да и современные процессоры уже способны запускать такие ИИ-модели локально. Однако существующие стандарты оперативной памяти становятся узким местом. Проблема заключается в том, что память LPDDR имеет ограничения по скорости передачи данных к процессору. Именно поэтому в крупных центрах обработки данных для задач искусственного интеллекта широко используется память HBM, обеспечивающая значительно более высокую пропускную способность. Чтобы решить эту проблему, в отрасли разрабатывается новый тип памяти под названием LLW (Low Latency Wide DRAM).

Сообщается, что технология вдохновлена принципами работы HBM — высокая скорость HBM достигается благодаря размещению нескольких слоёв памяти рядом с процессором и их соединению через чрезвычайно широкую шину передачи данных. В результате пропускная способность оказывается в 10–15 раз выше по сравнению с лучшими современными решениями LPDDR. Однако использование HBM требует сложной упаковки компонентов и продвинутых систем охлаждения, что делает её непрактичной для смартфонов. Ожидается, что LLW сможет устранить основные трудности в этом направлении, позволив существенно повысить скорость передачи данных между процессором и памятью. Если это действительно сработает, в будущем смартфоны смогут запускать ИИ локально с очень высокой скоростью генерации токенов.