Цитата(AndreiSokirko @ 27.01.2021, 06:39)



Чип Cerebrass на 400 ядер.
Цитата(Cossack-HD @ 27.01.2021, 03:13)

Вся суть в шинах для передачи данных
Есть внутренняя шина и внешняя. Данные не адрессуются сразу в память, обойдя кеш.
У компов Sun раздельный кеш, на инструкции и такты.
Шина не может обойти общую компиляцию, это всё равно что калькулятор без инженерных функций.
О, это наверное те процессоры, которые никогда не распиливают, т.е. берут целиком пластину с кучей чипов, отключают отбракованные чипы и подключают все рабочие чипы друг к другу с помощью пластины-шины. Т.е. им не нужно тратить время и деньги на распил пластин и на спайку вместе, тупо 1:1 всё ложится, выровнял две пластины по краям и всё

Я и не говорил, что шина обходит внутреннюю логику чипов

Просто чипам между собой нужно как-то общаться, причём с низкой задержкой, вот тут и нужны новые технологии с шинами + I/O логика для этого.
Раньше то как было - ALU, FPU, кеш L2 и контроллер ОЗУ были раздельными устроиствами на плате. Потом стали всё интегрировать в единый кристал и оптимизировать задержки (20+ лет).
Теперь начали выносить обратно в раздельные компоненты, т.к. стали упираться в лимит по транзисторам на кристалле. А сделать многочиповую архитектуру и при этом не проиграть одночиповой по задержкам очень сложно.
Я думаю, этот дизайн GPU у Intel пока не очень пригоден для игр, а фокусируется в первую очередь на обработке данных - можно распараллелить обработку без сильной взаимной зависимости т.к. не совсем реалтайм. Шина и синхронизация помогают эффективнее работать с бОльшим обьёмом данных, тут и HBM помогает.
В играх нужно всё правильно параллеллить и вовремя синхронизировать. MCM дизайн с мощной шиной уже частично решает проблемы, которые есть у SLI/CrossFire (данные ходят быстрее), но всё равно нужен хитрожопый командный процессор, который может эффективно распределить задачи. И ещё нужен уровень абстракции, чтобы игорь воспринимал MCM GPU как одно устроиство.
И ещё MCM дизайн позволяет запихать больше кеша и прочего. Т.е. с одной стороны MCM фактически повышает задержки, а с другой стороны, можно напихать больше кеша, чтобы эти задержки компенсировать. А многослойное пакетирование с широкой шиной позволяет многократно увеличить доступность к данным, по сравнению с традиционными решениями с ОЗУ. Прям на вычислительный блок сверху лепишь несколько стеков HBM, красота же.
Теперь жду систем жидкостного охлаждения, которые будут пронизывать многочиповые процессоры, т.к. охлаждать такие слойки будет сложнее