SW26010
SW26010 — 260-ядерный процессор, спроектированный китайским Национальным центром по проектированию высокопроизводительных интегральных микросхем в Шанхае[1]. В процессоре реализована 64-битная RISC-микроархитектура ShenWei, разработанная в Китае. SW26010 состоит из 4 групп (называемых кластерами) по 64 «вычислительно-процессорных элемента» (compute-processing elements, CPE), расположенных в виде матрицы 8×8 элементов. CPE исполняют SIMD-инструкции и могут выполнять за один цикл 8 операций над числами одинарной точности. Каждый кластер сопровождается более традиционным ядром общего назначения, называемым «управляющим процессорным элементом» (management processing element, MPE), и обеспечивающим функции мониторинга и управления[1]. Каждый кластер имеет свой собственный контроллер памяти DDR3 SDRAM и банк памяти (англ. memory bank) со своим собственным адресным пространством[2][3]. Процессор работает с тактовой частотой 1,45 ГГц[4].
Каждый CPE обладает внутренней сверхоперативной памятью (англ. scratchpad memory) размером 64 Кб для данных и 16 Кб для инструкций, и соединены посредством сети-на-кристалле (англ. network on a chip), вместо традиционной иерархии кеш-памяти (англ. cache hierarchy)[5][6]. MPE имеет более традиционную схему с 32 Кб кеш-памяти 1-го уровня для данных и инструкций и 256 Кб кеш-памяти 2-го уровня[1]. Сеть-на-кристалле соединена с единым внутрисистемным интерфейсом, который соединяет микросхему с внешним миром.
SW26010 применяются в суперкомпьютере Sunway TaihuLight, который с ноября 2016 по июнь 2018 года занимал 1-е место по производительности в рейтинге TOP500[7][8]. В Sunway TaihuLight используется 40 960 процессоров SW26010, производительность в тесте LINPACK достигает 93,01 PFLOPS.
Примечания
[править | править код]- ↑ 1 2 3 Dongarra, Jack Report on the Sunway TaihuLight System . www.netlib.org (20 июня 2016). Дата обращения: 20 июня 2016. Архивировано 10 ноября 2018 года.
- ↑ Fu, H H; Liao, JF; Yang, J Z. The Sunway TaihuLight Supercomputer: System and Applications (англ.) // Chinese Academy of Sciences : journal. — 2016. — doi:10.1007/s11432-016-5588-7. Архивировано 25 января 2020 года.
- ↑ Trader, Tiffany China Debuts 93-Petaflops ‘Sunway’ with Homegrown Processors . HPC Wire (19 июня 2016). — «Each core of the CPE has a single floating point pipeline that can perform 8 flops per cycle per core (64-bit floating point arithmetic) and the MPE has a dual pipeline each of which can perform 8 flops per cycle per pipeline (64-bit floating point arithmetic)». Дата обращения: 21 июня 2016. Архивировано 21 июня 2016 года.
- ↑ Hemsoth, Nicole A Look Inside China's Chart-Topping New Supercomputer . The Next Platform (20 июня 2016). Дата обращения: 20 июня 2016. Архивировано 21 июня 2016 года.
- ↑ Lendino, Jamie Meet the new world’s fastest supercomputer: China’s TaihuLight . Extremetech (20 июня 2016). — «"The TOP500 report said that the chip also lacks any traditional L1-L2-L3 cache, and instead has 12KB of instruction cache and 64KB “local scratchpad” that works sort of like an L1 cache."». Дата обращения: 21 июня 2016. Архивировано 21 июня 2016 года.
- ↑ Архивированная копия . Дата обращения: 18 октября 2017. Архивировано 18 октября 2017 года.
- ↑ Top 500 The List: November 2016 . TOP 500 (14 ноября 2016). Дата обращения: 26 ноября 2016. Архивировано 3 декабря 2016 года.
- ↑ США вернули себе первенство в Top500 . iXBT.com. Дата обращения: 5 февраля 2020. Архивировано 5 февраля 2020 года.