Недавно удалось получить удалённый доступ к компьютеру Дмитрия Бачило Sun Blade 1500 на процессоре Ultra Sparc IIIi, который выставляется в его недавно открытом музее, а также попросил пользователя Limows протестировать машину Netra T1 с процессором Ultra Sparc IIe 500 МГц. Плюс удалённо удалось получить результаты тестов процессоров серии МЦСТ‑R на архитектуре SPARC, поэтому я решил сравнить производительность процессоров от компании SUN (которую купил Oracle) и МЦСТ.
Характеристики сравниваемых процессоров:
|
Ultra Sparc IIe |
Ultra Sparc IIIi |
MCST R1000 |
MCST R2000 |
Архитектура |
sparc |
sparc |
sparc |
sparc |
ISA |
Sparc-v9 |
Sparc-v9 |
Sparc-v9 |
Sparc-v9 |
Микроархитектура |
HummingBird |
Jalapeno |
In-Order |
Out-Of-Order |
Частота (МГц) |
500 |
1500 |
1000 |
2000 |
Ядра; Потоки |
1 |
1 |
4 |
8 |
Техпроцесс (нм) |
180 |
130 |
90 |
28 |
TDP (Вт) |
13 |
|
20 |
36 |
Тип ОЗУ |
SDR PC-100 |
DDR-266 |
DDR2-800 |
DDR4-2400 |
Сокет |
PGA 370 |
PGA 959 |
HFC BGA 1156 |
HFC BGA 1444 |
Каналов ОЗУ |
1 |
2 |
1 |
2 |
Макс ОЗУ (ГБ) |
2 |
16 |
8 |
128 |
Кеш |
16 Кб L1I, 16 Кб L1D, 256 Кб L2 |
32 Кб L1I, 64 Кб L1D, 1 Мб L2 |
16 Кб L1I, 32 Кб L1D, 2 Мб L2 (512 x 4) |
16 Кб L1I, 32 Кб L1D, 4 Мб L2 (512 x 8) |
ГФлопс (DP) |
0,5 |
1,5 |
8 |
32 |
ГФлопс (SP) |
1 |
3 |
16 |
64 |
Транзисторов (млн.) |
23
|
87,5 |
180 |
500 |
Год |
2000 |
2003 |
2011 |
2019 |
Были проведены следующие тесты:
7zip встроенный бенчмарк
Dhrystone, Whetsone
Linpack 100
Coremark
Scimark 2
Stream, Memspeed
Результаты
1T - однопоточные тесты
MT - многопоточные тесты
|
Единица измерения |
Ultra Sparc IIe
|
Ultra Sparc IIIi
|
MCST R1000 |
MCST R2000
|
OS |
|
Linux 5.10 |
Sun OS 5.10 |
Linux 4.9 |
Linux 4.9 |
Compiler |
|
Gcc 10 |
Gcc 4.9 |
Lcc 1.23 |
Lcc 1.23 |
Dhrystone (1T) |
DMIPS |
731 |
2455 |
1487 |
3491 |
Whetstone (1T) |
MWIPS |
457 |
1280 |
925 |
2289 |
Whetstone MP (MT) |
MWIPS |
457 |
1280 |
3515 |
17030 |
Linpack 100 (1T) |
МФлопс |
84 |
278 |
132 |
921 |
CoreMark (1T) |
|
1299 |
3944 |
1861 |
4592 |
CoreMark MP (MT) |
|
1299 |
3944 |
7157 |
35333 |
SciMark 2 (1T) |
Composite |
65 |
236 |
130 |
517 |
MFLOPS (MT) |
МФлопс |
|
906 |
6883 |
27500 |
7z (1T) |
Total; Compress; Decompress |
309; 268; 4193; |
1111; 956; 13685 |
714; 585; 10219 |
1246; 990; 19146 |
7z (MT) |
Total; Compress; Decompress |
309; 268; 4193; |
1111; 956; 13685 |
2514; 1884; 36020 |
8728; 7096; 135561 |
STREAM (MT) |
МБ/с Copy; Scale; Add; Triad |
|
703: 645; 648; 617 |
|
|
Ниже результаты в виде графиков:
Подробные результаты смотрите здесь: anybench/results at master · EntityFX/anybench (github.com)
Немного об архитектурах процессоров UltraSparc II, III, МЦСТ-R
UltraSparc IIe
Особенности процессора Ultrasparc IIe (Jalapeno):
64 битная архитектура sparc-v9
FP/SIMD расширения VIS1, VIS2
Конвейер до 9 стадий
-
6 исполнительных порта:
2 целочисленных АЛУ (сложение, сдвиг)
1 АЛУ для умножения, деления
1 Загрузки/Сохранения
1 FPU/SIMD VIS
-
Кеши:
16 КБ L1 кэш команд (2 канальный, ассоциативный, размер линии 32 байта)
16 КБ L1 кэш данных (прямая, размер линии 64 байта)
2 КБ буфер подкачки, 2 КБ буфер записи
256 КБ кэш L2 (4 канальный, ассоциативный)
Устройство конвейера Ultrasparc IIe:
UltraSparc IIIi
Особенности процессора Ultrasparc IIIi (Jalapeno):
64 битная архитектура sparc-v9
FP/SIMD расширения VIS1, VIS2
Конвейер до 9 стадий
-
6 исполнительных порта:
2 целочисленных АЛУ (сложение, сдвиг)
1 АЛУ для умножения, деления
1 Загрузки/Сохранения
1 блок ветвлений
-
1 FPU/SIMD VIS
Блок сложения. вычитания
Блок умножения
Блок деления
Блок SIMD VIS
-
Кеши:
32 КБ L1 кэш команд (4 канальный, ассоциативный, размер линии 32 байта)
64 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 64 байта)
2 КБ буфер подкачки, 2 КБ буфер записи
1 МБ кэш L2
Устройство конвейера Ultrasparc IIIi:
MCST-R1000
Особенности процессора МЦСТ-R1000:
64 битная архитектура sparc-v9
FP/SIMD расширения VIS1, VIS2
Конвейер до 9 стадий (7 целые, 9 вещественные)
Внеочередное исполнение
-
4 исполнительных устройства:
-
2 целочисленных АЛУ
сложение, сдвиг, логика
сложение, сдвиг, логика, умножение, деление
1 FPU/SIMD VIS
1 Загрузки/Сохранения
-
-
Кеши:
16 КБ L1 кэш команд (2 канальный, ассоциативный, размер линии 32 байта)
32 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 64 байта)
2 МБ кэш L2
Устройство ядра МЦСТ-R1000:
Устройство кристалла МЦСТ-R1000:
MCST-R2000
Особенности процессора МЦСТ-R2000:
64 битная архитектура sparc-v9
FP/SIMD расширения VIS1, VIS2
Конвейер до 9 стадий (7 целые, 9 вещественные)
Внеочередное исполнение
-
4 исполнительных устройства:
-
2 целочисленных АЛУ
сложение, сдвиг, логика
сложение, сдвиг, логика, умножение, деление
1 FPU/SIMD VIS
1 Загрузки/Сохранения
-
-
Кеши:
32 КБ L1 кэш команд (4 канальный, ассоциативный, размер линии 32 байта)
64 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 64 байта)
2 КБ буфер подкачки, 2 КБ буфер записи
1 МБ кэш L2
Ссылки
UltraSparc-II.pdf (chipdb.org)
UltraSPARC IIe User's Manual (p0d.org)
Sun Microsystems UltraSparc IIe SME1701PGA-500 / SME 1701 PGA 500 MHz (cpu-world.com)
UltraSPARC IIIi Processor User's Manual (yp.to)
Sun Microsystems SME1603uPGA-1503 / SME 1603 uPGA 1503 MHz (cpu-world.com)
R1000 (ТВГИ.431281.009) — центральный процессор 1891ВМ6Я (mcst.ru)
R2000 (ТВГИ.431281.024) — центральный процессор 1891ВМ018 (mcst.ru)
P. S.: хочется протестировать более современные SPARCи, например от Fujitsu или Oracle. Если такие имеются и можете предоставить доступ — пишите.
Комментарии (34)
EntityFX Автор
00.00.0000 00:00+4Разыскиваются свежие или не очень SPARCи с удаленным доступом ssh.
hw_store
00.00.0000 00:00+2У меня есть Station 1+, но я не уверен, что там стоит хоть какая-нибудь ось, и понятия не имею, как подключить это к сети )))
...если у неё вообще запустится блок питания после двадцати лет простоя. Хотя... у ДВК ж запустился :-o
shigorin
00.00.0000 00:00+1Куда-то делся M5000, но оно довольно громкое (и поспрошать лучше бы практику).
checkpoint
00.00.0000 00:00+2Спасибо за тесты.
Посмотрел на результаты теста Dhrystone и вспомнил извесное изречение: "А в попугаях я значетельно длиннее".
byman
00.00.0000 00:00+2Подскажите, почему у Ultra Sparc IIIi одна double операция на такт. Он делает умножение с накоплением за 2 такта? Или double fma здесь идет за одну операцию и Rx000 их делает 2 за такт?
EntityFX Автор
00.00.0000 00:00+2Здесь очень подробно написано про работу конвейеров, различных инструкций и задержки: UltraSPARC IIIi Processor User's Manual (yp.to)
По поводу МЦСТ-R2000 могу уточнить, а так как очень много только по R1000. Про 2000й известно, что он стал OoO, а умеет ли FMA делать непонятно.
byman
00.00.0000 00:00+2Спасибо. Похоже я запутался в версиях. У вас в таблице такой SPARC у которого FMA еще нет. У Rx000, судя по таблице, есть. Хотя у всех написана одна версия ISA.
vkni
Занятно, но надо понимать, что на UltraSPARC IIIi работать не в консоли решительно невозможно. То есть, по ощущениям он находится на уровне Pentium M (ноутбучный). Уже Core2 (ноутбучный) быстрее его в разы.
EntityFX Автор
А какая система стоит?
vkni
OpenIndiana последняя.
INSTE
Ну так для процессора 2003 года это вполне неплохой результат, на willamette сейчас работать тоже в gui сложно.
bodyawm
почему? На xp celeron willamette летает, p4 northwood тоже ничего так.
INSTE
ОС уровня XP и на ultrasparc 3 будет летать, скажем RH 6.2 или RHEL 2.
vkni
Через буквально три года Интел сильно скакнул с Core2. И это был последний скачок. То есть, Core2 производительности и сейчас с трудом, но хватает.
Tarakanator
не, когда запустили core i тоже был скачок. А вот после этого между соседними поколениями разницы особо небыло... ну если не считать добавления ядер.
Civil
Core i первого поколения и 2-ого - довольно значительная разница.
Потом до 6-ки примерно по 5% на поколение, не считая добавления AVX2 в 3-ем (который в задачах, которые векторизуются хороший прирост дает).
Затем то что вы говорите - 6-7-8-9 разницы либо совсем незаметно, либо просто ядер больше (что, кстати, дает прирост в софте, который масштабируется)
Потом тоже стало снова поинтереснее, так как и микроархитектуру начали пилить (что в 10-ом поколении, что в 11-м, что в 12-м) и техпроцесс наконец сменили (в 12м).
Конечно таких скачков как с 4-ого пня на Core2 больше не было, но совсем говорить что разницы особой не было - тоже не стоит.
vkni
Значительно — это сколько? Я про те скачки, которые на глаз видно. То есть, вам даётся клавиатура и экран, а вы просто по скорости работы можете сказать, что это Pentium, 486 или что там далее.
Civil
Это - в зависимости от задачи до 50% прироста производительности при значительном снижении цены (я там напомню что в те времена i7-2600k имел MSRP в 317$ и был быстрее i7-975 с MSRP в 999$).
Такие скачки видно только до определенного момента, потом при фиксированном софте они перестают быть так заметны.
vkni
У меня просто до сих пор есть ноут на Core 2, причём далеко не топовой версии, более-менее хватает на всё, кроме уеба. По компиляции ну медленее раза в полтора, чем современные машины, но это легко нивелируется софтом и настройками.
Civil
Вы тут очень ошибаетесь, говоря про польора раза. 1.5 раза это разница между ryze 9 3900x и 7950x.
vkni
Однопоток?
Civil
Общая производительность, конечно. Процессор - готовое изделие ????
Но в однопотокн у вас с core 2 получится разница тоже в разы.
vkni
В производительности там мелочи. Основной прорыв у Core i был в тепловыделении: он дал старт всяким MB Air.
У меня были ноуты на Core 2 и Pentium M: один запускает Vista/7, а другой — нет (по быстродействию). При этом аналогичный же ноут на Core 2 у меня пускал 8ку без проблем. Наверное, можно и до Win 10 обновить, если SSE новых ревизий не требуется.
Tarakanator
Так там же у всех 95 вт было(я про топовые десктопные версии, как было на обрезках и ноутах лень гуглить) И да, меня поправили в другом комменте что прирост был до 2-го поколения core i.
shigorin
… а потом карту, попёршую джентльменам, всё-таки заметили…
Civil
Только тут тебе все-таки требуется доказать, что это был осознанный чит, а не проблема с оптимизацией. С учетом влияния фиксов на производительность это будет особенно интересно почитать.
EntityFX Автор
Максимум XP или старый Linux. Кеша мало у него.
PuerteMuerte
Учитывая, что UltraSPARC IIIi выпущен в один и тот же год с Pentium M, имеет такой же техпроцесс, сходные тактовые частоты и TDP, то это как-то вообще совсем не удивительное ощущение :)
EntityFX Автор
По ощущению: IIe 500 МГц сравним с Пнём 3, а UltraSPARC IIIi даже круче Пня 4.
PuerteMuerte
Это тоже нормальное ощущение, вышеупомянутый Pentium M, это оттюнингованный Пень 3 с более высокими частотами, а Пень 3 круче Пня 4 во всех задачах, кроме потоковой обработки данных. Именно поэтому современные процессоры Интел, они потомки архитектуры третьего пня, а не четвёртого.