Недавно удалось получить удалённый доступ к компьютеру Дмитрия Бачило Sun Blade 1500 на процессоре Ultra Sparc IIIi, который выставляется в его недавно открытом музее, а также попросил пользователя Limows протестировать машину Netra T1 с процессором Ultra Sparc IIe 500 МГц. Плюс удалённо удалось получить результаты тестов процессоров серии МЦСТ‑R на архитектуре SPARC, поэтому я решил сравнить производительность процессоров от компании SUN (которую купил Oracle) и МЦСТ.

Компьютер Sun Blade 1500 в музее Дмитрия Бачило
Компьютер Sun Blade 1500 в музее Дмитрия Бачило

Характеристики сравниваемых процессоров:

 

Ultra Sparc IIe

Ultra Sparc IIIi

MCST R1000

MCST R2000

Архитектура

sparc

sparc

sparc

sparc

ISA

Sparc-v9

Sparc-v9

Sparc-v9

Sparc-v9

Микроархитектура

HummingBird

Jalapeno

In-Order

Out-Of-Order

Частота (МГц)

500

1500

1000

2000

Ядра; Потоки

1

1

4

8

Техпроцесс (нм)

180

130

90

28

TDP (Вт)

13

 

20

36

Тип ОЗУ

SDR PC-100

DDR-266

DDR2-800

DDR4-2400

Сокет

PGA 370

PGA 959

HFC BGA 1156

HFC BGA 1444

Каналов ОЗУ

1

2

1

2

Макс ОЗУ (ГБ)

2

16

8

128

Кеш

16 Кб L1I, 16 Кб L1D, 256 Кб L2

32 Кб L1I, 64 Кб L1D, 1 Мб L2

16 Кб L1I, 32 Кб L1D, 2 Мб L2 (512 x 4)

16 Кб L1I, 32 Кб L1D, 4 Мб L2 (512 x 8)

ГФлопс (DP)

0,5

1,5

8

32

ГФлопс (SP)

1

3

16

64

Транзисторов (млн.)

23

 

87,5

180

500

Год

2000

2003

2011

2019

 Были проведены следующие тесты:

  • 7zip встроенный бенчмарк

  • Dhrystone, Whetsone

  • Linpack 100

  • Coremark

  • Scimark 2

  • Stream, Memspeed

Результаты

1T - однопоточные тесты

MT - многопоточные тесты

 

Единица измерения

Ultra Sparc IIe

 

Ultra Sparc IIIi

 

MCST R1000

MCST R2000

 

OS

 

Linux 5.10

Sun OS 5.10

Linux 4.9

Linux 4.9

Compiler

 

Gcc 10

Gcc 4.9

Lcc 1.23

Lcc 1.23

Dhrystone (1T)

DMIPS

731

2455

1487

3491

Whetstone (1T)

MWIPS

457

1280

925

2289

Whetstone MP (MT)

MWIPS

457

1280

3515

17030

Linpack 100 (1T)

МФлопс

84

278

132

921

CoreMark (1T)

 

1299

3944

1861

4592

CoreMark MP (MT)

 

1299

3944

7157

35333

SciMark 2 (1T)

Composite

65

236

130

517

MFLOPS (MT)

МФлопс

 

906

6883

27500

7z (1T)

Total;

Compress;

Decompress

309;

268;

4193;

1111;

956;

13685

714;

585;

10219

1246;

990;

19146

7z (MT)

Total;

Compress;

Decompress

309;

268;

4193;

1111;

956;

13685

2514;

1884;

36020

8728;

7096;

135561

STREAM (MT)

МБ/с Copy;

Scale;

Add;

Triad

 

703:

645;

648;

617

 

 

 

Ниже результаты в виде графиков:

Сравнительный график однопоточных тестов
Сравнительный график однопоточных тестов
Сравнительный график однопоточных тестов приведённых к 1 ГГц
Сравнительный график однопоточных тестов приведённых к 1 ГГц

Подробные результаты смотрите здесь: anybench/results at master · EntityFX/anybench (github.com)

Немного об архитектурах процессоров UltraSparc II, III, МЦСТ-R

UltraSparc IIe 

Микроархитектура Ultra Sparc IIe
Микроархитектура Ultra Sparc IIe

Особенности процессора Ultrasparc IIe (Jalapeno):

  • 64 битная архитектура sparc-v9

  • FP/SIMD расширения VIS1, VIS2

  • Конвейер до 9 стадий

  • 6 исполнительных порта:

    • 2 целочисленных АЛУ (сложение, сдвиг)

    • 1 АЛУ для умножения, деления

    • 1 Загрузки/Сохранения

    • 1 FPU/SIMD VIS

  • Кеши:

    • 16  КБ L1 кэш команд (2 канальный, ассоциативный, размер линии 32 байта)

    • 16 КБ L1 кэш данных (прямая, размер линии 64 байта)

    • 2 КБ буфер подкачки, 2 КБ буфер записи

    • 256 КБ кэш L2 (4 канальный, ассоциативный)

Устройство конвейера Ultrasparc IIe: 

Конвейер UltraSparc IIe 
Конвейер UltraSparc IIe 

UltraSparc IIIi 

Конвейер UltraSparc IIIi 
Конвейер UltraSparc IIIi 

Особенности процессора Ultrasparc IIIi (Jalapeno):

  • 64 битная архитектура sparc-v9

  • FP/SIMD расширения VIS1, VIS2

  • Конвейер до 9 стадий

  • 6 исполнительных порта:

    • 2 целочисленных АЛУ (сложение, сдвиг)

    • 1 АЛУ для умножения, деления

    • 1 Загрузки/Сохранения

    • 1 блок ветвлений

    • 1 FPU/SIMD VIS

      • Блок сложения. вычитания

      • Блок умножения

      • Блок деления

      • Блок SIMD VIS

  • Кеши:

    • 32 КБ L1 кэш команд (4 канальный, ассоциативный, размер линии 32 байта)

    • 64 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 64 байта)

    • 2 КБ буфер подкачки, 2 КБ буфер записи

    • 1 МБ кэш L2

Устройство конвейера Ultrasparc IIIi:

Конвейер UltraSparc IIIi
Конвейер UltraSparc IIIi

MCST-R1000

Особенности процессора МЦСТ-R1000:

  • 64 битная архитектура sparc-v9

  • FP/SIMD расширения VIS1, VIS2

  • Конвейер до 9 стадий (7 целые, 9 вещественные)

  • Внеочередное исполнение

  • 4 исполнительных устройства:

    • 2 целочисленных АЛУ

      • сложение, сдвиг, логика

      • сложение, сдвиг, логика, умножение, деление

    • 1 FPU/SIMD VIS

    • 1 Загрузки/Сохранения

  • Кеши:

    • 16 КБ L1 кэш команд (2 канальный, ассоциативный, размер линии 32 байта)

    • 32 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 64 байта)

    • 2 МБ кэш L2

Устройство ядра МЦСТ-R1000:

Устройство кристалла МЦСТ-R1000: 


Кристалла МЦСТ-R1000
Кристалла МЦСТ-R1000
Конвейер МЦСТ-R1000
Конвейер МЦСТ-R1000

MCST-R2000

Особенности процессора МЦСТ-R2000:

  • 64 битная архитектура sparc-v9

  • FP/SIMD расширения VIS1, VIS2

  • Конвейер до 9 стадий (7 целые, 9 вещественные)

  • Внеочередное исполнение

  • 4 исполнительных устройства:

    • 2 целочисленных АЛУ

      • сложение, сдвиг, логика

      • сложение, сдвиг, логика, умножение, деление

    • 1 FPU/SIMD VIS

    • 1 Загрузки/Сохранения

  • Кеши:

    • 32 КБ L1 кэш команд (4 канальный, ассоциативный, размер линии 32 байта)

    • 64 КБ L1 кэш данных (4 канальный, ассоциативный, размер линии 64 байта)

    • 2 КБ буфер подкачки, 2 КБ буфер записи

    • 1 МБ кэш L2

Ссылки

https://www.oracle.com/technetwork/server-storage/sun-sparc-enterprise/documentation/ultrasparc-iie-2516664.pdf

UltraSparc-II.pdf (chipdb.org)

UltraSPARC IIe User's Manual (p0d.org)

Sun Microsystems UltraSparc IIe SME1701PGA-500 / SME 1701 PGA 500 MHz (cpu-world.com)

UltraSPARC IIIi Processor User's Manual (yp.to)

Sun Microsystems SME1603uPGA-1503 / SME 1603 uPGA 1503 MHz (cpu-world.com)

R1000 (ТВГИ.431281.009) — центральный процессор 1891ВМ6Я (mcst.ru)

R2000 (ТВГИ.431281.024) — центральный процессор 1891ВМ018 (mcst.ru)

P. S.: хочется протестировать более современные SPARCи, например от Fujitsu или Oracle. Если такие имеются и можете предоставить доступ — пишите.

Комментарии (34)


  1. vkni
    00.00.0000 00:00
    +4

    Занятно, но надо понимать, что на UltraSPARC IIIi работать не в консоли решительно невозможно. То есть, по ощущениям он находится на уровне Pentium M (ноутбучный). Уже Core2 (ноутбучный) быстрее его в разы.


    1. EntityFX Автор
      00.00.0000 00:00
      +1

      А какая система стоит?


      1. vkni
        00.00.0000 00:00
        +2

        OpenIndiana последняя.


    1. INSTE
      00.00.0000 00:00
      +4

      Ну так для процессора 2003 года это вполне неплохой результат, на willamette сейчас работать тоже в gui сложно.


      1. bodyawm
        00.00.0000 00:00
        +1

        почему? На xp celeron willamette летает, p4 northwood тоже ничего так.


        1. INSTE
          00.00.0000 00:00
          +5

          ОС уровня XP и на ultrasparc 3 будет летать, скажем RH 6.2 или RHEL 2.


      1. vkni
        00.00.0000 00:00
        +2

        Через буквально три года Интел сильно скакнул с Core2. И это был последний скачок. То есть, Core2 производительности и сейчас с трудом, но хватает.


        1. Tarakanator
          00.00.0000 00:00
          +1

          не, когда запустили core i тоже был скачок. А вот после этого между соседними поколениями разницы особо небыло... ну если не считать добавления ядер.


          1. Civil
            00.00.0000 00:00
            +2

            А вот после этого между соседними поколениями разницы особо небыло...

            Core i первого поколения и 2-ого - довольно значительная разница.

            Потом до 6-ки примерно по 5% на поколение, не считая добавления AVX2 в 3-ем (который в задачах, которые векторизуются хороший прирост дает).

            Затем то что вы говорите - 6-7-8-9 разницы либо совсем незаметно, либо просто ядер больше (что, кстати, дает прирост в софте, который масштабируется)

            Потом тоже стало снова поинтереснее, так как и микроархитектуру начали пилить (что в 10-ом поколении, что в 11-м, что в 12-м) и техпроцесс наконец сменили (в 12м).

            Конечно таких скачков как с 4-ого пня на Core2 больше не было, но совсем говорить что разницы особой не было - тоже не стоит.


            1. vkni
              00.00.0000 00:00

              Значительно — это сколько? Я про те скачки, которые на глаз видно. То есть, вам даётся клавиатура и экран, а вы просто по скорости работы можете сказать, что это Pentium, 486 или что там далее.


              1. Civil
                00.00.0000 00:00

                Значительно — это сколько?

                Это - в зависимости от задачи до 50% прироста производительности при значительном снижении цены (я там напомню что в те времена i7-2600k имел MSRP в 317$ и был быстрее i7-975 с MSRP в 999$).

                Я про те скачки, которые на глаз видно

                Такие скачки видно только до определенного момента, потом при фиксированном софте они перестают быть так заметны.


                1. vkni
                  00.00.0000 00:00

                  У меня просто до сих пор есть ноут на Core 2, причём далеко не топовой версии, более-менее хватает на всё, кроме уеба. По компиляции ну медленее раза в полтора, чем современные машины, но это легко нивелируется софтом и настройками.


                  1. Civil
                    00.00.0000 00:00
                    +1

                    Вы тут очень ошибаетесь, говоря про польора раза. 1.5 раза это разница между ryze 9 3900x и 7950x.


                    1. vkni
                      00.00.0000 00:00

                      Однопоток?


                      1. Civil
                        00.00.0000 00:00
                        +1

                        Общая производительность, конечно. Процессор - готовое изделие ????

                        Но в однопотокн у вас с core 2 получится разница тоже в разы.


          1. vkni
            00.00.0000 00:00

            В производительности там мелочи. Основной прорыв у Core i был в тепловыделении: он дал старт всяким MB Air.

            У меня были ноуты на Core 2 и Pentium M: один запускает Vista/7, а другой — нет (по быстродействию). При этом аналогичный же ноут на Core 2 у меня пускал 8ку без проблем. Наверное, можно и до Win 10 обновить, если SSE новых ревизий не требуется.


            1. Tarakanator
              00.00.0000 00:00

              Так там же у всех 95 вт было(я про топовые десктопные версии, как было на обрезках и ноутах лень гуглить) И да, меня поправили в другом комменте что прирост был до 2-го поколения core i.


        1. shigorin
          00.00.0000 00:00
          +1

          … а потом карту, попёршую джентльменам, всё-таки заметили


          1. Civil
            00.00.0000 00:00
            +1

            а потом карту, попёршую джентльменам

            Только тут тебе все-таки требуется доказать, что это был осознанный чит, а не проблема с оптимизацией. С учетом влияния фиксов на производительность это будет особенно интересно почитать.


      1. EntityFX Автор
        00.00.0000 00:00
        +1

        Максимум XP или старый Linux. Кеша мало у него.


    1. PuerteMuerte
      00.00.0000 00:00
      +7

      То есть, по ощущениям он находится на уровне Pentium M (ноутбучный).

      Учитывая, что UltraSPARC IIIi выпущен в один и тот же год с Pentium M, имеет такой же техпроцесс, сходные тактовые частоты и TDP, то это как-то вообще совсем не удивительное ощущение :)


      1. EntityFX Автор
        00.00.0000 00:00
        +1

        По ощущению: IIe 500 МГц сравним с Пнём 3, а UltraSPARC IIIi даже круче Пня 4.


        1. PuerteMuerte
          00.00.0000 00:00
          +2

          Это тоже нормальное ощущение, вышеупомянутый Pentium M, это оттюнингованный Пень 3 с более высокими частотами, а Пень 3 круче Пня 4 во всех задачах, кроме потоковой обработки данных. Именно поэтому современные процессоры Интел, они потомки архитектуры третьего пня, а не четвёртого.


  1. EntityFX Автор
    00.00.0000 00:00
    +4

    Разыскиваются свежие или не очень SPARCи с удаленным доступом ssh.


    1. hw_store
      00.00.0000 00:00
      +2

      У меня есть Station 1+, но я не уверен, что там стоит хоть какая-нибудь ось, и понятия не имею, как подключить это к сети )))
      ...если у неё вообще запустится блок питания после двадцати лет простоя. Хотя... у ДВК ж запустился :-o


      1. EntityFX Автор
        00.00.0000 00:00
        +2

        Есть повод оживить машинку :-)


    1. shigorin
      00.00.0000 00:00
      +1

      Куда-то делся M5000, но оно довольно громкое (и поспрошать лучше бы практику).


  1. OgyAbza
    00.00.0000 00:00
    +1

    АЛУ не "целые", а целочисленные!


  1. checkpoint
    00.00.0000 00:00
    +2

    Спасибо за тесты.

    Посмотрел на результаты теста Dhrystone и вспомнил извесное изречение: "А в попугаях я значетельно длиннее".


  1. byman
    00.00.0000 00:00
    +2

    Подскажите, почему у Ultra Sparc IIIi одна double операция на такт. Он делает умножение с накоплением за 2 такта? Или double fma здесь идет за одну операцию и Rx000 их делает 2 за такт?


    1. EntityFX Автор
      00.00.0000 00:00
      +2

      Здесь очень подробно написано про работу конвейеров, различных инструкций и задержки: UltraSPARC IIIi Processor User's Manual (yp.to)

      По поводу МЦСТ-R2000 могу уточнить, а так как очень много только по R1000. Про 2000й известно, что он стал OoO, а умеет ли FMA делать непонятно.


      1. byman
        00.00.0000 00:00
        +2

        Спасибо. Похоже я запутался в версиях. У вас в таблице такой SPARC у которого FMA еще нет. У Rx000, судя по таблице, есть. Хотя у всех написана одна версия ISA.


  1. en3rgie
    00.00.0000 00:00
    +1

    Непонятно: в начале статьи указано, что R1000 относится к архитектуре V8, а в конце к V9. К какой части написанного верить?


    1. EntityFX Автор
      00.00.0000 00:00

      Спасибо, поправил (конечно же V9).