Процесс выхода на рынок новых процессоров явно ускорился — буквально каждый месяц на рынке появляются новые и новые чипы. Сейчас стали известны подробности сразу о нескольких новых чипах, включая как зарубежных, так и отечественных производителей. Среди этих подробностей — интересная особенность уже вроде как изученных процессоров М1 от Apple, о которых мы писали не так давно.

Новый флагман от Intel


Несмотря на то, что компания Intel выпустила на рынок еще не все процессоры семейства Alder Lake (Core 12), на днях стало известно о новом флагмане этой компании. Он получил название Raptor Lake. Правда, появится чип не скоро, его выход на рынок планируется примерно на конец следующего года. От Alder Lake новый процессор отличается большим количеством ядер и более высокой частоты их работы.


Что касается количества ядер, то в новинке их сразу 24: 8 больших ядер и 16 малых. Что касается первых, то это Raptor Cove, вторые — Gracemont. Многопоточность поддерживают только большие ядра, процессор в итоге дает возможность выполнять сразу 32 потока одновременно. Процессор уже протестирован — на платформе c DDR5, при этом, насколько известно, он будет поддерживать и DDR4, так что у пользователей всегда будет возможность выбора вида памяти. Стоимость и точные сроки выхода процессора в пролажу неизвестны.

Известно только, что техпроцесс и сокет останутся теми же, что и у предыдущего поколения. Здесь пока радикальных изменений не предвидится.

Kirin 9006C из Китая



Китайцы, похоже, впереди планеты всей по скорости импортозамещения производства процессоров. Дело в том, что они не просто выпустили без особых фанфар 5-нм процессор, который получил название Kirin 9006C, но еще и изготовили ноутбук на его основе, который уже поступил в продажу.

Поскольку в этой статье говорится о новых процессорах, то ноутбук пока оставим за рамками материала. А вот о новом процессоре стоит рассказать подробнее. Вернее, просто рассказать о том, что известно о нем на данный момент. А это скорость работы ядра — 3,13 ГГц. К сожалению, данных о видеоподсистеме и всех прочих технических подробностях нет. Но, вероятно, скоро все это появится в сети — раз уж вышел ноутбук, то подробности будут опубликованы в ближайшие несколько дней.

О предыдущей модели процессора, Kirin 990, мы уже рассказывали в начале мая. Всего за полгода китайцы успели не только выпустить новое поколение собственных процессоров, но и разработать ноутбук. Что касается предыдущей модели процессора, то его конфигурация хорошо известна. Это 8-ядерный процессор, ядра в котором разделены на три кластера. Первый кластер объединяет высокопроизводительные ядра Cortex A76 с частотой 2,86 ГГц, второй — менее производительные Cortex A76 с частотой 2,09 ГГц, третий — четыре малопроизводительных ядра Cortex A55 на частоте 1,86 ГГц. В ходе выполнения «тяжелых» приложений ноутбук задействует производительные ядра. Для задач, которые не требуют высокой производительности, задействуются остальные кластеры. Последние к тому же потребляют меньше энергии.

Новые процессоры — весьма интересная тема, но у нас есть и другие статьи, оцените — мы рассказываем о:

Маленьких «малинках» в крупном дата-центре
новых SoC от Apple — M1 Pro и M1 Max
Создании собственного корпуса для сервера

Amazon Graviton3



На днях компания Amazon представила свой новый ARM-процессор Graviton3, который был необходим самой компании для нужд ряда сервисов. Как оказалось, процессор сразу по нескольким параметрам лучше, чем чипы других производителей, включая EPYC и Xeon. Похоже на то, что у вендоров появился новый серьёзный конкурент.

Процессор, о котором идет речь, является массовым чипом, который у Amazon закупили многие компании. Пока что он работает лишь в серверах избранных клиентов, но вскоре станет доступен вообще всем.

В чем его достоинства? Процессор поддерживает DDR5 и PCIe 5.0. Он выполнен по 5-нм техпроцессу, что само по себе примечательно. Содержит он свыше 55 млрд транзисторов. Для того, чтобы производство таких чипов было дешевле, разработчики предусмотрели BGA-корпусировку. Чиплетная корпусировка здесь состоит из семи отдельных кристаллов. PCIe-контроллеры и двухканальные контроллеры DDR5 вынесены за пределы процессора.


Длина каналов около 55 мкм, что в два раза меньше, чем у чипов большинства других производителей. По словам экспертов, необычно короткая длина каналов важна для повышения энергоэффективности чипов и оборудования в целом. Общее энергоптребление в итоге составляет 100 Вт.

Российские Baikal-S



Это тоже ARM-процессоры, сейчас — производителю удалось выпустить первую партию чипов. Правда, не для общего использования — процессоры, о которых идет речь, являются инженерными образцами. Готовы для них и инженерные платы. Baikal-S, изготавливаемый по 16-нм техпроцессу на TSMC, имеет 48 ядер Arm Cortex-A75. Архитектура здесь ARMv8.2-A, впервые о ней стало известно в 2017 году. Частота работы ядра процессора — до 2,2 ГГц, а уровень TDP равен 120 Вт.

У новинки есть поддержка аппаратной виртуализации, Arm TrustZone, плюс процессор позволяет создавать четырёхсокетные платформы. В итоге процессор можно использовать в традиционных серверах, СХД, HCI- и HPC-системах.

EPYC Milan-X от AMD



Компания AMD анонсировала новые серверные процессоры с кодовым названием Milan-X. Это продолжение серии EPYC 7003 (Milan), которая была представлена весной этого года. Процессоры «заточены» под высокопроизводительные вычисления. Главное отличие новой модели — увеличенный объем кэш-памяти.


Новые процессоры будут совместимыми с SP3-платформами для Milan. Собственно, пока это все, что известно о новых процессорах. Ни частоту работы ядра, ни другие технические характеристики компания не приводит. Известно еще, что на каждое ядро Zen3 приходится по 32 Кбайт L1-кеша для инструкций и данных + 512 Кбайт L2-кеша.

А что там насчет М1?



Совсем недавно в сети появилась информация о том, что чипы M1 Max ранее были не полостью описаны Apple — компания скрыла часть информации. Скорее всего потому, что эти данные явно указывают на возможность выпуска комбинированных чипов. У M1 Max есть интерфейс для связи кристаллов. Об этом специалисты говорили и ранее, но сейчас появились доказательства.


Энтузиасты вскрыли первые MacBook Pro с M1 Max и опубликовали снимки процессоров. Именно на фотографиях и становится заметен интерфейс, о котором идет речь. При помощи такого же интерфейса компания AMD связывает кристаллы Graphics Compute Die (GCD) на ускорителях Radeon Instinct MI250. Компания использует MCM или дизайн чиплетов для процессоров, содержащих до восьми кристаллов CCX, каждый с восемью ядрами Zen.


Зачем все это? Apple без особых проблем может соединять процессоры вместе, получая все более производительные системы. Это хорошо видно на иллюстрациях от одного из специалистов, который занимается изучением процессоров корпорации. Вероятно, в будущем компания Apple будет выпускать новые системы на комплексах из нескольких процессоров. Конечно, это только догадки, но достаточно аргументированные — насколько можно понять, все изложенное выше соответствует действительности.

Комментарии (64)


  1. fshp
    05.12.2021 20:24
    +30

    У новинки есть аппаратная виртуализация, это Arm TrustZone, которая позволяет создавать четырёхсокетные платформы

    Комбо-вомбо из 3 несвязанных между собой понятий.


  1. v1000
    05.12.2021 21:48
    +8

    Забавно, что M1 Pro напоминает Pentium Pro не только названием, но и формой


    1. d33
      06.12.2021 00:29

      У интела еще зионы-мутанты от ноутбуков остались, эпл изобрела велосипед..

      QQLT для 1151 сокета

      https://mysku.ru/blog/aliexpress/83730.html


      1. kaljan
        06.12.2021 14:52
        +4

        ну изобрела и изобрела

        работают-то все равно лучше, чем интел который каждый год все тормознее и тормознее


    1. Newbilius
      06.12.2021 07:50
      +8

      А на каком фото вы увидели сходство? Никак не могу найти.


  1. sborisov
    05.12.2021 22:17
    +1

    Вроде выпускают и выпускают, а цены вниз не сильно падают. Хотелось бы уже чтобы наводнили рынок не на «бумаге», а на самом деле. Думаю многие ждут адекватных цен, чтобы обновить свои системы.


    1. alpik
      05.12.2021 22:34
      +2

      В смысле? Полно отличных процессоров за вменяемые деньги.

      ~ 500$ 12 ядер/24 потока АМД - более чем адекватно.


      1. hyperwolf
        06.12.2021 17:13
        +2

        А еще $500 - ОЗУ, $300+ мать, $1500+ видеокарта, ну не очень бюджетно выходит.


        1. DistortNeo
          06.12.2021 17:27

          Модуль памяти на 16 гигов (DDR4 3200 MHz) стоит 5000 рублей. Вы собрались 128 гигов покупать?

          Вместо материнки с чипсетом X570 можно взять модель поскромнее на B550. Это будет стоит $100, а разницу вы вряд ли сможете увидеть.


          1. hyperwolf
            06.12.2021 17:58
            -1

            Оперативная память 32Gb 4800MHz Kingston Fury Beast 2x16Gb KIT CL38 DDR5 (KF548C38BBK2-32) стоит 20-26к руров, 64 гб итого будут стоит ~$500. Довольн странная идея на свежие процессоры ставить "старую" DDR4. Судя по тестам, разница в тех же играх - будет заметна.

            Дешевую мамку под жирний процессор? У нее питания-то хватит?

            В свое время я взял достаточно дорогую связку в виде Gigabyte P55 + i7 860, и спустя годы могу сказать что это было очень разумное вложение, почти всем слотам нашлось применение. Да и довольно странно брать хороший процессор и остальное по остаточному принципу.


            1. Physmatik
              06.12.2021 18:44
              +3

              Ну да, действительно, экспериментальная ДДР5 память стоит дорого. Кто бы мог подумать.


              Чем вас 2666 ДДР4 не устраивает? Если вы играете, то всё равно упрётесь в карту в 99% случаев. А если не играете, то какая там разница? 3%?


            1. DistortNeo
              06.12.2021 19:33
              +5

              Оперативная память 32Gb 4800MHz Kingston Fury Beast 2x16Gb KIT CL38 DDR5

              Что меня смущает, так это CL38. Для сравнения: у оверклокерской DDR4 с близкими частотами (4000-4400) задержка будет в районе CL19-CL20.

              И нет, это не ошибка, это реальное ухудшение ситуации:
              https://dtf.ru/hard/673176-ddr5-pamyat-longsys-primerno-na-53-bystree-ddr4-moduley
              Рост задержки с ~55-60 нс до ~110 нс — это охренеть как много.

              Судя по тестам, разница в тех же играх - будет заметна.

              Если вы внимательно поизучаете тесты, то увидите, что играм важна не столько пропускная способность памяти, сколько задержка доступа к памяти.

              Увеличение пропускной способности в полтора раза относительно массовой DDR4 3200 MHz с одновременным увеличением времени доступа в 2 раза, скорее всего, даст ухудшение производительности в играх, причём довольно серьёзное.

              Дешевую мамку под жирний процессор? У нее питания-то хватит?

              Для ситуации 10-летней давности, когда разгон процессора был нормой, покупка дорогой материнки себя оправдывала. Сейчас же процессоры гнать бессмысленно. И, кстати, чипсет и подсистема питания — разные вещи.


              1. hyperwolf
                06.12.2021 23:03
                +1

                Что меня смущает, так это CL38. Для сравнения: у оверклокерской DDR4 с близкими частотами (4000-4400) задержка будет в районе CL19-CL20.

                Ну так память только считайте вышла, DDR4 прямо сейчас будет лучше чем DDR5, но на перспективу - хуже.

                Если вы внимательно поизучаете тесты, то увидите, что играм важна не столько пропускная способность памяти, сколько задержка доступа к памяти.

                Не претендую на абсолютную точность, но на том же overclockers.ru есть небольшой тест, по сути перевод, где видно что DDR5 уже немного, но быстрее

                И, кстати, чипсет и подсистема питания — разные вещи.

                Конечно разные. Не знаю точно как дела у AMD, но у Intel под топовые горячие процессоры материнка надо соответствующая, как минимум из-за потребления.


              1. vrnvorona
                07.12.2021 15:53
                +1

                Сейчас же процессоры гнать бессмысленно.

                3.6 в стоке или 4.7 дают большую разницу, по крайней мере на моем уже "доисторическом" 8600k.

                Про поддержку частоты памяти молчу, на дешевых мбшках не будет работать 4000-4400 память зачастую.


                1. DistortNeo
                  07.12.2021 17:28

                  3.6 в стоке или 4.7 дают большую разницу, по крайней мере на моем уже "доисторическом" 8600k.

                  Не забывайте, что в процессорах есть турбобуст, и если у вас задача задействует только пару потоков, то в стоке будет уже 4.3, что нивелирует разницу. У 10ххх и 11ххх частоты турбобуста уже доходят до 5.0.

                  Сильное различие же будет только при 100% нагрузке. Да, тут только хорошая материнка и охлаждение потянут разгон до 4.7. Но стоит ли оно того?

                  Про поддержку частоты памяти молчу, на дешевых мбшках не будет работать 4000-4400 память зачастую.

                  Вот только контроллер памяти находится в процессоре, а не на материнской плате.

                  И опять же: я считаю, что покупка памяти 4000-4400 вместо 3200-3600 с низкими таймингами совершенно не оправдана: производительность вырастет максимум на 5%, а вот денежные затраты на память и материнку будут несравнимо выше.


                  1. vrnvorona
                    07.12.2021 17:36

                    Но стоит ли оно того?

                    Тут уже на месте надо решать. Для меня стоит. Турбобуст имеет дельту и имеет свойство проседать через 50 с чем то секунд.

                    Вот только контроллер памяти находится в процессоре, а не на материнской плате.

                    Это тоже правда, но на дешевой памяти биос просто не заведет высокую частоту памяти. Проверено на 4400 памяти с 9600k на мб которая только 4200 позволяет. 4400 просто не стартует. Сделано почти наверняка специально, но что есть то есть.


        1. alpik
          06.12.2021 18:34
          +1

          Зависит от ваших запросов.

          Моя калькуляция 500$ amd 3900x + 120$ 32gb ram + mainboard 80$ + 10$ видеозаглушка.

          Для домашней лабы вполне бюджетно и с запасом на много лет.


          1. Layan
            06.12.2021 19:26

            Не подскажите, какую видеозаглушку за 10$ можно взять сейчас? Ну, так чтобы 4K видео на YouTube не лагало?
            Я себе брал Ryzen G серии (со встроенной), пока нормальную видеокарту не купил. Иначе приходилось выбирать затычку за 100-200$.


            1. alpik
              06.12.2021 19:35

              Увы, не подскажу. Я свою нашел на барахолке, что-то раритетное firegl.

              Она не подключена к монитору.


          1. DistortNeo
            06.12.2021 19:38

            А зачем видеозаглушка вообще нужна? Сейчас же везде есть встроенное видео.


            1. alpik
              06.12.2021 19:41
              +2

              Далеко не везде. В многоядерных АМД не часто встречается.

              У меня был со встроенной картой ryzen 3400g, решил что больше ядер/потоков мне интереснее.


          1. DaemonGloom
            07.12.2021 10:56

            Если сервер с линуксом и материнка позволит загрузиться без видеокарты — не проще подключаться к нему по консоли (rs232/usb)?


            1. alpik
              07.12.2021 11:00

              Не понимаю вопроса. Проще чем что?

              Мне по шнурку ethernet как-то проще.


              1. DaemonGloom
                08.12.2021 12:30

                Проще, чем ставить видеокарту-затычку.


                1. alpik
                  08.12.2021 12:34

                  Даже не пытался без заглушки.

                  Вы наверное пропустили название процессора выше. Это АМ4 сокет, не серверный


                  1. DaemonGloom
                    08.12.2021 12:41

                    Часть плат умеет такое. Видел такие отзывы про strix b450, например.


    1. lokkiuni
      05.12.2021 23:07

      8700, 3600, 10400f и 11400f уже много лет выпускаются, если сравнительно задёшево, 8100/9100 на пару с x400g в бюджетном сегменте, про мидлы по 8 и более ядер я вообще молчу - куда уж доступней? Не так уж давно одна материнка под столько ядер стоила как проц+мать сейчас, а производительность этих ядер успела вырасти в 1.5-2 раза. Другое дело, что это нужны задачи под это дело, которые получают от этого ускорение - иначе действительно нет смысла менять


    1. nidalee
      06.12.2021 08:49
      +10

      Вроде выпускают и выпускают, а цены вниз не сильно падают.
      Это вы просто не знаете или не помните, сколько лет 5 назад стоили процессоры на 12 ядер с 24 потоками, которые сейчас дешевле 500 баксов можно купить.


    1. vadimr
      06.12.2021 14:38
      +2

      Цены в обозримом будущем падать не будут, не таково состояние экономики.


      1. MixaSg
        06.12.2021 16:58
        +7

        Жизнь такова, какова она есть, и больше – никакова


    1. KvanTTT
      06.12.2021 19:41
      +1

      Помимо указанных выше аргументов есть и еще один — инфляция. Они и не должны падать.


  1. Politura
    06.12.2021 00:54
    +4

    Многопоточность поддерживают только большие ядра

    Чего??? Может имеется в виду hyperthreading, а не многопоточность? А то делать несколько ядер процессору которые не будут уметь в многопоточость нет никакого смысла. Если первые 8 с хипертредингом, 16 других без, то в итоге как-раз получается 32 потока.


  1. BlackSCORPION
    06.12.2021 03:33
    +1

    Ни разу не видел в daily life 100% cpu на ryzen 9 5950x. 32 виртуальных ядра круто конечно, но основная масса приложений не умеет их все разом использовать для скорости.

    Надо производительность на ядро увеличивать тож. Одним копипастом чиплетов сыт не будешь


    1. DrPass
      06.12.2021 03:46
      +6

      но основная масса приложений не умеет их все разом использовать для скорости.

      Ну то такое. Бухгалтеру такой процессор не нужен. Но если вы программист и собираете проект, вам все ядра пригодятся. Если вы работаете с видео/аудио — тоже все ядра пригодятся. Художник, конструктор и т.д. — есть масса профессиональных применений, где чем больше ядер, тем лучше. А для бытовых задач, ну так там в линейке есть и процессоры попроще :) Не говоря уже о том, что если даже одно приложение не умеет утилизировать много ядер, ему зачастую помогут в этой нелёгкой задаче другие приложения. У меня вон прямо сейчас около 6000 потоков на компьютере.


      1. BlackSCORPION
        06.12.2021 06:35
        +3

        Я программист, тоже так думал, не гоже это чтобы техника была ботлнеком, взял 5950х + 128 гб оперативы. Практика показывает что погорячился )

        Нет, я конечно не жалуюсь, все летает, а вентиляторы не слышно даже в тишине, моя мысль в том что если мне сейчас добавить хоть еще 100 ядер, я не увижу ровно никакой разницы.


        1. DistortNeo
          06.12.2021 11:44
          +5

          что если мне сейчас добавить хоть еще 100 ядер, я не увижу ровно никакой разницы.

          Увидите: производительность упадёт, т.к. чем больше ядер, тем ниже частота каждого из них.


          1. batyrmastyr
            07.12.2021 13:51
            +1

            Или можно нарваться на затык с блокировками )


        1. JamboJet
          06.12.2021 13:45
          +2

          Это скорее запас на будущее: позволяет дольше обычного не думать об апгрейде.


          1. sborisov
            06.12.2021 23:10
            +1

            Абсолютно с вами согласен. Лучше сразу купить компьютер для работы без компромиссов, прослужит гораздо дольше и нервы ваши сохранит.

            Купил 8 лет назад только вышедший haswell, и 32gb памяти - чтобы потом не бегать и не искать, если не будет хватать, так как в то время на работе мы прямо резко стали наращивать объёмы памяти 4,8,16 и казалось что 32 будет требоваться через год - два, оказалось что нет, но она тогда стоила не очень дорого.

            Про удешевление, я имел ввиду все таки топовые процессоры, если бы я купил i7, а не i5, то сейчас было бы терпимо, но вот с i5 уже не хватает 4х ядер


        1. khim
          06.12.2021 16:06
          +5

          моя мысль в том что если мне сейчас добавить хоть еще 100 ядер, я не увижу ровно никакой разницы.

          А виновника вы можете наблюдать в зеркале, однако.

          Однопоточная проиводительность упёрлась в потолок ещё лет 20 назад.

          Выпосла с тех пор раза в три и ожидать её повышения, увы, не стоит.

          Ну может ещё раза в три за очередные 20 лет ускорят (путём увеличения размера ядра раз в сто).

          Так что, эта… всё в ваших руках. Думайте как ускорять всё в существующих условиях.

          Это ваша задача теперь, не разработчиков железа.

          Физику не обманешь.


          1. ABy
            06.12.2021 19:02
            +2

            Однопоточная проиводительность упёрлась в потолок ещё лет 20 назад.

            Это в 2002-ом что ли? Мой компьютер из 2004-го уделает какая-нибудь raspberry pi первого поколения. Или вы про частоты?


            1. khim
              06.12.2021 19:19
              +4

              Мой компьютер из 2004-го уделает какая-нибудь raspberry pi первого поколения.

              Знаете, это даже не смешно. Может вы в 2004м работали на отцовской Амиге, купленной в 80е, но у меня был Northwood 3.4Ghz тогда.

              А Raspberri Pi первого поколения — это 700Mhz ARM. И даже не суперскаляр.

              Никакого сравнения, в принципе. Разница в сокрости раз в пять. И не в пользу Raspberri Pi.

              Или вы про частоты?

              И про частоты и про количество инструкций за такт. И да, я знаю, что у Pentium 4 были “кукурузные мегагерцы”. Но где-то полторы инструкции за такт он выдавал, одну, если сильно не повезёт, а современные процессоры хорошо, если, в устоявшемся режиме, три делают. Обычно меньше.

              Так что всё, лафа кончилась, “кина не будет”.

              Однопоток достиг, фактически, предела. Не будет он уже ускоряться существенно, как бы этого кому-то ни хотелось.

              Это в 2002-ом что ли?

              Конец прошлого века. Архтектурно последний “большой рывок” — это Pentium Pro, 1995й, окончание “гонки гигагерц” — это Pentium 4, 2000й.

              После этого однопоточная производительность растёт настолько черепашьими темпами, что рассчитаывать на неё не стоит от слова вообще. В три раза за два десятилетия, плюс-минус.

              Всё, пора программистам просыпаться. Давно пора.


              1. Dmitry3A
                07.12.2021 00:01
                +1

                Однопоток достиг, фактически, предела. Не будет он уже ускоряться существенно, как бы этого кому-то ни хотелось.
                Надо добавить — на существующих решениях. Может завтра прорыв прорвут и случится счастье.

                Всё, пора программистам просыпаться. Давно пора.
                Там где производительность реально нужна они и не засыпали.

                А браузерные приложения и ко. так это не про производительность.

                Плюс для многих приложений встраивают сопроцессоры — поддержка видеокодеков или нейропроцессоры на м1, сразу начинается приемлемая производительность с минимум энергопотребления.

                После этого однопоточная производительность растёт настолько черепашьими темпами, что рассчитаывать на неё не стоит от слова вообще. В три раза за два десятилетия, плюс-минус.
                Посмотрел на passmark текущий лидер Intel Core i9-12900KF — 4223, самый быстрый Pentium 4 — 666 (это звоночек!) или в шесть раз. Это конечно не много, но если использовать несколько ядер — то общая производительность системы для пользователя будет сильно выше.


                1. khim
                  07.12.2021 05:37
                  +4

                  Надо добавить — на существующих решениях.

                  Не нужно. 5Ghz — это частота, на которой свет, в вакууме, проходит жалкие 6 сантиметров. Никаких предпосылок ожидать чего-то, движущегося быстрее света в ближайшем будущем ожидать не приходится и в субатомные структуры мы тоже не полезем.

                  Так что нет, никакие новые решения ничего не изменят. Вот сделать параллельно запускаемыми 100, 1000, 10000 потоков — это мы, теоретически, можем. А радикально ускорить однопоток — нет.

                  Там где производительность реально нужна они и не засыпали.

                  Серьёзно? Расскажите это программистам, у которых однострочное изменение по полчаса при использовании C++ и Rust компилируется.

                  Сапожник без сапог, блин.

                  А браузерные приложения и ко. так это не про производительность.

                  А про что это? Про испытание терпения пользователя?

                  Посмотрел на passmark текущий лидер Intel Core i9-12900KF — 4223, самый быстрый Pentium 4 — 666 (это звоночек!) или в шесть раз.

                  Там существенная часть ускорения — это не ускорение однопотока, как такового, а SSE и AVX. Да, это дало разовое ускорение (Pentium 4 в SSE2 уже умеет, в AVX ещё нет), но там тоже упёрлись: AVX512, может, к десятилетию с момента презентации, и пойдёт в массы, но уже гипотетический AVX1024 — под вопросом.

                  При этом разрыв между тем что могло бы быть, если бы программисты не прятали голову в песок и тем, что мы имеем в реальности всё растёт и растёт: количество ALU в GPU уже тысячами измеряется, то есть если бы архитектура приложений позволяла, то можно было бы уже спокойно выпускать CPU с тысячами же [низкосоростных] ядер.

                  Вместо этого оказывается, что 16 ядер загрузить работой нечем. Вместо этого нужно разгонять 2-4-8 до космических скоростей (так что яичницу жарить можно).


                  1. dragonnur
                    07.12.2021 10:22

                    Для одного длинноконвейерного (35+ стадий) ядра с HT, реальным, а не маркетинговым размером литографии около 20 нм (в качестве прототипа я предполагаю Tejas, который имел 65 нм) и с более-менее пропорционально разнице площадей (6 кв. мм вместо 120) поднятой частотой ("минимально максимальная" КМК в районе 12-16 ГГц) такой хотспот, конечно, будет греться как печка, но для определённых целей может оказаться выгодным, особенно, если это чиплет.


                    1. khim
                      07.12.2021 10:45
                      +2

                      с реальным, а не маркетинговым размером литографии около 20 нм

                      А ничего, что там у вас элементы размером меньше одного атомного слоя начнут появляться?

                      "минимально максимальная" КМК в районе 12-16 ГГц

                      А тут у нас начинают сигналы распространяться быстрее скорости света…

                      в качестве прототипа я предполагаю Tejas, который имел 65 нм

                      Вот только не работал этот Tejas нифига. Когда его отменяли, то было уже понятно, что частоты у него будут ещё более “кукурузными” и что ничего хорошего из этого не выйдет.

                      такой хотспот, конечно, будет греться как печка, но для определённых целей может оказаться выгодным, особенно, если это чиплет.

                      В принципе что-то подобное можно сотворить, если перейти в 3D и не ограничиваться одним слоем. В этом случае субатомарные конструкции не нужны. Вот только:

                      1. Это тупик. Этот трюк вы можете проделать один раз. 4го измерения у меня для вас нету.

                      2. Вы получите этого монстра взамен примерно сотни ядер, подобных современным

                      Да, возможно для каких-то целей оно и подойдёт. Но тратить все эти ресурсы для компенсации того, что кто-то наворотил 100500 уровней индирекции в JavaScript-библиотеке… глупо.


                      1. dragonnur
                        07.12.2021 11:05

                        А ничего, что там у вас элементы размером меньше одного атомного слоя начнут появляться?

                        Мне казалось, это как раз и есть примерный размер того, что называют процессом Интел 7.

                        начинают сигналы распространяться быстрее скорости света

                        С чего бы вдруг? 16 ГГц это, ЕМНИМС примерно 9 мм в кремнии, при размерах кристаллика 2.4х2.5 сойдёт.

                        Вот только не работал этот Tejas нифига

                        Из-за диких утечек в подложку и прочих косяков, которые в нынешних процессах исправлены. Почти 2 десятка лет прошло. Тогда с площади 120 кв мм пытались отвести по ватту с миллиметра.

                        тратить все эти ресурсы для компенсации того, что кто-то наворотил 100500 уровней индирекции в JavaScript-библиотеке

                        Всё равно придётся - пока не появится "оптимизирующий транслятор" для всех тех слоёв абс(т)ракции.


                      1. khim
                        07.12.2021 17:21

                        Мне казалось, это как раз и есть примерный размер того, что называют процессом Интел 7.

                        Нет. Была же статья на Хабре. Со снимками. 7нм отличаются от 90нм, условно, тем, что транзисторы “поставили на попа”. Да, это позволилось их больше напихать в кристалл и немного повысить скорость (проводники короче), но ни о каких 10GHz (не говоря уже о 15-16GHz) речи не идёт.

                        С чего бы вдруг? 16 ГГц это, ЕМНИМС примерно 9 мм в кремнии, при размерах кристаллика 2.4х2.5 сойдёт.

                        Сойдёт для чего? Чтобы от одного конца кристалла до другого дошло? Возможно.

                        Но вы что-то там говорили про всякие Tejas'ы? То есть про суперскаляры? Там для этого сигнал должен пройти далеко не через один транзистор. Вот суммарная их длина и играет роль.

                        От того, то вы эти транзисторы “на попа” поставили расстояние, проходимое сигналом не сильно уменьшилось. Вы не в курсе, что первый процессор на 5GHz появился больше 10 лет назад? Ну так просветитесь.

                        Тогда с площади 120 кв мм пытались отвести по ватту с миллиметра.

                        Я вам умный вещь скажу, только вы не обижайтесь. Отвести со 120 кв. мм пусть даже и 200 ватт куда проще, чем жалкие 20-30 ватт с вашего кристаллика 2.4x2.5

                        Всё равно придётся - пока не появится "оптимизирующий транслятор" для всех тех слоёв абс(т)ракции.

                        Нет. Достаточно произойти какой-нибудь заварушке между Тайванем и Китаем — и всё. Весь мир оказывает перед фактом: телефоны теперь будут служить лет по 5, а главное — чипы для них, в наличии, только китайские. Мегагерц на 500, от силы на гигагерц. Получите — распишитесь.

                        И ведь, что характерно, и получат и распишутся.

                        Подавляющее большинство современного софта потребляет раз в 100 больше ресурсов чем ему нужно, на самом деле, для решения той бизнес-задачи, для которой оно создано.

                        Появится необходимость — ужмутся.

                        Да, будет тормозить. Но это не от процессора зависит. И ваш процессор на 15-16Ghz будет так же прекрасно тормозить, как сегодняший проц на 5GHz, если его удастся сделать

                        Софт “летал” когда разработку WIndows 95 начинали на 486DX на 66MHz в 1992м, а пользовали её на Pentium II на 200Mhz в 1997м.

                        То есть когда машина разработчика была тормознее, гораздо тормознее, чем машина пользователя.

                        Вот так — да. Обеспечьте это (неважно как) — и тормоза исчезнут. Не обеспечите? Будет тормозить.


                      1. KvanTTT
                        07.12.2021 16:47

                        В принципе что-то подобное можно сотворить, если перейти в 3D и не ограничиваться одним слоем.

                        Может и тупик, но если все вычисления засунуть в один кубический сантиметр, то в теории можно будет достигнуть ускорения частоты в разы, что тоже неплохо.


                  1. KvanTTT
                    07.12.2021 16:50

                    Не нужно. 5Ghz — это частота, на которой свет, в вакууме, проходит жалкие 6 сантиметров. Никаких предпосылок ожидать чего-то, движущегося быстрее света в ближайшем будущем ожидать не приходится и в субатомные структуры мы тоже не полезем.

                    Дело не только в скорости света, но в самих принципах вычислений. Условные аналоговые вычисления в несколько раз быстрее цифровых, квантовые тоже. Но не факт что получится их использовать для универсальных вычислений в ближайшее время.


                    1. khim
                      07.12.2021 18:21

                      Но не факт что получится их использовать для универсальных вычислений в ближайшее время.

                      Совершенно неважно — получится или нет.

                      Важно, что вы там Windows не запустите. Ну никак.

                      А это, в сущности, единственная причина по которой мы имеем… то, что имеем. Ну не одна WIndows, конечно, а вот все эти Angular'ы и Vue.js… весь массив накопленного де софта.

                      Просто почти весь XX век ничего, кроме однопотока, у большинства разработчиков и пользователей, не было.

                      Соотвественно, когда появилась альтернатива, оказалось, что запускать на ней решительно нечего.

                      Потому на однопотоке ехали пока была возможность ехать. Выжимая из него всё, что можно и чего нельзя.

                      По кругу: более тяжёлый софт требует более быстрого однопотока, более быстрый однопоток позволяет не думать о том, чтобы менять парадигму работы софта.

                      А когда упёрлось, то оказалось, что выбраться из этой колеи не так-то просто: ядра-то в стоядерном процессоре будут куда проще и медленнее, чем в таком же по цене 4-8 ядернике! А софта, по прежнему, нету… потому “оно” и не продаётся.

                      Переход на аналоговые или, там, квантовые, вычисления — тоже ведь Windows не ускорит, ведь так?

                      Ну а с нуля можно и под сто ядер написать код и под квантовый компьютер… но там не будет быстрого однопотока. Потому что условный Windows там не запустится, а без запуска Windows вам и однопоток не нужен суперскоростной.


                      1. DistortNeo
                        07.12.2021 19:54

                        По кругу: более тяжёлый софт требует более быстрого однопотока, более быстрый однопоток позволяет не думать о том, чтобы менять парадигму работы софта.

                        А какая, по-вашему, должна быть парадигма работы софта? Лично я особых перспектив здесь не вижу на текущем железе: переключение потоков и синхронизация дорого обходятся.


                      1. khim
                        07.12.2021 20:00

                        А какая, по-вашему, должна быть парадигма работы софта?

                        Гибкой. Банально создайте 100500 асинхронных задач, отдайте executor'у (как это по русски?), он либо запустит 100500 потоков (если у вас 100500 ядер), либо будет из по очереди запускать на тех 2-4-8, что у вас есть.

                        Лично я особых перспектив здесь не вижу на текущем железе: переключение потоков и синхронизация дорого обходятся.

                        Для этого, собственно, и придумали пресловутый async/await.

                        Только разработчикам не объяснисли, нафиг они нужны, в результате они всё пихают в одну, типа асинхронную, функцию, а потом удивляются, почему нифига не параллелится.


                      1. DistortNeo
                        08.12.2021 11:43

                        Проблема не распараллелить. Проблема в накладных расходах при создании мелких задач.


                      1. khim
                        08.12.2021 15:15

                        Ну дык для этого асинхронные функции и завезли во все языки, которые рядом с производительностью валялись (C, C++, C#, Java, Rust).

                        Если не заводить для каждой мелкой задачи поток, то что у вас там будет из накладных расходов? Выделение памяти да пара атомарных обращений к памяти на задачу?

                        Если раскидать задачи хотя бы по 4м ядрам (а это есть уже даже на самых бюджетных бюджетниках), то уже будет выигрыш, а если ядер будет больше — выигрыш будет больше.


                  1. Dmitry3A
                    07.12.2021 17:13

                    Не нужно. 5Ghz — это частота, на которой свет, в вакууме, проходит жалкие 6 сантиметров.
                    Про частоту понятно. Я имел в виду что-то сильно поновее, например подобие аналогового сигнала, когда мы сможем уйти с двоичной логики. Понятно что звучит неправдоподобно, но нету фундаметальных перпятствий как со скоростью света. Это как с сингулярностью, пока за горизонт не зайдёшь, даже сложно представить что возможно и как дело повернётся.

                    Сапожник без сапог, блин.
                    Согласен, но есть всякие числодробилки и дата анализаторы которые вполне себе оптимизированны.
                    Там существенная часть ускорения — это не ускорение однопотока, как такового, а SSE и AVX.
                    Ну не сильно важно как. Паралельность внутри одного CPU это возможное направление движения.
                    А про что это? Про испытание терпения пользователя?
                    Про орды программистов красящие губной помадой свинью. Веб стандарты например даже rich text editor не поддерживают или функциональность меню. Приходится изобретать и получается как получается.

                    В конце концов выкинут легаси, придут к стандартизации и реализуют на уровне браузера набор более высокоуровневых компонентов, тогда всем полегчает. И производительность сразу взлетит. Ну и например оптимизацию JS сильно улучшили за последние 20 лет. Пройдёт ещё 20 лет, может быть и не надо будет делать 90% того что сейчас делает браузерописатель.
                    При этом разрыв между тем что могло бы быть, если бы программисты не прятали голову в песок и тем, что мы имеем в реальности всё растёт и растёт
                    Всё случится. Со времени более менее реального появления многоядерности в массах, наверное лет пятнадцать всего прошло. Пройдёт еще 20 и какой-нибудь новый гугл выстрелит и все скажут — «а что так можно было?»


    1. moooV
      06.12.2021 06:35
      +4

      У меня и многих коллег дома такие и 64гб оперативки (я бы даже сказал что это минимум - часто свопит, комфортно становится только на 128), и NVME диски, например. Работаем с графикой, причем все задачи - именно CPU: рендер в Arnold, симуляции в Houdini, симуляции во всяких Marvelous Designer, реконструкции в Reality Capture, композ в Nuke, итд.

      Забиваются все ядра под завязку и просят ещё. Один коллега купил домой тредрипер, другой - вообще эпик.

      Потому что удаленка и работать через тимвьювер на офисных компах некомфортно.

      А вот видеокарты у нас - дело последнее, для работы они особо не нужны. Можно сидеть хоть на какой заглушке лишь бы она dx12 поддерживала.


      1. kxl
        06.12.2021 09:16
        +2

        а офисные на дом не выдают ? :)


        1. moooV
          06.12.2021 09:58
          +2

          Выдавали, но они огромные, почти фуллтауэры. А если учесть что работаем вдвоем с женой, то вся комната была заставлена компами и мониторами (у меня три монитора, у жены — два и огромный Wacom Cintiq), как в киберпанковых аниме.
          Ну и жили тогда в квартире в 40м2, было очень тесно с таким сетапом. В общем, отдали назад компании их после первого месяца мучений.

          Потом переехали в 75м2 и я собрал в корпусе Ncase M1 — маленький, удобный, живет в икеевской стойке.

          Как-то так это выглядит







          Ну и плюс иметь дома мощную технику тоже не помешает — использую на всю катушку: от обработки фоток и 3д работ для личного портфолио до экспериментов с нейросетями и всякими идеями для стартапов (которые тоже связаны с 3д).


          1. drWhy
            06.12.2021 10:24
            +1

            «Как-то так это выглядит»
            Кажется, такая чашка называется «сиротская».
            Фуллтауэр, кстати, можно было раздвоить-растроить, под Windows например Астер весьма удобна, Linux сам умеет вроде бы.


            1. moooV
              06.12.2021 11:36
              +7

              Кажется, такая чашка называется «сиротская».

              Не знал, спасибо!

              Фуллтауэр, кстати, можно было раздвоить-растроить

              А вот раздваивать компьютер не нужно, ресурсов и на одного человека часто впритык или хотелось бы больше чем есть. Запустил рендеринг/симуляцию/реконструкцию — так параллельно браузер и музыка лагают (на i9-7980XE) а оперативка свопит, какое там второму человеку нормально работать.

              Linux сам умеет вроде бы

              Линукс — вообще не вариант и не рассматривается. У нас много программ для графики которые лучше всего работают под виндой или вообще есть только под нее (Zbrush, например) плюс много внутреннего софта который тоже win-only.

              Есть, конечно, версии под линукс для некоторых вещей (Maya, Houdini, Nuke, например) — но это того не стоит тк графический стек в линуксе до сих пор ужас и треш плюс проблемы с дровами нвидии (использовать не нвидию — тоже не вариант). 20 лет прошло, а воз и ныне там.

              Плюс еще в проектах часто присутствуют внутренние сетевые пути, которые, понятно, тоже вида x:\\projects\hueta и их надо будет процедурно переписывать на локальные юниксовые а при сохранении — переписывать назад.

              Спрашивается, нафига такое счастье — лицензии-то все от компании на весь софт, все лицензионное.

              Так что вот так. ????


  1. balu736
    06.12.2021 06:55

    Издание notebookcheck опубликовало статью о новом китайском ноутбуке - "Huawei Qingyun L420 with 5 nm Kirin 9006C SoC turns up as the incoming successor to the ARM-based L410 laptop". Информации на целую страницу. Желающие могут ознакомится.


  1. tommycd
    06.12.2021 13:52

    Звучит как-то совсем подозрительно шикарно. Видимо в следующем году узнаем, так ли это


  1. Dabbuger
    08.12.2021 14:11

    А что толку от всех этих процессоров, Word и AutoCAD как тормозили 20 лет назад так и будет тормозить в будущем.