DeepSeek — очередной квантовый скачок в развитии AI / forpes.ru

Главная
DeepSeek — очередной квантовый скачок в развитии AI

DeepSeek — очередной квантовый скачок в развитии AI +151

26.01.2025 13:47

Squirrelfm 339 116000 Источник

深度求索, запомните эти слова.

Пока скептики в области ИИ продолжают размышлять о том, что ИИ никогда не обретёт сознание и останется лишь имитатором интернета, небольшая китайская компания совершила прорыв. Они создали думающую модель всего за $6 млн (меньше, чем зарплата некоторых инженеров ИИ в Кремниевой долине, и 2% от стоимости ближайшего конкурента), которая не уступает OpenAI o1, являясь при этом открытой и доступной по цене - $2,50 за обработку миллиона токенов в самой дорогой модели ChatGPT против $0,14 у DeepSeek. Доступ к API не требует VPN и другого геморроя и обходится в разы дешевле, мы уже переключили часть проектов с других моделей на DeepSeek.

Попробуйте сами — эта модель настолько хороша, что вероятно, превзойдет в способности размышлять многих читателей этой статьи.

Всё это произошло, пока американские гиганты, вроде Google, ковыряли в носу (как и компании в Европе и у нас кстати тоже) тратили миллиарды, что вызвало панику в отрасли. DeepSeek добилась успеха, оптимизируя железо и позволив модели обучать себя самостоятельно.

Некоторые выражают опасения о приватности и реальной стоимости разработки, считая, что проект косвенно финансируется КПК. Пока доказательств нет, но я подозреваю, что в этом есть доля правды (читайте далее).

Этот скачок вызвал настоящую истерику в Кремниевой долине. Корпорации экстренно собирают совещания, ведь Китай неожиданно вышел в лидеры, обойдя санкции США, и гонка ИИ теперь в самом разгаре. Как я говорил ранее, США не могут позволить Китаю доминировать в ИИ. Учитывая, что нынешнее правительство США состоит из технократов вроде Маска, стоит ждать ответа, аналогичного запуску Спутника в СССР — триллионы долларов будут вложены в эту гонку.

Что известно о DeepSeek?

Акт 1. Ботаники, случайно накопившие гору GPU

История начинается не в гараже Кремниевой долины, а в мире финансов — где математики печатают деньги, пока мы спорим о биткоинах. High-Flyer Quant, китайский хедж-фонд, основанный в 2015 году Ляном Вэньфэном. В 2021-м, до санкций США, он закупил GPU «на всякий случай». Их использовали для анализа рынка, но большую часть времени мощности простаивали, и Лян решил занять их чем-то интересным.

К 2021-му у High-Flyer было 10 000 GPU — достаточно для съемок «Трансформеров» в реальной жизни. Говорят, глава NVIDIA прислал Ляну открытку с надписью: «Спасибо за яхту». Но вместо прогнозирования мемных акций Лян решил построить AGI.

В 2023-м High-Flyer выделил ИИ-направление в DeepSeek. Акционеры недоумевали («Простите, мы вместо зарабатывания денег нам на новую яхту занимаемся чем???111»), но Лян настаивал: «Представьте ChatGPT, но дешевле… созданный теми, кто не уходит из офиса даже чтобы поспать».

Ранние дни DeepSeek — мастер-класс по хаосу. Офисная культура - сотрудники кодили по 18 часов в сутки, подпитываясь только bubble-tea и экзистенциальным страхом.

Найм сотрудников - «У вас есть PhD? Отлично. А Вы знаете, что такое work-life balance? Печально.

Финансирование - полностью за счет прибыли High-Flyer. Ничто так не кричит «стратегия», как ставка на AGI на деньги хедж-фонда.

Акт 2. Инженерная магия: как обойти санкции

Пока США спорили об этике AI, DeepSeek избрала подход «Подержите мой смузи»:

Прорыв в архитектуре: Multi-head Latent Attention (MLA) — метод, сокративший стоимость обучения на 90% за счет игнорирования 95% данных. Гениально или лениво?
Модели MoE: DeepSeek-V2 с 236 млрд параметров обошёлся дешевле, чем сезон Stranger Things. Инженеры отметили это покупкой новых GPU (дядя Илон одобряет такой уровень упоротости).
Обучение с подкреплением: Модели серии R1 учили математику методом проб и ошибок, как дети с PhD. Результат? Уровень GPT-4, но на 95% дешевле.

В мае 2024-го DeepSeek шокировала ценами на API: 2 юаня за миллион токенов. Перевод: «Мы разорим ваш стартап за стоимость упаковки соевого молока».

Последствия:

Alibaba и Tencent режут цены быстрее, чем уличные торговцы убегают от проверок.
В Кремниевой долине — паника. OpenAI уже объявил что o3 mini будет включен в бесплатную подписку и тихо обновляет прайсы, бормоча «Это нечестно».
Цукерберг выложил ответ на сайте своей экстремистской организации, от том что компания планирует сделать, учитывая что DeepSeek превосходит LLama в тестах.

А что делает DeepSeek? Выпускает все в open-source. И это пока в Долине размышляют: «Лицензия MIT? А мы вообще можем это запатентовать?!». Ян Лекун назвал это «the most elegant middle finger to proprietary AI».

Конечный результат немного шокирует:

Акт 3. Споры

В интернете сразу появилась целая куча идиотов, которые сразу начали ныть, что DeepSeek использовать не стоит, потому что он предвзят. «Посмотрите — он не отвечает, кому принадлежит Тайвань» или «Посмотрите, он не отвечает на вопросы про Си Цзиньпина». Подобная слепота просто пугает. Их должно волновать только то, что именно китайцы разработали эту модель, иначе скоро всем нам самим придётся говорить, что Тайвань принадлежит Китаю и возможно даже на китайском (хотя мне лично это совершенно по барабану).

Также вызывает большое сомнение красивая история изложенная выше, что небольшой фонд с небольшими средствами смог сделать такой прорыв. Далеко не исключено что правительство Китая косвенно помогло компании. Но, в конечном итоге, это не важно, важен сам результат.

Эпилог: AGI or bust

Создаст ли DeepSeek AGI? Бог его знает, но они уже доказали: в гонке ИИ побеждает не тот, кто тратит больше, а тот, кто целеустремленнее и упоротее — как Маск уже неоднократно доказал в разных отраслях, типа ракетостроения и электромобилей. То, что модель полностью открыта, несомненно даст значительное ускорение всей отрасли. У нас уже кончаются бенчмарки для AI, чтобы доказать что он не способен думать. Недавно даже ввели финальный бенчмарк.

Я думаю, что отрицание реальности уже более не является разумным курсом для нас.

Задавайте свои ответы в комментариях.

祝大家一切顺利！

Комментарии (339)

ion2
26.01.2025 14:00
#27835304
Интересно, когда проверка правописания станет достаточно умной, чтобы определять такие ошибки: скачек - скачок, святить - светить и т.п.
1. grvelvet
  26.01.2025 14:00
  #27835306
  Андройд, бачек, через чур
  1. perfect_genius
    26.01.2025 14:00
    #27836830
    К "андройд" придётся привыкать так же, как когда-то привыкли как к "тайне" - оно было "таина" ("таинственный").
    
    flx0
    26.01.2025 14:00
    #27838214
    Правильно! А эти ваши математики пусть привыкают к монойдам, гиперболойдам и эллипсойдам!
    
    ManulVRN
    26.01.2025 14:00
    #27838964
    Гиперболойд инженера Гарина )
    
    psman
    26.01.2025 14:00
    #27839838
    Гарена
    
    numark
    26.01.2025 14:00
    #27841212
    Обязательно, будет и "Гарен" в какой-то момент. Прям в тот момент, как новое поколение массово на чаты жипити и дипсики перейдет. Я читал что современные школьники домашку скармливают ChatGPT (не разбирая даже, сложный для них это вопрос или нет). Просто запихивают туда все подряд, а потом копируют выдачу.
    
    Scander
    26.01.2025 14:00
    #27845014
    Гарен это мужик с мечом из лиги легенд
    
    SystemOutPrintln
    26.01.2025 14:00
    #27845548
    Демасия!
    
    artemisia_borealis
    26.01.2025 14:00
    #27841002
    В Тайланде к ним уже привыкли скорее всего
    
    rexen
    26.01.2025 14:00
    #27846996
    и любимому "нижнему подчёркиванию"
    
    blind_oracle
    26.01.2025 14:00
    #27838364
    Зачем? Слово "андройд" тупо тяжелее произносить.
    
    plFlok
    26.01.2025 14:00
    #27838704
    а ещё "андройд" не вписывается в схему словообразования:
    - астероид
    - европеоид, монголоид, негроид
    - эллипсоид
    
    и якобы андройд, при том что альтернатива - гуманоид.
    
    так что оставьте андроида андроидом)
    
    perfect_genius
    26.01.2025 14:00
    #27839610
    Я то за, чтобы русский был стройным. Но всегда решает толпа, а не эксперты, и потом попадает в словари.
    
    Например, "брелоки" уже почти не встретить, и в Википедии уже есть
    
    «брелоки», однако в разговорной речи также используется форма «брелки»
    
    Т.е. начинает приниматься нормой.
    
    FreeNickname
    26.01.2025 14:00
    #27842010
    Потому что конкретно "брелоки" – идиотское слово, и полностью выбивается из всего остального русского языка. У нас же стрелки, а не стрелоки. Помазки, а не помазоки. Закутки, а не закутоки.
    
    А вот за андройд и биткойн я буду кусаться, да.
    
    perfect_genius
    26.01.2025 14:00
    #27842238
    Не идиотское, просто не вписывающееся в русский язык.
    
    Я случайно откопал вот что:
    
    Слово "замок" произошло от древнегерманского слова "zammak" или "zammuk", которое в свою очередь имеет корни в готском "samaks" и праславянском "zamek".
    
    Т.е. любители "брелоков" должны бы после этого писать "замоки".
    
    FreeNickname
    26.01.2025 14:00
    #27842244
    Любопытно) Да, я понимаю, что наверняка существует историческая причина, по которой "брелоки" – это правильно. Но конкретно это слово не вписывается как-то совсем уж вопиюще*) И вместо "легализации" "докУментов" с "йогУртами" я бы лучше им занялся, а докумЕнты и йОгурты не трогал)
    
    *а вот любопытно, можно ли говорить "совсем уж вопиюще"? Или это тавтология в духе "самый идеальный"? Вопрос полуриторический) Это я к тому, что я не лингвист)
    
    KGeist
    26.01.2025 14:00
    #27843750
    Мало кто знает, но что касается истории слов, в интернете много псевдонаучной чуши.
    "Древнегерманского" языка нет, есть прагерманский. В прагерманском существительное не может кончаться на -k, тут должен быть -ks хотя бы (не хватает окончания).
    
    В готском нет слова samaks. В праславянском не может быть формы zamek, она не вписывается в фонологию. Как минимум, ожидалось бы zamъkъ, т.к. формы на -ek это чисто западнославянские формы (в восточнославянских -ок, а в южнославянских типа сербского -ak).
    
    Реальная этимология такова: русское "замок" (с ударением на первом слоге) заимствовано из польского zamek (где тоже ударение на первом слоге). Польское zamek однокоренное нативному русскому "замок" (с ударением на втором слоге) и родственно глаголу "замкнуть" (закрыть). Польский zamek является калькой с средненемецкого slōʒ (откуда современное немецкое Schloss), что само по себе является калькой с латинского clūsa. Смысловое изменение: "запор", "закрытие" => "форт", "укрепление".
    
    В польском zamek в косвенных падежах: zamku, zamki и т.п. Так что сравнение с брелоками не совсем корректное :)
    
    Synoecium
    26.01.2025 14:00
    #27845858
    Польский zamek является калькой с средненемецкого slōʒ
    
    не понял с чего это "замэк" стал калькой "шлос", нисколько не напоминает ни по звучанию, ни по буквам
    
    Neusser
    26.01.2025 14:00
    #27846134
    А калька и не должна напоминать ни звучание, ни звук. Калька это перевод слова по частям. Пример кальки: Vor-stell-ung – пред-ставл-ение. Или sky-scraper – небо-скрёб. В случае с "замок" калька семантическая, и заключается в том, что слово zamek означающее "запорный механизм" стало по аналогии с немецким словом Schloss означать и тип укрпеленного здания (у немецкого Schloss оба значения - зАмок и замОк).
    
    KGeist
    26.01.2025 14:00
    #27847404
    "Калька" это когда заимствуется смысл, идея, а не само слово. Типа дословный перевод. В средненемецком sloz значило и "замОк", и "зАмок". Поляки переняли эту идею, использовав нативное славянское слово zamek. А в русский мы уже заимствовали (не калька), т.к. зАмок это чисто польское ударение (но суффикс -ок русифицировали). В современном сленге, например, есть калька "он не может в Python" - калька с англ. мемной фразы "he cannot into". Слова все русские, а фраза скалькирована.
    
    perfect_genius
    26.01.2025 14:00
    #27847312
    Т.е. это похоже на нейросетевой бред?
    
    KGeist
    26.01.2025 14:00
    #27847412
    Ну вот в сети есть много бесполезных SEO-сайтов про якобы происхождение фамилий, но генерят там полную ахинею (для редких фамилий, где корень неочевиден), чтобы трафик шёл. Дешевле сгенерировать рандомную чушь, чем делать реальный анализ.
    
    Demetrio77
    26.01.2025 14:00
    #27845176
    А нидерландское zondek (навес от солнца) перекочевало в русское "зонтик", ассимилировалось, со временем "-ик" стало восприниматься как приставка и получилось русское "зонт".
    
    moviq
    26.01.2025 14:00
    #27846278
    суффикс, кажись
    
    Saugardas
    26.01.2025 14:00
    #27848078
    Ещё пример подобного слова - фляжка. Заимствовалось из немецкого Flaeschchen / верхненемецких fleske как "фляшка", потом "фляжка" и -ка стало восприниматься уменьшительным суффиксом, что породило слово "фляга"
    
    Yuuri
    26.01.2025 14:00
    #27843726
    А за блокчейн или войд?
    
    FreeNickname
    26.01.2025 14:00
    #27845358
    Кстати, любопытно. Я точно проверял транскрипцию, и в транскрипции, которую я смотрел, были различные звуки для "и" и "й". Возможно, это была старая транскрипция (20+ лет). Но некоторые из транскрипций, что я нахожу сейчас, везде используют "ɪ". Для "chain" я нашёл два варианта транскрипции – с "tʃeɪn", что подтверждает вариант с "чеин", и "ˈchān", что уже может иметь право на собственное произношение. А вот с void все, что я нахожу сейчас, действительно сходятся на произношении, идентичном "андроиду")
    
    ...но "воид" выглядит по-дурацки, поэтому я так писать, конечно, не буду)
    
    Надо будет потом глянуть старые бумажные словари. И любопытно, что с тех пор поменялось, и как поменялась запись транскрипции.
    
    maksa
    26.01.2025 14:00
    #27845188
    Конечно, выбивается. Помигайте капслком, и ещё не забудьте о морлках.
    
    Просклоняйте слова поток, урок, сток, блок, шок (афтешок).
    
    FreeNickname
    26.01.2025 14:00
    #27845288
    Хорошее замечание) Но не совсем.
    
    ~~Урок~~, сток, блок, шок – односложные слова, если убрать из них одну гласную, ничего не останется, и это будет непроизносимо. Поэтому они так и склоняются.
    
    "Поток" отличается от "брелок", т.к. состоит из приставки и корня, и корень падает в категорию "урок/сток/блок...", а "брелок" – чисто из корня. Поэтому "брелок" ближе к "стрелок", чем к "поток". Что подразумевает, конечно, что корень должен бы быть "брел", а не "брелок". Ну, штош)
    
    "Капслок" – это на самом деле изначально вообще два слова, второе из которых попадает в категорию "уроков", "стоков" и т.д. В русском иногда сливается в одно. Да и то не всегда, некоторые пишут "капс лок", как показывает беглый поиск.
    
    Разве что "афтершок". Но тут тоже то ли два слова, как капс лок (хотя в английском тоже одно), то ли корень и приставка, как "поток".
    
    UPD: "урок – односложное слово" (c) FreeNickname, 2025
    
    maksa
    26.01.2025 14:00
    #27846524
    Урок, как и пророк (и оброк, и отрок) вроде бы происходят от глагола речь (говорить, изрекать), так что в каком-то смысле замечание про односложность справедливо. Восток тоже этимологически представляет собой приставку во- с корнем -сток-. Но есть и чистые примеры двусложных слов без приставок: ездок, ходок.
    
    Другое заиствованное слово на -ок, в котором при склонении полностью сохраняется основа, это альпеншток.
    
    FreeNickname
    26.01.2025 14:00
    #27846584
    Интересно, спасибо)
    
    Возможно, "брелоки" так агрессивно выбивается тем, что двусложные слова, похоже (может быть и нет, это новая мысль), либо склоняются с заменой -ок- на -к- (стрелкИ, поводкИ и т.д.), либо после склонения имеют ударение на последний слог: ездокИ, ходокИ. БрелОки же "ни туда, ни сюда".
    
    То есть либо они должны были бы быть "брелокИ", либо "брелки". Возможно, Если развить эту мысль дальше, станет понятно, почему победил именно второй вариант. Кстати, может быть (просто мысли вслух) потому что здесь -ок- – это не суффикс, поэтому переставить ударение на "И" также легко не получается, ведь -о- является основополагающей частью слова. Поэтому ударение после склонения должно бы остаться на -о-, но из-за того, что во всех (?) остальных подобных словах ударение меняется, оно выглядит не на своём месте и вызывает диссонанс. Из-за чего от него подсознательно стараются избавиться, просто "запихнув" слово в другую категорию к стрелкАм и поводкам, так оно звучит гармоничнее.
    
    rexen
    26.01.2025 14:00
    #27847002
    А что будем делать с родом слова "кофе"?
    
    perfect_genius
    26.01.2025 14:00
    #27847306
    Вы проспали, что оно теперь и в среднем роде?
    
    FreeNickname
    26.01.2025 14:00
    #27847396
    Самое смешное, что, насколько я знаю, исторически "кофе" среднего рода) Раньше было два слова – кофе и кофий. Не помню, какое из них что означало. Возможно, одно означало растение, другое напиток или что-то в этом роде. Кофе среднего рода, кофий мужского. Со временем "кофий" ушёл в небытие, а мужской род от него остался, и теперь имеем кофе мужского рода.
    
    rexen
    26.01.2025 14:00
    #27848418
    Лебедев об этом писал ещё в 2007-м: § 138. Кофе — оно
    
    SergTsumbal
    26.01.2025 14:00
    #27842376
    Брелки уже норма, как звонить. Язык не статичен, он развивается и меняется
    
    SomebodyElse
    26.01.2025 14:00
    #27843132
    Не звонит, а звонит
    
    ZhetoN
    26.01.2025 14:00
    #27840766
    исправил:
    
    астеройд
    
    европеойд, монголойд, негройд
    
    эллипсойд
    
    теперь все вписывается )
    
    Neusser
    26.01.2025 14:00
    #27840778
    Еще геойд и руберойд. Теперь все чотко!
    
    grvelvet
    26.01.2025 14:00
    #27843164
    Руберойд видел на ценнике,
    
    exTvr
    26.01.2025 14:00
    #27845140
    Рептилойд тащил рулон руберойда, выйгранный в Тайланде у андройда в карты.
    
    Komrus
    26.01.2025 14:00
    #27845326
    Я на ценнике видел даже "Грейте фрукты" :)
    А на прилавке за этим ценником лежали вполне симпатичные грейпфруты...
    
    vedmed007
    26.01.2025 14:00
    #27845366
    Фрукты Грейпа, про них еще фильм сняли.
    
    snuk182
    26.01.2025 14:00
    #27846776
    Кристофер ЛлоИд (актер)*
    
    *на правах иронии :)
    
    perfect_genius
    26.01.2025 14:00
    #27839580
    Зачем?
    
    Ну можете не привыкать, ваше дело. Я про то, что это станет нормой и войдёт в словари, ваши дети и внуки уже будут писать так.
    
    blind_oracle
    26.01.2025 14:00
    #27839630
    Ну, вам виднее конечно, как будет потом
    
    perfect_genius
    26.01.2025 14:00
    #27839648
    Я сужу по тому как много молодёжи пишет "андройд". Вряд ли они вдруг возьмут и перестанут так писать.
    
    t3n3t
    26.01.2025 14:00
    #27841106
    Много молодежи и надцать лет назад писали "андройд". Теперь они выросли и продолжают это делать.
    
    TonyEscobar
    26.01.2025 14:00
    #27842772
    Только теперь есть уже молодежь нынешняя, и молодежь "надцатилетней давности", которые зачастую уже вполне взрослые дяди и тети. И многие из обоих срезов поколений пишут "андройд". Вполне закономерно, что и следующее поколение молодежи может сохранить традицию. А там посмотрим, какой вариант останется общепринятым вариантом
    
    logran
    26.01.2025 14:00
    #27844014
    Ага. Те самые люди, которые не видят разницы между словом "война" и "воин" и во множественном числе у них всё "войны", и фразу "войны околнчательно разорили эту деверню" в итоге трактуй как хочешь...
    
    Neusser
    26.01.2025 14:00
    #27845532
    Я из-за таких людей долгое время не был уверен в правильном смысле названия "Звездные войны". То ли так и есть правильно, то ли это писал неграмотный.
    
    engine9
    26.01.2025 14:00
    #27840056
    Язык очень динамичная штука и заметно меняется за десятилетия. Часто, те кто топят за "чистоту русского языка" выставляют себя невеждами. Потому что любой язык это нагромождение заимствований, исторических нелепостей и атавизмов.
    
    Вот есть отличный канал на ютубе, вначале манера подачи может отпугнуть, но содержание — бриллиант.
    
    Rive
    26.01.2025 14:00
    #27841358
    Скорее всего это прямая калька с фонетики американского диалекта английского языка:
    
    /ˈænˌdɹɔɪd/ (слышится примерно как "эйндройд")
    
    Voldemaar
    26.01.2025 14:00
    #27838688
    Тайланд
    
    kryvichh
    26.01.2025 14:00
    #27839162
    И где тут латинское окончание "-ид"?
    
    perfect_genius
    26.01.2025 14:00
    #27839612
    Что тут? Должно быть "Таиланд", "таицы", но приняли с Й?
    
    piuzziconezz
    26.01.2025 14:00
    #27838996
    тАина таинА тАина таИна тАйнана... Прастити.
  1. sa1m0nn_fast8
    26.01.2025 14:00
    #27841022
    АндроЕд))
    https://medium.com/@turbojedi/почему-мой-телефон-не-обновится-до-нового-андроеда-e4cd5fa3fa85
  1. DM_76
    26.01.2025 14:00
    #27842036
    Андроэд
1. Squirrelfm Автор
  26.01.2025 14:00
  #27835320
  исправил