Что такое DeepSeek и на что способна китайская нейросеть, из-за которой OpenAI снизил цену на ChatGPT / forpes.ru

Главная
Что такое DeepSeek и на что способна китайская нейросеть, из-за которой OpenAI снизил цену на ChatGPT

Что такое DeepSeek и на что способна китайская нейросеть, из-за которой OpenAI снизил цену на ChatGPT +19

31.01.2025 06:57

Xcom-shop 11 53000 Источник

Стандартный сценарий выхода новой нейросети обычно включает в себя громкие заявления, масштабную рекламную кампанию и последующее разочарование пользователей. Так было с Apple Intelligence, Galaxy AI и даже Google Gemini. Но китайская DeepSeek нарушила привычный ход вещей. Этот чат-бот удивил всех не столько своими возможностями, сколько впечатляющей доступностью. Именно он показал, что эффективно работающая нейросеть может быть бесплатной. В результате западные IT-гиганты внезапно столкнулись с серьезным конкурентом, который одним фактом своего выхода уже устроил на американском фондовом рынке “Черный понедельник”. Если вы еще не изучили DeepSeek самостоятельно, под катом подробный разбор практики работы с новинкой.

Что такое DeepSeek и как он устроен

DeepSeek - это нейросеть, разработанная одноименной китайской компанией. В отличие от большинства остальных решений, представленных на рынке, ее преимущество заключается в том, что пользователям она доступна абсолютно бесплатно практически без ограничений по количеству и тематике запросов. Нейросеть пишет тексты, анализирует документы, программирует и делает многое другое, не требуя покупать подписку.

По словам разработчиков, это стало возможным благодаря эффективной модели обучения нейросети, которая оказалась существенно дешевле подхода конкурентов. В отличие от того же ChatGPT, DeepSeek строится на архитектуре "mixture of experts". Ее суть заключается в том, чтобы обрабатывать данные раздельно, применяя ту или иную экспертность только в соответствующей области.

Такой подход позволил DeepSeek обучить свою модель всего за пару месяцев на относительно скромном кластере из видеокарт NVIDIA H800. Для сравнения: другим компаниям на это требуются многие месяцы и целые дата-центры. В результате на запуск чат-бота компании потребовалось примерно в $5.6 миллионов – это как минимум в 20 раз меньше, чем тратят конкуренты.

Конечно, тут есть один нюанс, о котором многие предпочитают не говорить. Никто не может с уверенностью сказать, что за этой скромной суммой не стоят куда более серьезные инвестиции от китайского правительства. Но факт остается фактом – нейросеть работает, и работает весьма неплохо.

Как пользоваться DeepSeek

Пользоваться DeepSeek можно как в браузере, так и в мобильном приложении для iOS и Android. Интерфейс чат-бота очень сильно напоминает таковой у ChatGPT, поэтому разберетесь.

Ничего сложного в интерфейсе DeepSeek нет

Главное – зарегистрироваться, но учитывайте, что из-за наплыва пользователей с этим могут быть проблемы. В принципе, писать запросы можно и так, но тогда не сохранится история, а нейросеть не сможет полагаться на контекст предыдущих обращений.

Интерфейс DeepSeek и правда устроен очень просто. Элементов здесь не так много:

Сбоку слева находится список ваших предыдущих диалогов и кнопка создания нового чата, а также иконка профиля;
По центру – строка ввода запросов;
Под ней – кнопка DeepThink, активирующая модель R1, кнопка Search для активации поисковика, и скрепка для добавления сторонних файлов.

Языковые модели DeepSeek

DeepSeek реально хорош в задачах, в которых надо думать

На данный момент DeepSeek предлагает две ключевые языковые модели: DeepSeek-R1 и DeepSeek-V3. V3 построена на архитектуре Mixture-of-Experts (MoE) и оптимизирована для многозадачности – от программирования до математических вычислений и работы с разными языками. При обработке каждого токена активируется всего 37B параметров из общих 671B, что делает модель более эффективной с точки зрения использования ресурсов.

DeepSeek R1, напротив, специализируется на логическом мышлении и решении сложных задач. Модель использует архитектуру с оптимизированным обучением с подкреплением (Reinforcement Learning), что позволяет ей эффективно справляться с задачами, требующими глубокого анализа и рассуждений. R1 имеет меньший диапазон параметров – от 1.5B до 70B, но за счет специализации показывает впечатляющие результаты в образовательных приложениях и исследовательских инструментах.

Ключевые преимущества DeepSeek перед ChatGPT:

Стоимость: $2.18 у R1 против $60 за миллион токенов у o1
Открытый исходный код и возможность локального запуска
Доступ к актуальным данным через интернет
Эффективная обработка технических и научных текстов
Глубокий анализ документации и программного кода

Сравнение возможностей моделей:

DeepSeek-R1: Специализируется на логическом выводе, аналитике и программировании
DeepSeek-V3: Эффективна в обработке больших объемов данных и мультиязычных задачах
ChatGPT-4o: Лидирует в естественном общении и мультимодальных возможностях

Давайте посмотрим, как отличаются ответы, данные DeepSeek-V3 и DeepSeek-R1.

Модель DeepSeek-V3 сработала быстро и четко. И даже не ошиблась

А вот как работает модель R1:

Ждать ответа от модели R1 придется дольше, но тут нейросеть реально думает и рассуждает, поэтому спрашивать ее о глупостях, как я, не стоит

Локальный запуск DeeSeek и открытый исходный код

DeepSeek, в отличие от ChatGPT, – нейросеть с открытым исходным кодом, которая может работать локально. Это позволяет запускать ее на собственном оборудовании, хоть и не без оговорок, и дает ряд существенных преимуществ.

Во-первых, все вычисления производятся на вашем оборудовании, что обеспечивает конфиденциальность данных. Чувствительная информация не покинет пределов вашей корпоративной сети.
Во-вторых, отсутствует зависимость от стабильности интернет-соединения – нейросеть работает даже в изолированной среде.

Открытый код также позволяет кастомизировать модель под конкретные задачи. Разработчики могут адаптировать архитектуру DeepSeek, обучать систему на собственных данных и интегрировать ее в существующие проекты.

При этом производительность будет зависеть от используемого оборудования. Для этого нужен довольно мощный компьютер. По сети ходит видео, где DeepSeek запускают на стенде из 7 Mac mini M4 Pro и одного MacBook Pro M4 Max. То есть мощность нейросети нужна внушительная. Однако работать с ней локально все-таки возможно, а значит, и иметь полный контроль над процессом обработки информации.

Локальная версия поддерживает все основные функции веб-версии: генерацию кода, анализ данных, работу с документацией. При этом пользователи могут тонко настраивать параметры модели, экспериментировать с различными конфигурациями и даже создавать собственные расширения.

Что умеет китайская нейросеть DeepSeek

Теперь что касается возможностей DeepSeek. Нейросеть действительно берет на себя многие задачи, в том числе и задачи по программированию. Она самостоятельно создает базовый код, добавляет обработку ошибок и настраивает первичную структуру проекта, высвобождая тем самым довольно много времени разработчикам.

Возьмем простой пример – создание базового калькулятора на Python. DeepSeek не просто генерирует функции для арифметических операций, но и добавляет проверки на деление на ноль, форматирование вывода и интерфейс пользователя:

Выглядит слишком просто? Возможно, давайте попросим DeepSeek о чем-нибудь посложнее. Например: “Создай базовый REST API на Flask для таск-трекера. Нужны эндпоинты для создания, получения, обновления и удаления задач. В задаче должны быть поля: заголовок, описание, статус и дата создания. Добавь базовую валидацию данных и обработку ошибок.”

Начал неплохо

Продолжаем

Ну, хватит, многим это все равно не нужно

DeepSeek сгенерировал полноценное приложение с продуманной структурой. Приводить его целиком не буду, но знакомый кодер сказал, что в целом результат его бы устроил. Недостатки он, к сожалению, не описал, поэтому не исключено, что человеку просто было неприятно, что ИИ сделал работу не хуже него.

Главное, что в сгенерированном коде каждый элемент выполняет свою задачу: модель Task описывает структуру данных, метод to_dict обеспечивает сериализацию объектов для API, а каждый эндпоинт включает необходимые проверки и обработку ошибок. Что бы это ни значило.

DeepSeek – нейросеть, у которой есть доступ в интернет

Идем дальше. Поиск. В отличие от некоторых других нейросетей, чья база данных ограничена 2022 или 2023 годом, DeepSeek имеет доступ в интернет. Поэтому китайский чат-бот умеет собирать актуальные данные. Именно поэтому его можно использовать в качестве поисковика.

Система не просто предлагает ссылки на источники с ответом на ваш вопрос. Она буквально находит его самостоятельно. Да, точно так же действует и ChatGPT. Но в бесплатном тарифе нейросеть от OpenAI делает это ограниченное количество раз, а китайцы предлагают полный доступ без лимитов.

В части содержимого сайта функция поиска в интернете DeepSeek может помочь с исправлением неточных данных. Например, она проводит факт-чек характеристик устройств, которые я описывал в одной из своих статей, и указывает на допущенные ошибки в спецификациях.

В проверке фактов DeepSeek и правда хорош

Я уже не говорю о том, что DeepSeek можно использовать и просто как поисковик, который сразу выдает нужную информацию, а не предлагает самостоятельно искать ее по нескольким ссылкам.

Жаль, со внешними ссылками DeepSeek пока не работает. Если дать ему ссылку на какую-нибудь статью и спросить, о чем она, по сути он не ответит. Максимум, чат-бот постарается угадать, о чем идет речь на основе URL, но рассчитывать на точный пересказ не стоит.

Работа DeekSeek с документами

С документами DeepSeek работает лучше. Система эффективно извлекает нужную информацию из PDF-файлов, сканов и фотографий документов. Например, при анализе пачки авиабилетов она быстро найдет все данные о рейсах, стыковках и багаже, представив их в удобной таблице.

Ошибок в анализе банковской выписки от DeepSeek нет

В банковских документах система может найти все повторяющиеся платежи, необычные транзакции или изменения в регулярных поступлениях. При этом она группирует расходы по категориям и выявляет тренды в финансовом поведении.

Но особенно полезной может оказаться функция поиска данных в больших документах. Допустим, у вас есть 100-страничный договор, и нужно найти все упоминания определенных условий. DeepSeek не просто найдет нужные фрагменты – она выделит связанные пункты, которые могут влиять на интерпретацию этих условий.

А вот рукописный текст DeepSeek не распознает. Я устроил ему мой обычный тест для нейросетей, попросив рассказать, о чем написано в медицинской справке, но чат-бот считал только напечатанный текст, а написанное от руки не распознал от слова совсем.

Умеет ли DeepSeek рисовать картинки по запросу

Хотя базовая версия DeepSeek не умеет работать с изображениями, компания разработала специальную модель Janus Pro. Это отдельный инструмент, способный как анализировать существующие изображения, так и создавать новые на основе текстовых описаний.

Например, по запросу “A clear image of a blackboard with a clean, dark green surface and the word ‘Hello’ written precisely and legibly in the center with bold, white chalk letters” от Janus Pro можно добиться вот такой картинки, как справа:

Слева - модель Janus, справа - модель Janus Pro

Или вот что будет, если использовать промпт “The face of a beautiful girl”:

Несмотря на текущее ограничение в размере генерируемых изображений (384×384 пикселя), Janus Pro работает как минимум не хуже, а то и лучше, чем DALL-E, у которого до сих пор наблюдаются проблемы с текстами.

Janus Pro использует продвинутый кодировщик SigLIP-Large-Patch16-384, который позволяет эффективно разбивать изображения на части для более детального анализа и качественного синтеза. Как следствие, система учитывает даже мельчайшие детали. Это позволяет избегать разного рода ошибок и неточностей.

Кроме того, Janus Pro позволяет работать с уже готовыми изображениями. Например, вы можете загрузить в чат свои картинки и обучить его на их основе.

Как выход DeepSeek повлиял на рынок и ChatGPT

Запуск DeepSeek стал значимым событием для рынка ИИ-технологий. Китайская нейросеть предложила необычный подход, сделав ставку на открытый исходный код и возможность локального запуска. В результате компании и разработчики получили инструмент, позволяющий развернуть ИИ на собственном оборудовании и полностью контролировать обработку данных по более низкой, чем у ChatGPT цене.

Модели DeepSeek содержат впечатляющее количество параметров и обучены на огромном массиве данных, что сопоставимо с характеристиками последних версий ChatGPT.

При этом китайский чат-бот имеет свои ограничения. Порой система слишком осторожно подходит к определенным моментам. Особенно в отношении политически чувствительных тем, связанных с Китаем. Например, при обсуждении таких вопросов, как события на площади Тяньаньмэнь, независимость Тайваня или положение уйгуров, DeepSeek либо избегает ответа, либо предоставляет информацию, соответствующую официальной позиции китайского правительства.

Но есть и технические недостатки. DeepSeek не всегда корректно работает со ссылками и может выдавать неточности, если не использовать доступ в интернет. Но, как правило, применение этого инструмента нивелирует данный минус.

Да, на фоне ChatGPT китайская нейросеть выглядит как чуть менее универсальное и апробированное решение. Но ее можно смело использовать для технических задач, таких как анализ документации, программирование, поиск в интернете и обработка структурированных данных.

При этом сам факт появления DeepSeek уже серьезно всколыхнул рынок ИИ. OpenAI пришлось снизить цену подписки ChatGPT Plus до $10 за первые три месяца – в два раза ниже стандартной стоимости. А итальянский регулятор, чего-то опасаясь, потребовал удалить приложение из App Store и Google Play якобы из-за подозрений в передаче пользовательских данных в Китай.

И пусть DeepSeek пока не может полностью заменить ChatGPT, Grok или Claude, конкуренция уже делает передовые ИИ-технологии доступнее для обычных пользователей. Так что мы с вами от этого как минимум не проигрываем.

Комментарии (11)

Inomaratadeath
31.01.2025 07:35
#27858492
В принципе, писать запросы можно и так

для РФ, кажется, принципы упразднены
1. AlekseyPraskovin
  31.01.2025 07:35
  #27858912
  Что, простите? Прекрасно зарегистрировался из РФ без ~~кредитов и ипотек~~ VPN и спокойно пользуюсь. Или вы имели в виду что-то иное?
  1. Inomaratadeath
    31.01.2025 07:35
    #27858968
    Иное. Что можно без регистрации общаться с дивом китайским
1. Inomaratadeath
  31.01.2025 07:35
  #27863136
  и что кто-то с чем-то не согласен? может, кто-то в браузере без регистрации смог пообщаться с ИИ? или читают по-диагонали?

Alex-Freeman
31.01.2025 07:35
#27858982
Только что проверил. Как было $20 так и осталось. Заходил с акка который им никогда не платил за подписку. У вас указана разовая цена по промо. Отличный вариант сделать кликбейт "из-за которой OpenAI снизил цену на ChatGPT"

.
1. dilolo
  31.01.2025 07:35
  #27859444
  https://x.com/btibor91/status/1884007987884536112

Что такое DeepSeek и на что способна китайская нейросеть, из-за которой OpenAI снизил цену на ChatGPT +19

Что такое DeepSeek и как он устроен

Как пользоваться DeepSeek

Языковые модели DeepSeek

Локальный запуск DeeSeek и открытый исходный код

Что умеет китайская нейросеть DeepSeek

DeepSeek – нейросеть, у которой есть доступ в интернет

Работа DeekSeek с документами

Умеет ли DeepSeek рисовать картинки по запросу

Как выход DeepSeek повлиял на рынок и ChatGPT

Комментарии (11)

Inomaratadeath

AlekseyPraskovin

Inomaratadeath

Inomaratadeath

Alex-Freeman

dilolo