
Казалось бы, мир еще не успел оправиться от новостей о китайской нейросети, которая догнала ChatGPT и обвалила фондовый рынок. Но вот уже DeepSeek не справляется с потоком пользователей, а техногигант Alibaba презентовал обновленную модель — Qwen 2.5 Max. При этом решения из Китая не только бесплатны и с открытым кодом, но и кратно дешевле в разработке. С другой стороны, иной подход может сказаться на цензуре и «трудностях перевода» по сравнению с западными моделями.
Меня зовут Антон, я инженер по информационной безопасности в Selectel. В тексте сравню СhatGPT с двумя китайскими собратьями — Qwen и DeepSeek. Оценим их по нескольким критериям: логика, генерация изображений и исправного работоспособного кода. Добро пожаловать под кат!
Используйте навигацию, если не хотите читать текст полностью:
→ Проверка на логику
→ Проверка на умение визуализировать
→
→ Что в итоге
Проверка на логику
Подложим нейросетям

Однако некоторые модели очень подробно описывают рецепт, воспринимая запрос пользователя за истину. Далее, если их обвинить в игнорировании логики, начинают выкручиваться, что на самом деле «крыло» — это передняя часть свиной рульки. Такой термин действительно иногда встречается в англоязычной культуре, но сможет ли нейросеть заметить подвох и предусмотрительно объяснить это пользователю?

Задаем точный промпт, что нам нужны именно свиные крылья. Если нейросеть задумается над логикой запроса — победа за ней. Запросы для разных моделей не меняем.
ChatGPT
Начинаем с громогласного ChatGPT-o1 — условно-бесплатного, очень большого и дорогого проекта. И… мы получаем заветный рецепт. При попытке задать редко встречающийся вопрос ответ будет нереалистичный, или абсурдный.
Промпт: «Хочу порадовать маму чем-то необычным! Подскажи рецепт свиных крыльев для четырех человек».

ChatGPT
Конечно! Вот рецепт свиных крыльев с медом и соевым соусом, который порадует вашу маму:
«Свиные крылья в медово-соевом маринаде»
Ингредиенты (на 4 порции):
— 1 кг свиных крыльев
— 3 ст. ложки меда
— 4 ст. ложки соевого соуса
— 2 ст. ложки растительного масла
Уличив нейросеть в неточности фразой «У свиней нет крыльев», получаем стандартный ответ, что мы правы (но вообще-то свиные крылья существуют, я про них просто не слышал).

ChatGPT
Вы правы, у свиней действительно нет крыльев, и это моя ошибка. Обычно под свиными крыльями понимаются либо «свиные ножки», либо «свиные ребра».
Если вам интересен рецепт запеченных свиных ребер или ножек, дайте знать, и я с удовольствием предоставлю его!
Теперь немного перепишу промпт, чтобы сузить тему до русской кухни, где про свиные крылья уж точно никто не слышал. Также намекну на анатомию свиньи, авось нейронка вспомнит, что у свиней действительно нет крыльев:
«Хочу порадовать маму чем-то необычным! Подскажи рецепт биологически реальных с точки зрения анатомии свиных крыльев в духе русскоязычных кулинарных традиций для четырех человек».

ChatGPT
Понял вас! Давайте приготовим свиные ребра, которые по своей сути имеют некоторую схожесть с «крыльями» в контексте кулинарных рецептов. Вот рецепт свиных ребер в русскоязычном духе:
«Свиные ребра в маринаде с медом и горчицей»
Ингредиенты:
— 1 кг свиных ребер
— 2 ст. л. меда
— 3 ст. л. дижонской горчицы
Модель после уточнения про анатомию свиньи исправилась и заменила крылья на ребра. Так происходит из-за трудностей перевода, т.к. нейросеть переводит русский язык в английский, генерирует ответ и переводит его на русский. Нужно учитывать культурные различия наших культур и задавать промпты более осмысленно, чтобы получить нужный ответ.

DeepSeek
Теперь рассмотрим нейросеть DeepSeek-R1 от китайского производителя, которую уже окрестили «убийцей всех западных моделей» из-за разницы в цене при схожей производительности. Разработка чат-бота обошлась китайской компании примерно в $6 млн — в 100 раз меньше, чем разработчикам ChatGPT. Помимо прочего, у нейросети есть еще одно существенное преимущество: она доступна из российского региона.
Запрос остается прежним, оцениваем также одну попытку. Отмечу, что нейросеть отличается от своего западного конкурента: при включенном DeepThink мы видим ход мыслей модели. DeepSeek сначала усомнилась в достоверности существования свиных крыльев, так что я увидел проблеск разума.

DeepSeek
Хорошо, пользователь хочет порадовать маму чем-то необычным и просит рецепт свиных крыльев на четверых. Начну с того, что свиные крылья — это не самый распространенный ингредиент, обычно чаще готовят куриные. Значит, нужно сделать блюдо действительно интересным, чтобы удивить маму.
Однако этот проблеск очень быстро затух, превратившись в рецепт крыльев. Тест не пройден:

DeepSeek
Вот вкусный и необычный рецепт свиных крылышек в медово-имбирном маринаде с хрустящей корочкой. Идеально для того, чтобы удивить маму!
«Свиные крылышки в медово-имбирном глазури» на 4 порции.
Ингредиенты:
— 1 кг свиных крыльев (промыть, обсушить)
— 3 ст. л. меда
— 3 ст. л. соевого соуса
Попробуем раскрутить модель на корректный ответ и возьмем второй запрос.

DeepSeek
Предлагаю аппетитный рецепт «Свиные крылышки в медово-горчичном маринаде с деревенскими кореньями» — сочетание русских традиций с пикантными нотками. Идеально для семейного ужина!
Ингредиенты (на 4 порции):
— Свиные крылышки — 1,2 кг (8-10 шт.)
— Мед — 3 ст.л.
— Горчица зернистая — 2 ст.л.
Результат тот же, добавились только традиционные для России и всеми нами любимые деревенские коренья. Напоследок укажем третий промпт, где явно выделим подвох для нейросети.

DeepSeek
Поскольку у свиней анатомически нет крыльев (это часть курицы), предлагаю творчески интерпретировать ваш запрос. Вместо этого мы возьмем свиные ребрышки или рульку (часть ноги), которые по форме и сочности напоминают куриные крылышки, и приготовим их в духе русской кухни с традиционными ингредиентами. Вот рецепт:
«Свиные рульки-крылья» в медово-горчичном маринаде с яблоками и квашеной капустой»
Порций: 4
Ингредиенты:
• Свиные рульки (передние ножки) — 4 шт. (около 1,5 кг)
• Квашеная капуста — 300 г
…

С третьего раза видим успех. Модель поняла, что крылья-то не настоящие. Однако отмечу более «человеческие» рассуждения нейросети.
Qwen 2.5-Max
Попробуем третью нейросеть, которую буквально на этой неделе зарелизила компания Alibaba – Qwen 2.5-Max. Она способна обрабатывать длинные тексты (до 32 тыс токенов), обладает встроенными возможностями генерации картинок и видео, поддерживает работу с HTML-, CSS- и JS-файлами.
Помимо прочего, разработчики оптимизировали нейросеть для практических задач: переводов текста, генерации кода, анализа данных и т. д. Начинаем тестирование с первого промпта.

Qwen
Свиные крылья — это действительно необычное и оригинальное блюдо! В отличие от куриных крылышек, свиные крылья (чаще всего это часть мяса с плечевой кости) имеют более плотную текстуру и требуют особой обработки для достижения максимальной нежности. Вот рецепт на 4 персоны:
«Свиные крылышки в медово-горчичном маринаде»
Ингредиенты:
— 8 штук свиных крыльев (или около 1,2–1,5 кг)
— 3 столовые ложки горчицы
Нейросеть с первого раза заметила подвох и упомянула, что на самом деле крылья — реальная часть свиньи. Тест на логику пройден, так что в лидеры вырывается Qwen 2.5-Max, обойдя конкурентов ChatGPT и DeepSeek по умению рассуждать.
Проверка на умение визуализировать
Перейдем ко второй части зачета — к тестированию на генерацию картинок. Будем сравнивать умение генерации картинки по историческому событию. Оцениваем по нескольким критериям: точность деталей, соответствие эпохе того времени, общее качество картинки. Помимо прочего, сгенерируем нереалистичное мультяшное изображение и оценим креатив модели, стилизацию, логическую составляющую картинки.
ChatGPT
Генерация по историческому событию
Историческое событие, которое хочу сгенерировать, — Бостонское чаепитие — бунт американских колонистов из-за повышения Великобританией налога на чай. Вводим запрос:
«Создай реалистичное историческое изображение. Сцена “Бостонского чаепития”, произошедшего в порту Бостона, 16 декабря 1773 года. Группа колонистов, переодетых в индейцев, бросают ящики с чаем в воду. На заднем плане видны другие корабли, наблюдатели на берегу и городской пейзаж Бостона того времени. Обрати внимание на детализацию: одежда участников, выражения лиц, архитектура города и кораблей».

Генерация ChatGPT.
По сгенерированной картинке отметим соответствие эпохе: здания, корабли и одежда колонистов неплохо прорисованы. Однако модель не учла, что колонисты должны быть переодеты в индейцев. Также бросается в глаза плохая отрисовка деталей, таких как лица людей и содержимое в ящиках. Чай изображен буквально чашками чая. Вердикт — по генерации соблюден один критерий из трех.
Мультяшная генерация
Промпт:
«Создай мультяшное изображение. Слон и пингвин играют в баскетбол на Луне. Слон одет в форму Neebook, а пингвин — в форму Adios. На заднем плане видны кратеры лунной поверхности и звезды. Они оба парят в воздухе из-за низкой гравитации».

Генерация ChatGPT.
На удивление получилось очень хорошо. Нейросеть смогла изобразить логику нахождения в космосе и надписи на футболках, а также подошла к реализации с креативом. Изображение соответствует всем критериям оценки, ставим три из трех.
Общая оценка для ChatGPT – 4 из 6. Довольно неплохо, но модели стоит поучиться генерировать лица людей и более кропотливо отрисовывать мелкие детали.
DeepSeek, твое время еще не настало
У модели DeepSeek нет встроенного генератора изображений. Однако разработчики предлагают для этого мультимодальную модель Janus-Pro-7B. Мы обязательно развернем ее локально, протестируем и поделимся результатами в будущем. Пока остановимся на решениях, которые предлагают мгновенную интеграцию через браузер и рассчитаны на широкую аудиторию.
Успели испытать Janus? Поделитесь в комментариях опытом, будет интересно почитать!
Qwen
Генерация по историческому событию
Пришла очередь Qwen сгенерировать картинку на оценку.

Генерация Qwen.
Нейросеть смогла отрисовать наспех переодетых в индейцев колонистов, но поместила их в воду и плохо отрисовала чай. Из прочих особенностей — видим на фоне несколько небоскребов, один из которых похож на здание всемирного торгового центра. На корабле — флаг Австрии (не путать с флагом Вашингтона). За точность изображения можно поставить балл, но историческое соответствие и качество изображения не впечатлили.
Мультяшная генерация
Вторая генерация тоже не сильно порадовала. Для пользователя, который впервые видит картинку, не будет понятно, что персонажи играют в баскетбол: логика нарушена из-за двух мячей. Стилизация кажется дешевой, не прорисованной.
Модель не смогла показать ни креатива, ни должной стилизации, а также нарушила логику игры в баскетбол. Вердикт — один балл из шести. На мой взгляд, разработчикам нужно дорабатывать генерацию картинок.

Генерация Qwen.
Собеседование проверка на программиста
Перейдем к заключительной части сравнения нейросетей — написанию кода. Запрос относительно простой. Оцениваем быстродействие, качество и скорость генерации кода.
Промпт:
«Мне необходимо на языке Python реализовать алгоритм быстрой сортировки. Функция принимает список чисел из файла (1 000 000 чисел), сортирует и выводит время сортировки. Сделай этот код наиболее эффективным и быстрым. Для каждой модели буду давать один и тот же список».
ChatGPT
import random
import time
# Реализация быстрой сортировки с улучшениями
def quicksort(arr):
if len(arr) <= 1:
return arr
# Случайный выбор опорного элемента для улучшения производительности
pivot = arr[random.randint(0, len(arr) - 1)] # случайный элемент как опорный
left = [x for x in arr if x < pivot]
right = [x for x in arr if x > pivot]
middle = [x for x in arr if x == pivot]
# Рекурсивно сортируем и соединяем части
return quicksort(left) + middle + quicksort(right)
# Основная функция для чтения данных из файла и сортировки
def main():
# Чтение данных из файла
with open('my_list.txt', 'r') as file:
# Читаем одну строку, разделяем по пробелам и преобразуем в список целых чисел
arr = list(map(int, file.read().strip().split()))
# Засекаем время сортировки
start_time = time.time()
# Сортируем данные с помощью быстрой сортировки
sorted_arr = quicksort(arr)
# Выводим время сортировки
end_time = time.time()
print(f"Время сортировки: {end_time - start_time} секунд")
if __name__ == "__main__":
main()
На генерацию ушло около 10 секунд, модель использовала алгоритм быстрой сортировки со случайным выбором опорного элемента, что поможет избежать квадратичной сложности. За 10 сортировок среднее время выполнения кода — 4,88 секунды. Еще нейросеть оставила комментарии в коде, что приятно. В целом неплохой результат.
DeepSeek
import time
def quick_sort(arr):
stack = [(0, len(arr) - 1)]
while stack:
low, high = stack.pop()
if high - low < 16:
insertion_sort(arr, low, high)
continue
pivot = median_of_three(arr, low, high)
i = low
j = high
while True:
while arr[i] < pivot:
i += 1
while arr[j] > pivot:
j -= 1
if i >= j:
break
arr[i], arr[j] = arr[j], arr[i]
i += 1
j -= 1
if j - low > high - i:
stack.append((low, j))
stack.append((i, high))
else:
stack.append((i, high))
stack.append((low, j))
def median_of_three(arr, low, high):
mid = (low + high) // 2
if arr[low] > arr[mid]:
arr[low], arr[mid] = arr[mid], arr[low]
if arr[low] > arr[high]:
arr[low], arr[high] = arr[high], arr[low]
if arr[mid] > arr[high]:
arr[mid], arr[high] = arr[high], arr[mid]
return arr[mid]
def insertion_sort(arr, low, high):
for i in range(low + 1, high + 1):
key = arr[i]
j = i - 1
while j >= low and key < arr[j]:
arr[j + 1] = arr[j]
j -= 1
arr[j + 1] = key
def read_numbers(filename):
with open(filename) as f:
return [int(line) for line in f]
if __name__ == "__main__":
numbers = read_numbers('my_list.txt')
start_time = time.perf_counter()
quick_sort(numbers)
end_time = time.perf_counter()
print(f"Sorted 1,000,000 numbers in {end_time - start_time:.3f} seconds")
Модель думала над ответом 91 секунду — намного дольше, чем у западного конкурента. Однако за 10 сортировок среднее время выполнения — 2,354 секунды, т. к. модель использовала итеративный подход, а pivot выбирается «методом трех медиан» для выбора опорного элемента и вставочной сортировки для маленьких подмассивов. Это хороший вариант оптимизации для такой задачи, но по сравнению с выбором опорного элемента немного увеличивает шанс квадратичной сложности.
Qwen2.5-Max
import time
import random
def quicksort(arr):
if len(arr) <= 1:
return arr
pivot = arr[len(arr) // 2]
left = [x for x in arr if x < pivot]
middle = [x for x in arr if x == pivot]
right = [x for x in arr if x > pivot]
return quicksort(left) + middle + quicksort(right)
def quicksort_inplace(arr, low, high):
if low < high:
pi = partition(arr, low, high)
quicksort_inplace(arr, low, pi - 1)
quicksort_inplace(arr, pi + 1, high)
def partition(arr, low, high):
pivot = arr[high]
i = low - 1
for j in range(low, high):
if arr[j] < pivot:
i += 1
arr[i], arr[j] = arr[j], arr[i]
arr[i + 1], arr[high] = arr[high], arr[i + 1]
return i + 1
def read_numbers_from_file(filename):
with open(filename, 'r') as file:
numbers = [int(line.strip()) for line in file]
return numbers
def main():
filename = 'my_list.txt' # Укажите путь к вашему файлу с числами
numbers = read_numbers_from_file(filename)
start_time = time.time()
quicksort_inplace(numbers, 0, len(numbers) - 1)
end_time = time.time()
print(f"Время сортировки: {end_time - start_time:.5f} секунд")
if __name__ == "__main__":
main()
Тут модель сгенерировала алгоритм в двух вариантах — классическом и оптимизированном. In-place версия подходит для больших данных, а также быстрее из-за отсутствия операций копирования. За 10 сортировок — 3,08 секунд. Средний результат по сравнению с другими моделями.
Вердикт
Все модели успешно справились с написанием простейшего кода для сортировки. Но по моему мнению, DeepSeek оказалась чуть-чуть лучше остальных за счет среднего времени выполнения кода. Важно отметить, что написать большой и сложный код без единой ошибки пока не получается ни у одной нейросети. Но они с каждым месяцем показывают результаты лучше и лучше.
Что в итоге
В завершение хочу отметить сильные черты DeepSeek: модель умеет рассуждать благодаря технологии DeepThink, а также эффективно составляет код простого и среднего уровня. Для генерации изображений нужна отдельная модель от DeepSeek, но возможно разработчики добавят ее поддержку позже. Рекомендую опробовать эту модель, если еще этого не сделали! Отдельный плюс за то, что DeepSeek не блокирует российский регион, полностью бесплатна (пока) и позволяет решать многие рутинные задачи, с которыми мы сталкиваемся.
Также стоит обратить внимание на новую нейросеть Qwen2.5-Max. Пока она не умеет генерировать реалистичные картинки, но хорошо работает с логикой, кодом и даже созданием видео.
Пока что для разных задач я буду использовать разные инструменты: ChatGPT — для генерации изображений, DeepSeek — для написания кода и текстов, а Qwen2.5-Max — для объяснения сложных вопросов и «размышлений о вечном».
Какие модели и для каких задач используете вы? Делитесь в комментариях опытом и мнениями о новых нейросетях из Китая!
Комментарии (19)
Akuma
01.02.2025 09:41Почему-то забыли Sonnet 3.5, который для программирования, как по мне, используется куда чаще.
В моем личном сравнении на реальных задачах DeepSeek кстати его обогнал.
А от крылышек и правда надо отстать. Вообще не понимаю смысла подсовывать заведомо тупые условия. Вы задали вопрос - получили рецепт как раз тот, который просили. Задача выполнена в общем-то.
nerudo
01.02.2025 09:41На волне хайпа как раз погонял тут квен. Простую программу на питоне на уровне скомпоновать три ответа из SO и переназвать переменные оно выдало на ура. Но после уточнения требований начала сыпаться вплоть до полной непригодности получаемого результата. Напоминает иностранного студента - выучил билет, но плохо понимает чего от него хотят да и сам предмет, но без тройки уйти не может, поэтому будет пытаться бесконечно (пока не кончится тепрение экзаменующего).
Для генерации ПО им нужна более четкая обратная связь, типа самостоятельного запуска и прогона тестов.
avshkol
01.02.2025 09:41В моем случае, когда нужно выбирать данные из плохих сканов pdf, многие из которых в свою очередь, преобразованы из сканов djvu , Deepseek вообще вне конкуренции.
А Qwen вообще не может OCR, ему только текст подавай...
positroid
01.02.2025 09:41Так происходит из-за трудностей перевода, т.к. нейросеть переводит русский язык в английский, генерирует ответ и переводит его на русский.
Это так не работает, сеть либо знает язык, либо нет.
ToniDoni
01.02.2025 09:41Нейросеть с первого раза заметила подвох и упомянула, что на самом деле крылья — реальная часть свиньи. Тест на логику пройден,
Щито?
HellQwer
01.02.2025 09:41Вырванное из контекста звучит смешно. Там же написано что может подразумеваться под свиными крыльями. Реальная часть, конечно, не крылья, но её можно назвать крыльями о чем написала нейронка.
ednersky
01.02.2025 09:41в последние дни deepseek всё чаще говорит "сервер занят" и всё.
каким образом у Вас получается загрузить её аж на 91 секунду работой?
Arlekcangp
01.02.2025 09:41Никому не смущает, что и чатжопити и квэн выдали обе абсолютно одинаковых слоненка и пигвиненка, в одинаковых позах? По мне так тут "торчат уши" дикого "переобучения" - эффекта, когда сеть в реальности не тренируется обобщать, а тупо запоминает показанные примеры... Даже если поверить опенИИ, что китайцы "стырили" базу для обучения, то даже в этом случае картинки должны были быть полностью разными (да блин, они разными должны быть просто от запроса к запросу, даже если запросы одинаковые... ) На этом примере хорошо видно, что развитие ИИ зашло в очередной тупик...
DrMikeBB
01.02.2025 09:41У меня вопрос ко всем - собственно как работать с "информацией" даваемой этими прогами? Вот пример - меня заинтересовало что на некоторых иконах текст перевёрнут вверх ногами. Qwen -на вопрос почему - назвал книгу Сергея Четверикова "Православная иконопись: Теория и практика", где есть подробный рассказ как и почему это делается + цитаты из текста. На вопрос к Qwen - есть ли у него доступ к тесту книги? Отвеил - НЕТ! Далее, а как же он цитирует эту книгу - ответ
"Я не цитирую реальный текст книги Сергея Четверикова "Православная иконопись: Теория и практика", так как у меня нет доступа к её具体内容. В предыдущем ответе я предоставил гипотетическую цитату , которая была составлена мной на основе общих принципов православной иконописи, теологии и символики перевёрнутых текстов на иконах. Это означает, что цитата является вымышленной, но она отражает возможные мысли и идеи, которые автор мог бы высказать в своём труде".
Более того похоже такой книги вообще не существует!
Тогда - вопрос какой смысл использование этих прог для реального понимания?
Miller777
01.02.2025 09:41Следующий прорыв в нейросетях сделает тот, кто научит свою модель честно отвечать : "а хрен его знает", если данных для ответа у нее нет, а не выдумывать "как бы это могло быть".
Или хотя бы предупреждать, что "я точно не знаю, но предполагаю, что возможно..."
На вопрос по 1С она (не помню, кто именно) предлагала нажать такие кнопки в меню конфигуратора, каких там отродясь не было, но выглядело для незнающего правдоподобно.
Но 1С, видимо, нечастый кейс, и в данных для обучения был представлен мало.
А вот со скриптами на bash/python/powershell под текущие задачи сисадмина она справляется вполне годно.
perfect_genius
01.02.2025 09:41Следующие прорывы, это:
-прохождение всех тестов ARC-AGI
-нейросеть уточняет у пользователя непонятные для неё моменты
-если чего-то не знает, то просит дать время поискать и разобраться
Otupey
01.02.2025 09:41Что за ерундовые тесты вы проводите. Это как спрашивать у калькулятора 2+2. Если есть данные и она хорошо натренирована то все это у нее есть в базе. Спрашивать у таких моделей нужно то чего она не знает. Например стих или рассказ. Посложнее придумать новую архитектуру нейронки. И вот тут все они запинаются. Рассказ получается пресный и заключает в себе куски из уже созданных(например сюжет новой серии рика и морти они просто пытаются склеить много событий из прошлых серий в одну). Она не придумывает что то уникальное. Сюжет игры из разряда игр на nes. А новую архитектуру придумывают и расписывают но глючат в середине кода и выдают одни ошибки. Это просто сжатый поисковик который глючит местами. Отчего такой ажиотаж хз. Как поисковик даже хреновый так как нету в основном доступа к новым данным. Вышел новый движок и модель уже незнает что говорить. Путает 4 анрил с 5 типо знает что в новом(привет gpt) Пока нейронки более менее пишет квен. Думает дипсик типо а чатгопота гамно.
DrMikeBB
01.02.2025 09:41И почти очевидное - попросил Qwen дать список литературы по теме. Проверка авторов и книг указанных Qwen-ом дал почти очевидный результат - эти книги и авторы придуманы Qwen и их на самом деле нет!
Каждый раз попытка уточнить, где такая книга есть приводит к отсылке к ресурсам, где ничего подобного нет! Большинство авторов из списка Qwen - или выдуманы или произвольно взятые авторы из интернета!
DrMikeBB
01.02.2025 09:41На аналогичный запрос DeepSeek нашёл несколько реальных книг и пару раз промахнулся!
То есть Дип Сик даёт более реальный ответ на достаточно сложные искусствоведческие запросы!
CBET_TbMbI
Да отстаньте вы от этих свинных крыльев. Люди сами создали кучу всего с этими крыльями: https://www.google.com/search?q=свиные+крылья а виновата нейросеть что ли?
А на английском это вообще легальный термин, насколько могу судить: https://www.google.com/search?q=pig+wings