DeepSeek

Главная
DeepSeek — новый ChatGPT, Qwen — новый DeepSeek? Проверяем модели в разработке, иллюстрациях и готовке

DeepSeek — новый ChatGPT, Qwen — новый DeepSeek? Проверяем модели в разработке, иллюстрациях и готовке +32

01.02.2025 09:10

Flampanzer 19 14000 Источник

Казалось бы, мир еще не успел оправиться от новостей о китайской нейросети, которая догнала ChatGPT и обвалила фондовый рынок. Но вот уже DeepSeek не справляется с потоком пользователей, а техногигант Alibaba презентовал обновленную модель — Qwen 2.5 Max. При этом решения из Китая не только бесплатны и с открытым кодом, но и кратно дешевле в разработке. С другой стороны, иной подход может сказаться на цензуре и «трудностях перевода» по сравнению с западными моделями.

Меня зовут Антон, я инженер по информационной безопасности в Selectel. В тексте сравню СhatGPT с двумя китайскими собратьями — Qwen и DeepSeek. Оценим их по нескольким критериям: логика, генерация изображений и исправного работоспособного кода. Добро пожаловать под кат!

Используйте навигацию, если не хотите читать текст полностью:
→ Проверка на логику
→ Проверка на умение визуализировать
→ ~~Собеседование~~ проверка на программиста
→ Что в итоге

Проверка на логику

Подложим нейросетям ~~свинью~~ свиные крылья и начнем с великого кулинарного изыска. Просьба подсказать заветный рецепт свиных крыльев — это шуточный способ проверки искусственного интеллекта. Стоит ли уточнять, что у этого животного нет такой части тела? ?

Однако некоторые модели очень подробно описывают рецепт, воспринимая запрос пользователя за истину. Далее, если их обвинить в игнорировании логики, начинают выкручиваться, что на самом деле «крыло» — это передняя часть свиной рульки. Такой термин действительно иногда встречается в англоязычной культуре, но сможет ли нейросеть заметить подвох и предусмотрительно объяснить это пользователю?

Задаем точный промпт, что нам нужны именно свиные крылья. Если нейросеть задумается над логикой запроса — победа за ней. Запросы для разных моделей не меняем.

ChatGPT

Начинаем с громогласного ChatGPT-o1 — условно-бесплатного, очень большого и дорогого проекта. И… мы получаем заветный рецепт. При попытке задать редко встречающийся вопрос ответ будет нереалистичный, или абсурдный.
Промпт: «Хочу порадовать маму чем-то необычным! Подскажи рецепт свиных крыльев для четырех человек».

ChatGPT

Конечно! Вот рецепт свиных крыльев с медом и соевым соусом, который порадует вашу маму:

«Свиные крылья в медово-соевом маринаде»

Ингредиенты (на 4 порции):

— 1 кг свиных крыльев

— 3 ст. ложки меда

— 4 ст. ложки соевого соуса

— 2 ст. ложки растительного масла

Уличив нейросеть в неточности фразой «У свиней нет крыльев», получаем стандартный ответ, что мы правы (но вообще-то свиные крылья существуют, я про них просто не слышал).

ChatGPT

Вы правы, у свиней действительно нет крыльев, и это моя ошибка. Обычно под свиными крыльями понимаются либо «свиные ножки», либо «свиные ребра».

Если вам интересен рецепт запеченных свиных ребер или ножек, дайте знать, и я с удовольствием предоставлю его!

Теперь немного перепишу промпт, чтобы сузить тему до русской кухни, где про свиные крылья уж точно никто не слышал. Также намекну на анатомию свиньи, авось нейронка вспомнит, что у свиней действительно нет крыльев:

«Хочу порадовать маму чем-то необычным! Подскажи рецепт биологически реальных с точки зрения анатомии свиных крыльев в духе русскоязычных кулинарных традиций для четырех человек».

ChatGPT

Понял вас! Давайте приготовим свиные ребра, которые по своей сути имеют некоторую схожесть с «крыльями» в контексте кулинарных рецептов. Вот рецепт свиных ребер в русскоязычном духе:

«Свиные ребра в маринаде с медом и горчицей»

Ингредиенты:

— 1 кг свиных ребер

— 2 ст. л. меда

— 3 ст. л. дижонской горчицы

Модель после уточнения про анатомию свиньи исправилась и заменила крылья на ребра. Так происходит из-за трудностей перевода, т.к. нейросеть переводит русский язык в английский, генерирует ответ и переводит его на русский. Нужно учитывать культурные различия наших культур и задавать промпты более осмысленно, чтобы получить нужный ответ.

Теперь рассмотрим нейросеть DeepSeek-R1 от китайского производителя, которую уже окрестили «убийцей всех западных моделей» из-за разницы в цене при схожей производительности. Разработка чат-бота обошлась китайской компании примерно в $6 млн — в 100 раз меньше, чем разработчикам ChatGPT. Помимо прочего, у нейросети есть еще одно существенное преимущество: она доступна из российского региона.

Запрос остается прежним, оцениваем также одну попытку. Отмечу, что нейросеть отличается от своего западного конкурента: при включенном DeepThink мы видим ход мыслей модели. DeepSeek сначала усомнилась в достоверности существования свиных крыльев, так что я увидел проблеск разума.

Промпт

«Хочу порадовать маму чем-то необычным! Подскажи рецепт свиных крыльев для четырех человек».

DeepSeek

Хорошо, пользователь хочет порадовать маму чем-то необычным и просит рецепт свиных крыльев на четверых. Начну с того, что свиные крылья — это не самый распространенный ингредиент, обычно чаще готовят куриные. Значит, нужно сделать блюдо действительно интересным, чтобы удивить маму.

Однако этот проблеск очень быстро затух, превратившись в рецепт крыльев. Тест не пройден:

DeepSeek

Вот вкусный и необычный рецепт свиных крылышек в медово-имбирном маринаде с хрустящей корочкой. Идеально для того, чтобы удивить маму!

«Свиные крылышки в медово-имбирном глазури» на 4 порции.

Ингредиенты:

— 1 кг свиных крыльев (промыть, обсушить)

— 3 ст. л. меда

— 3 ст. л. соевого соуса

Попробуем раскрутить модель на корректный ответ и возьмем второй запрос.

Промпт

«Хочу порадовать маму чем-то необычным! Подскажи рецепт свиных крыльев в духе русскоязычных кулинарных традиция для четырех человек».

DeepSeek

Предлагаю аппетитный рецепт «Свиные крылышки в медово-горчичном маринаде с деревенскими кореньями» — сочетание русских традиций с пикантными нотками. Идеально для семейного ужина!

Ингредиенты (на 4 порции):

— Свиные крылышки — 1,2 кг (8-10 шт.)

— Мед — 3 ст.л.

— Горчица зернистая — 2 ст.л.

Результат тот же, добавились только традиционные для России и всеми нами любимые деревенские коренья. Напоследок укажем третий промпт, где явно выделим подвох для нейросети.

Промпт

«Хочу порадовать маму чем-то необычным! Подскажи рецепт биологически реальных с точки зрения анатомии свиных крыльев в духе русскоязычных кулинарных традиций для четырех человек».

DeepSeek

Поскольку у свиней анатомически нет крыльев (это часть курицы), предлагаю творчески интерпретировать ваш запрос. Вместо этого мы возьмем свиные ребрышки или рульку (часть ноги), которые по форме и сочности напоминают куриные крылышки, и приготовим их в духе русской кухни с традиционными ингредиентами. Вот рецепт:

«Свиные рульки-крылья» в медово-горчичном маринаде с яблоками и квашеной капустой»

Порций: 4

Ингредиенты:

• Свиные рульки (передние ножки) — 4 шт. (около 1,5 кг)

• Квашеная капуста — 300 г

…

С третьего раза видим успех. Модель поняла, что крылья-то не настоящие. Однако отмечу более «человеческие» рассуждения нейросети.

Qwen 2.5-Max

Попробуем третью нейросеть, которую буквально на этой неделе зарелизила компания Alibaba – Qwen 2.5-Max. Она способна обрабатывать длинные тексты (до 32 тыс токенов), обладает встроенными возможностями генерации картинок и видео, поддерживает работу с HTML-, CSS- и JS-файлами.

Помимо прочего, разработчики оптимизировали нейросеть для практических задач: переводов текста, генерации кода, анализа данных и т. д. Начинаем тестирование с первого промпта.

Промпт

«Хочу порадовать маму чем-то необычным! Подскажи рецепт свиных крыльев для четырех человек».

Qwen

Свиные крылья — это действительно необычное и оригинальное блюдо! В отличие от куриных крылышек, свиные крылья (чаще всего это часть мяса с плечевой кости) имеют более плотную текстуру и требуют особой обработки для достижения максимальной нежности. Вот рецепт на 4 персоны:

«Свиные крылышки в медово-горчичном маринаде»

Ингредиенты:

— 8 штук свиных крыльев (или около 1,2–1,5 кг)

— 3 столовые ложки горчицы

Нейросеть с первого раза заметила подвох и упомянула, что на самом деле крылья — реальная часть свиньи. Тест на логику пройден, так что в лидеры вырывается Qwen 2.5-Max, обойдя конкурентов ChatGPT и DeepSeek по умению рассуждать.

Проверка на умение визуализировать

Перейдем ко второй части зачета — к тестированию на генерацию картинок. Будем сравнивать умение генерации картинки по историческому событию. Оцениваем по нескольким критериям: точность деталей, соответствие эпохе того времени, общее качество картинки. Помимо прочего, сгенерируем нереалистичное мультяшное изображение и оценим креатив модели, стилизацию, логическую составляющую картинки.

ChatGPT

Генерация по историческому событию

Историческое событие, которое хочу сгенерировать, — Бостонское чаепитие — бунт американских колонистов из-за повышения Великобританией налога на чай. Вводим запрос:

«Создай реалистичное историческое изображение. Сцена “Бостонского чаепития”, произошедшего в порту Бостона, 16 декабря 1773 года. Группа колонистов, переодетых в индейцев, бросают ящики с чаем в воду. На заднем плане видны другие корабли, наблюдатели на берегу и городской пейзаж Бостона того времени. Обрати внимание на детализацию: одежда участников, выражения лиц, архитектура города и кораблей».

Генерация ChatGPT.

По сгенерированной картинке отметим соответствие эпохе: здания, корабли и одежда колонистов неплохо прорисованы. Однако модель не учла, что колонисты должны быть переодеты в индейцев. Также бросается в глаза плохая отрисовка деталей, таких как лица людей и содержимое в ящиках. Чай изображен буквально чашками чая. Вердикт — по генерации соблюден один критерий из трех.

Мультяшная генерация

Промпт:

«Создай мультяшное изображение. Слон и пингвин играют в баскетбол на Луне. Слон одет в форму Neebook, а пингвин — в форму Adios. На заднем плане видны кратеры лунной поверхности и звезды. Они оба парят в воздухе из-за низкой гравитации».

Генерация ChatGPT.

На удивление получилось очень хорошо. Нейросеть смогла изобразить логику нахождения в космосе и надписи на футболках, а также подошла к реализации с креативом. Изображение соответствует всем критериям оценки, ставим три из трех.

Общая оценка для ChatGPT – 4 из 6. Довольно неплохо, но модели стоит поучиться генерировать лица людей и более кропотливо отрисовывать мелкие детали.

DeepSeek, твое время еще не настало

У модели DeepSeek нет встроенного генератора изображений. Однако разработчики предлагают для этого мультимодальную модель Janus-Pro-7B. Мы обязательно развернем ее локально, протестируем и поделимся результатами в будущем. Пока остановимся на решениях, которые предлагают мгновенную интеграцию через браузер и рассчитаны на широкую аудиторию.

Успели испытать Janus? Поделитесь в комментариях опытом, будет интересно почитать!

Qwen

Генерация по историческому событию

Пришла очередь Qwen сгенерировать картинку на оценку.

Промпт

«Создай реалистичное историческое изображение. Сцена “Бостонского чаепития”, произошедшего в порту Бостона, 16 декабря 1773 года. Группа колонистов, переодетых в индейцев, бросают ящики с чаем в воду. На заднем плане видны другие корабли, наблюдатели на берегу и городской пейзаж Бостона того времени. Обрати внимание на детализацию: одежда участников, выражения лиц, архитектура города и кораблей».

Генерация Qwen.

Нейросеть смогла отрисовать наспех переодетых в индейцев колонистов, но поместила их в воду и плохо отрисовала чай. Из прочих особенностей — видим на фоне несколько небоскребов, один из которых похож на здание всемирного торгового центра. На корабле — флаг Австрии (не путать с флагом Вашингтона). За точность изображения можно поставить балл, но историческое соответствие и качество изображения не впечатлили.

Мультяшная генерация

Вторая генерация тоже не сильно порадовала. Для пользователя, который впервые видит картинку, не будет понятно, что персонажи играют в баскетбол: логика нарушена из-за двух мячей. Стилизация кажется дешевой, не прорисованной.

Модель не смогла показать ни креатива, ни должной стилизации, а также нарушила логику игры в баскетбол. Вердикт — один балл из шести. На мой взгляд, разработчикам нужно дорабатывать генерацию картинок.

Промпт

«Создай мультяшное изображение. Слон и пингвин играют в баскетбол на Луне. Слон одет в форму Neebook, а пингвин — в форму Adios. На заднем плане видны кратеры лунной поверхности и звезды. Они оба парят в воздухе из-за низкой гравитации».

Генерация Qwen.

Собеседование проверка на программиста

Перейдем к заключительной части сравнения нейросетей — написанию кода. Запрос относительно простой. Оцениваем быстродействие, качество и скорость генерации кода.

Промпт:

«Мне необходимо на языке Python реализовать алгоритм быстрой сортировки. Функция принимает список чисел из файла (1 000 000 чисел), сортирует и выводит время сортировки. Сделай этот код наиболее эффективным и быстрым. Для каждой модели буду давать один и тот же список».

ChatGPT

import random
import time
# Реализация быстрой сортировки с улучшениями
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    # Случайный выбор опорного элемента для улучшения производительности
    pivot = arr[random.randint(0, len(arr) - 1)]  # случайный элемент как опорный
    left = [x for x in arr if x < pivot]
    right = [x for x in arr if x > pivot]
    middle = [x for x in arr if x == pivot]
    # Рекурсивно сортируем и соединяем части
    return quicksort(left) + middle + quicksort(right)
# Основная функция для чтения данных из файла и сортировки
def main():
    # Чтение данных из файла
    with open('my_list.txt', 'r') as file:
        # Читаем одну строку, разделяем по пробелам и преобразуем в список целых чисел
        arr = list(map(int, file.read().strip().split()))
    # Засекаем время сортировки
    start_time = time.time()
    # Сортируем данные с помощью быстрой сортировки
    sorted_arr = quicksort(arr)
    # Выводим время сортировки
    end_time = time.time()
    print(f"Время сортировки: {end_time - start_time} секунд")
if __name__ == "__main__":
    main()

На генерацию ушло около 10 секунд, модель использовала алгоритм быстрой сортировки со случайным выбором опорного элемента, что поможет избежать квадратичной сложности. За 10 сортировок среднее время выполнения кода — 4,88 секунды. Еще нейросеть оставила комментарии в коде, что приятно. В целом неплохой результат.

DeepSeek

Промпт

«Мне необходимо на языке Python реализовать алгоритм быстрой сортировки. Функция принимает список чисел из файла (1 000 000 чисел), сортирует и выводит время сортировки. Сделай этот код наиболее эффективным и быстрым. Для каждой модели буду давать один и тот же список».

import time
def quick_sort(arr):
    stack = [(0, len(arr) - 1)]
    while stack:
        low, high = stack.pop()
        if high - low < 16:
            insertion_sort(arr, low, high)
            continue
        pivot = median_of_three(arr, low, high)
        i = low
        j = high
        while True:
            while arr[i] < pivot:
                i += 1
            while arr[j] > pivot:
                j -= 1
            if i >= j:
                break
            arr[i], arr[j] = arr[j], arr[i]
            i += 1
            j -= 1
        if j - low > high - i:
            stack.append((low, j))
            stack.append((i, high))
        else:
            stack.append((i, high))
            stack.append((low, j))
def median_of_three(arr, low, high):
    mid = (low + high) // 2
    if arr[low] > arr[mid]:
        arr[low], arr[mid] = arr[mid], arr[low]
    if arr[low] > arr[high]:
        arr[low], arr[high] = arr[high], arr[low]
    if arr[mid] > arr[high]:
        arr[mid], arr[high] = arr[high], arr[mid]
    return arr[mid]
def insertion_sort(arr, low, high):
    for i in range(low + 1, high + 1):
        key = arr[i]
        j = i - 1
        while j >= low and key < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key
def read_numbers(filename):
    with open(filename) as f:
        return [int(line) for line in f]
if __name__ == "__main__":
    numbers = read_numbers('my_list.txt')
    start_time = time.perf_counter()
    quick_sort(numbers)
    end_time = time.perf_counter()
    print(f"Sorted 1,000,000 numbers in {end_time - start_time:.3f} seconds")

Модель думала над ответом 91 секунду — намного дольше, чем у западного конкурента. Однако за 10 сортировок среднее время выполнения — 2,354 секунды, т. к. модель использовала итеративный подход, а pivot выбирается «методом трех медиан» для выбора опорного элемента и вставочной сортировки для маленьких подмассивов. Это хороший вариант оптимизации для такой задачи, но по сравнению с выбором опорного элемента немного увеличивает шанс квадратичной сложности.

Qwen2.5-Max

Промпт

import time
import random
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)
def quicksort_inplace(arr, low, high):
    if low < high:
        pi = partition(arr, low, high)
        quicksort_inplace(arr, low, pi - 1)
        quicksort_inplace(arr, pi + 1, high)
def partition(arr, low, high):
    pivot = arr[high]
    i = low - 1
    for j in range(low, high):
        if arr[j] < pivot:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[i + 1], arr[high] = arr[high], arr[i + 1]
    return i + 1
def read_numbers_from_file(filename):
    with open(filename, 'r') as file:
        numbers = [int(line.strip()) for line in file]
    return numbers
def main():
    filename = 'my_list.txt'  # Укажите путь к вашему файлу с числами
    numbers = read_numbers_from_file(filename)
    start_time = time.time()
    quicksort_inplace(numbers, 0, len(numbers) - 1)
    end_time = time.time()
    print(f"Время сортировки: {end_time - start_time:.5f} секунд")
if __name__ == "__main__":
    main()

Тут модель сгенерировала алгоритм в двух вариантах — классическом и оптимизированном. In-place версия подходит для больших данных, а также быстрее из-за отсутствия операций копирования. За 10 сортировок — 3,08 секунд. Средний результат по сравнению с другими моделями.

Вердикт

Все модели успешно справились с написанием простейшего кода для сортировки. Но по моему мнению, DeepSeek оказалась чуть-чуть лучше остальных за счет среднего времени выполнения кода. Важно отметить, что написать большой и сложный код без единой ошибки пока не получается ни у одной нейросети. Но они с каждым месяцем показывают результаты лучше и лучше.

Что в итоге

В завершение хочу отметить сильные черты DeepSeek: модель умеет рассуждать благодаря технологии DeepThink, а также эффективно составляет код простого и среднего уровня. Для генерации изображений нужна отдельная модель от DeepSeek, но возможно разработчики добавят ее поддержку позже. Рекомендую опробовать эту модель, если еще этого не сделали! Отдельный плюс за то, что DeepSeek не блокирует российский регион, полностью бесплатна (пока) и позволяет решать многие рутинные задачи, с которыми мы сталкиваемся.

Также стоит обратить внимание на новую нейросеть Qwen2.5-Max. Пока она не умеет генерировать реалистичные картинки, но хорошо работает с логикой, кодом и даже созданием видео.

Пока что для разных задач я буду использовать разные инструменты: ChatGPT — для генерации изображений, DeepSeek — для написания кода и текстов, а Qwen2.5-Max — для объяснения сложных вопросов и «размышлений о вечном».

Какие модели и для каких задач используете вы? Делитесь в комментариях опытом и мнениями о новых нейросетях из Китая!

Комментарии (19)

CBET_TbMbI
01.02.2025 09:41
#27864358
Да отстаньте вы от этих свинных крыльев. Люди сами создали кучу всего с этими крыльями: https://www.google.com/search?q=свиные+крылья а виновата нейросеть что ли?

А на английском это вообще легальный термин, насколько могу судить: https://www.google.com/search?q=pig+wings

Akuma
01.02.2025 09:41
#27864458
Почему-то забыли Sonnet 3.5, который для программирования, как по мне, используется куда чаще.

В моем личном сравнении на реальных задачах DeepSeek кстати его обогнал.

А от крылышек и правда надо отстать. Вообще не понимаю смысла подсовывать заведомо тупые условия. Вы задали вопрос - получили рецепт как раз тот, который просили. Задача выполнена в общем-то.

nerudo
01.02.2025 09:41
#27864654
На волне хайпа как раз погонял тут квен. Простую программу на питоне на уровне скомпоновать три ответа из SO и переназвать переменные оно выдало на ура. Но после уточнения требований начала сыпаться вплоть до полной непригодности получаемого результата. Напоминает иностранного студента - выучил билет, но плохо понимает чего от него хотят да и сам предмет, но без тройки уйти не может, поэтому будет пытаться бесконечно (пока не кончится тепрение экзаменующего).
Для генерации ПО им нужна более четкая обратная связь, типа самостоятельного запуска и прогона тестов.

avshkol
01.02.2025 09:41
#27864974
В моем случае, когда нужно выбирать данные из плохих сканов pdf, многие из которых в свою очередь, преобразованы из сканов djvu , Deepseek вообще вне конкуренции.

А Qwen вообще не может OCR, ему только текст подавай...
1. alan008
  01.02.2025 09:41
  #27869406
  Там же Янус от deepseek мультимодальный должен быть
  
  https://github.com/deepseek-ai/Janus

positroid
01.02.2025 09:41
#27865474
Так происходит из-за трудностей перевода, т.к. нейросеть переводит русский язык в английский, генерирует ответ и переводит его на русский.

Это так не работает, сеть либо знает язык, либо нет.

ToniDoni
01.02.2025 09:41
#27865810
Нейросеть с первого раза заметила подвох и упомянула, что на самом деле крылья — реальная часть свиньи. Тест на логику пройден,

Щито?
1. HellQwer
  01.02.2025 09:41
  #27871214
  Вырванное из контекста звучит смешно. Там же написано что может подразумеваться под свиными крыльями. Реальная часть, конечно, не крылья, но её можно назвать крыльями о чем написала нейронка.

ednersky
01.02.2025 09:41
#27866238
в последние дни deepseek всё чаще говорит "сервер занят" и всё.

каким образом у Вас получается загрузить её аж на 91 секунду работой?

Arlekcangp
01.02.2025 09:41
#27867082
Никому не смущает, что и чатжопити и квэн выдали обе абсолютно одинаковых слоненка и пигвиненка, в одинаковых позах? По мне так тут "торчат уши" дикого "переобучения" - эффекта, когда сеть в реальности не тренируется обобщать, а тупо запоминает показанные примеры... Даже если поверить опенИИ, что китайцы "стырили" базу для обучения, то даже в этом случае картинки должны были быть полностью разными (да блин, они разными должны быть просто от запроса к запросу, даже если запросы одинаковые... ) На этом примере хорошо видно, что развитие ИИ зашло в очередной тупик...

DrMikeBB
01.02.2025 09:41
#27867668
У меня вопрос ко всем - собственно как работать с "информацией" даваемой этими прогами? Вот пример - меня заинтересовало что на некоторых иконах текст перевёрнут вверх ногами. Qwen -на вопрос почему - назвал книгу Сергея Четверикова "Православная иконопись: Теория и практика", где есть подробный рассказ как и почему это делается + цитаты из текста. На вопрос к Qwen - есть ли у него доступ к тесту книги? Отвеил - НЕТ! Далее, а как же он цитирует эту книгу - ответ
"Я не цитирую реальный текст книги Сергея Четверикова "Православная иконопись: Теория и практика", так как у меня нет доступа к её具体内容. В предыдущем ответе я предоставил гипотетическую цитату , которая была составлена мной на основе общих принципов православной иконописи, теологии и символики перевёрнутых текстов на иконах. Это означает, что цитата является вымышленной, но она отражает возможные мысли и идеи, которые автор мог бы высказать в своём труде".
Более того похоже такой книги вообще не существует!

Тогда - вопрос какой смысл использование этих прог для реального понимания?

Miller777
01.02.2025 09:41
#27868008
Следующий прорыв в нейросетях сделает тот, кто научит свою модель честно отвечать : "а хрен его знает", если данных для ответа у нее нет, а не выдумывать "как бы это могло быть".

Или хотя бы предупреждать, что "я точно не знаю, но предполагаю, что возможно..."

На вопрос по 1С она (не помню, кто именно) предлагала нажать такие кнопки в меню конфигуратора, каких там отродясь не было, но выглядело для незнающего правдоподобно.

Но 1С, видимо, нечастый кейс, и в данных для обучения был представлен мало.

А вот со скриптами на bash/python/powershell под текущие задачи сисадмина она справляется вполне годно.
1. perfect_genius
  01.02.2025 09:41
  #27870064
  Следующие прорывы, это:
  
  -прохождение всех тестов ARC-AGI
  
  -нейросеть уточняет у пользователя непонятные для неё моменты
  
  -если чего-то не знает, то просит дать время поискать и разобраться

Otupey
01.02.2025 09:41
#27868200
Что за ерундовые тесты вы проводите. Это как спрашивать у калькулятора 2+2. Если есть данные и она хорошо натренирована то все это у нее есть в базе. Спрашивать у таких моделей нужно то чего она не знает. Например стих или рассказ. Посложнее придумать новую архитектуру нейронки. И вот тут все они запинаются. Рассказ получается пресный и заключает в себе куски из уже созданных(например сюжет новой серии рика и морти они просто пытаются склеить много событий из прошлых серий в одну). Она не придумывает что то уникальное. Сюжет игры из разряда игр на nes. А новую архитектуру придумывают и расписывают но глючат в середине кода и выдают одни ошибки. Это просто сжатый поисковик который глючит местами. Отчего такой ажиотаж хз. Как поисковик даже хреновый так как нету в основном доступа к новым данным. Вышел новый движок и модель уже незнает что говорить. Путает 4 анрил с 5 типо знает что в новом(привет gpt) Пока нейронки более менее пишет квен. Думает дипсик типо а чатгопота гамно.

DrMikeBB
01.02.2025 09:41
#27868892
И почти очевидное - попросил Qwen дать список литературы по теме. Проверка авторов и книг указанных Qwen-ом дал почти очевидный результат - эти книги и авторы придуманы Qwen и их на самом деле нет!
Каждый раз попытка уточнить, где такая книга есть приводит к отсылке к ресурсам, где ничего подобного нет! Большинство авторов из списка Qwen - или выдуманы или произвольно взятые авторы из интернета!

iliatee
01.02.2025 09:41
#27869464
Первая статья, которая мне попалась за сегодня, не сгенерированная ИИ.

AgniaKandel
01.02.2025 09:41
#27871524
Какая разница кто мощнее если DeepSeek лежит мертвый 24\7 )))
1. DrMikeBB
  01.02.2025 09:41
  #27872502
  На телефоне работает, по состоянию на утро!

DrMikeBB
01.02.2025 09:41
#27872496
На аналогичный запрос DeepSeek нашёл несколько реальных книг и пару раз промахнулся!
То есть Дип Сик даёт более реальный ответ на достаточно сложные искусствоведческие запросы!