Это моя первая публикация, сильно не ругайтесь.

Часть 1. Можно ли им доверять ?

Вам вдруг понадобилось решить небольшую практическую техническую задачку, а школьный курс физики и/или математики не помните (не знаете или даже знать никогда не хотели) можно попросить помощи у коллеги технаря, обратиться к технически подкованным знакомым школьникам старших классов или к студентам, написать на какой-нибудь форум (какой форум в 2025 году, это надо регистрироваться, ответят непонятно когда и т.д.), но ведь сейчас эпоха нейросетей, которые, судя по рекламе, легко и просто решают школьные задачки. Давайте проверим так ли это на самом деле и стоит ли доверять решение этим техническим чудесам нашей эпохи.

Протестируем 4 нейросети: наши отечественные YandexGPT и GigaChat, новоиспечённый китайский DeepSeek о котором последнее время "трещат из всех утюгов" и американский лидер (все слышали, все знают, многие пользуются) ChatGPT. Первые трое легко работают из России, а вот для ChatGPT придётся немного подумать (на помощь придут VPN, приложения, чат-боты, и другие ухищрения), что у некоторых людей может вызвать проблемы (к "Хабровцам" это не относится).

В качестве испытания Я взял практическую рабочую задачку, которую периодически решаю используя устаревшие инструменты, которые оказались под рукой: лист бумаги (коробка, стена) и ручка (карандаш, маркер, мел). Сама задача: дана труба длиной 100 метров, внутренний диаметр трубы 4 мм, расход воды 100 литров в час, какое время транспортного запаздывания через такую трубу. Такие данные нужны при аналитике воды, например, на электростанциях, но вдруг кому-то у себя в частном доме захочется посчитать через какое время горячая вода от бойлера дойдёт до душа, особенно если труба длинная. Запросы в нейросети подавались абсолютно одинаковые, чтобы всё было честно. Никаких настроек, какую модель предложили по умолчанию ту и использовал, зашёл на сайт, ввёл вопрос, получил ответ, как будто Я вообще ничего не понимаю в моделях и даже не знаю что они разные бывают.

YandexGPT 4 Pro

Ответ от нейросети Яндекса читать неудобно, но разобрать можно:

Для расчёта времени транспортного запаздывания через трубу необходимо учесть несколько параметров, включая свойства жидкости и характеристики трубы.

1. Площадь поперечного сечения трубы:
$S = π \cdot r^2 = π \cdot (\frac{d}{2})^2$, где $r$ — радиус трубы, $d$ — диаметр трубы.
Подставляя значения:
$S = 3,14 \cdot (\frac{4}{2})^2 ≈ 12,56$ мм$^2$.

2. Скорость потока воды:
Для расчёта скорости потока используем формулу:
$V = \frac{Q}{S}$, где $Q$ — расход воды.
Переведём расход из литров в час в м$^3$/с:
$Q = 100$ л/ч $= \frac{100}{3600}$ м$^3$/c $≈ 0,0278$ м$^3$/c.
Тогда:
$V = \frac{0,0278}{0,001256} ≈ 22,2$ м/с.

3. Время транспортного запаздывания:
$t = \frac{L}{V}$, где $L$ — длина трубы.
$t = \frac{100}{22,2} ≈ 4,5$ с.

Таким образом, время транспортного запаздывания для данной трубы составляет примерно 4,5 секунды.

Ниже для оценки дизайна и удобочитаемости привожу скрин:

Скрин ответа YandexGPT 4 Pro
Скрин ответа YandexGPT 4 Pro

GigaChat MAX

Что-то похожее на YandexGPT, также не удобно читать, но можно разобрать:

Для решения задачи нам нужно найти время, за которое вода проходит по трубе длиной 100 метров.

  1. Перевод единиц измерения:
    Переведем объемный расход воды из литров в час в кубические метры в секунду (м³/с):
    $$ Q = \frac{100 , \text{л/ч}}{3600 , \text{с/ч}} = \frac{100}{3600} = 0.02778 , \text{м}^3/\text{с}.$$

  2. Расчет площади поперечного сечения трубы:
    Внутренний диаметр трубы составляет 4 мм, что равно 0.004 м. Площадь круга вычисляется как:
    $$ S = \pi r^2 = \pi \left(\frac{d}{2}\right)^2 = \pi \left(\frac{0.004}{2}\right)^2 = \pi \cdot 0.001^2 = 0.00000314 , \text{м}^2.$$

  3. Скорость потока воды:
    Скорость можно найти, разделив объемный расход на площадь поперечного сечения:$$ v = \frac{Q}{S} = \frac{0.02778}{0.00000314} \approx 8.85 , \text{м/с}.$$

  4. Время прохождения воды по трубе:
    Время транспортного запаздывания определяется как отношение длины трубы к скорости потока:
    $$ t = \frac{L}{v} = \frac{100}{8.85} \approx 11.29 , \text{секунд}.$$

    Таким образом, время транспортного запаздывания через данную трубу составит примерно 11.29 секунд.

Скрин ответа от GIGACHAT MAX
Скрин ответа от GIGACHAT MAX

DeepSeek-V3:

Вот тут уже красивое оформление с нормальными формулами:

Время транспортного запаздывания (или время прохождения воды через трубу) можно рассчитать по формуле:

t = L / v

где:

  • t — время транспортного запаздывания,

  • L — длина трубы,

  • v — скорость потока воды.

Сначала найдем скорость потока воды vv. Для этого используем формулу расхода:

Q = A ⋅ v

где:

  • Q — расход воды,

  • A — площадь поперечного сечения трубы.

  1. Рассчитаем площадь поперечного сечения трубы:

Диаметр трубы d = 4 мм =0.004 м.

Площадь поперечного сечения:

A = πd2 / 4 = π ⋅ (0.004)2 / 4 ≈ 1.2566 × 10−5 м2

  1. Переведем расход воды в м³/с:

Расход Q = 100 л/ч = 100 / 1000 м3/ч = 0.1 м3

Переведем в м³/с:

Q = 0.1 / 3600 ≈ 2.7778×10−5 м3

  1. Найдем скорость потока v:

v = Q / A = 2.7778×10−5 / 1.2566×10−5 ≈ 2.21 м/с

  1. Рассчитаем время транспортного запаздывания:

Длина трубы L = 100 м.

t = L / v = 100 / 2.21 ≈ 45.25 с

Ответ: Время транспортного запаздывания составляет примерно 45.25 секунд.

GPT-4o-mini

Тут немного не по плану, была открыта вкладка с расширением для хрома MaxAI в ней выбрана модель GPT-4o-mini, так что сначала вопрос был задан этой модели, а не на сайте самого чата ГПТ.

С визуализацией всё хорошо как и у DeepSeek-V3, ответ 2.72 минуты.

Итоги части 1. Можно ли им доверять ?

В итоге получили 4 разных ответа от 4 разных нейросетей, вот и верь после этого "людям"...
Получается нельзя доверь решение первой попавшейся нейросети, а как же быть, кто прав, кто виноват? Какая нейросеть дала правильный ответ будет понятно дальше, кому интересно могут сами посчитать.


Часть 2. А всё ли так плохо на самом деле ?

Учитывая что с моделью от OpenAI в первой части получилось не совсем честно, иду на официальный сайт и задаю вопрос там. В лоб не увидел какая модель, пришлось пытать чат, раскололся почти сразу:

GPT-4-turbo

Тут тоже красиво и удобочитаемо:

Для того чтобы рассчитать время транспортного запаздывания воды в трубе, можно использовать следующую формулу:

t = L / v​

где:
t — время транспортного запаздывания (в секундах),
L — длина трубы (в метрах),
v — средняя скорость воды в трубе (в метрах в секунду).

Нам нужно сначала найти скорость воды v. Для этого можем использовать формулу для расхода жидкости:

Q = v ⋅ A

где:

  • Q — расход воды (в кубических метрах в секунду),

  • v — скорость воды (в метрах в секунду),

  • A — площадь поперечного сечения трубы (в квадратных метрах).

Площадь поперечного сечения трубы с внутренним диаметром D можно вычислить по формуле площади круга:

A = π ⋅ (D/2)2

Теперь, давайте все подставим:

  • Длина трубы L = 100,

  • Внутренний диаметр D = 4 = 0.004 м,

  • Расход воды Q = 100 литров в час = 100 / 3600​ м³/с.

Давайте рассчитаем скорость и время транспортного запаздывания.

Время транспортного запаздывания воды через трубу длиной 100 метров с внутренним диаметром 4 мм при расходе 100 литров в час составляет примерно 45.24 секунды. ​

Куда-то скушал часть расчётов:

Скрин ответа GPT-4-turbo вариант 1
Скрин ответа GPT-4-turbo вариант 1

Краткий лаконичный ответ:

Скрин ответа GPT-4-turbo вариант 2
Скрин ответа GPT-4-turbo вариант 2

GPT-4o-mini

GPT-4-turbo посчитал всё правильно, что же тогда было не так с GPT-4o-mini, задаю задачку ещё раз, ответ: примерно 45 секунд. Вот, другое дело, что за глюк был при первой попытке, остаётся вопросом, но получается что можно словить глюк на хорошей модели.
На следующий день спросил ещё раз, тут совсем интересный результат, в процессе решения сам нашёл ошибку и пересчитал:
V = 0.02778 / 1.256 × 10−5​ ≈ 2200 м/с
Это значение кажется слишком большим для воды в трубе, что указывает на необходимость проверить, правильно ли мы интерпретировали входные данные. Возможно, это получится проверить, используя другую методологию для системы жидкости.
Тем не менее, давайте продолжим:
в итоге пересчитал и получил: 45.5 секунд.

Зачёт.

А попробуем другие модели

Llama-3.2-90B - ответ: примерно 45 секунд.
Claude-3.5-Haiku - ответ: 45 секунд транспортного запаздывания.
Gemini-1.5-Flash - ответ: приблизительно 45 секунд.

Второй шанс

Моделям, не справившимся с задачей Я предоставил второй шанс, задал вопрос заново:

GigaChat MAX - оформление так же кривое, ответ был 11.29 стал 11.31 секунды;
третий шанс, говорю: "Проверь решение, точно всё правильно", нашёл ошибки, ответ стал 0.452 секунды;
четвёртый шанс, говорю: "Теперь точно всё правильно", ответ: Все расчеты выполнены корректно, и итоговый результат соответствует исходным данным.

YandexGPT 4 Pro - Ответ: транспортное запаздывание через такую трубу составляет примерно 9,99 часов. Однако этот расчёт может быть неточным из-за отсутствия некоторых данных, таких как коэффициент шероховатости стенок трубы;
третий шанс, опять поумничал, но потом пересчитал на 1,26 секунды;
четвёртый шанс, говорю: "Теперь точно всё правильно", ответ: Решение верное. При условии, что мы не учитываем шероховатости стенок трубы и другие данные, влияющие на скорость течения воды, результат получается исходя из предоставленных условий задачи.

ИТОГИ:

Получается ошиблись только наши отечественные нейросети от Яндекса и Сбера, причем даже при просьбе проверить решение, всё равно не смогли правильно посчитать.

За державу обидно
За державу обидно

Удивил GPT-4o-mini, как он затупил на первой попытке, непонятно, на второй попытке всё чётко, на третьей попытке тоже пытался ошибиться, но самостоятельно исправился. Все остальные модели успешно справились с задачкой

Получается современные нейросети вполне могут помочь с решением практической задачи, но не нужно слепо верить, они могут ошибиться. Вполне возможно что модели успешно справившиеся с задачкой могут ошибиться (может быть только на первой попытке) на другой задаче.

P. S.

Если данное мини исследование кого-то заинтересует помучаю нейронки другими задачами и дополню публикацию.

Комментарии (115)


  1. aboutmurena
    12.02.2025 17:59

    Если данное мини исследование кого-то заинтересует помучаю нейронки другими задачами и дополню публикацию.

    сегодня у нейро пытался узнать что за майка-сетка в фильме клад-1988 и кукушка-2002 - она делала вид что не знает такие фильмы (сейчас знает но ответа нет тк я жаловался что не отвечает) тк не может ответить на вопрос и в ответ привела кучу других фильмов да на уточнения не реагировала ... другой инет тоже не гуглил ответ накидывая только купить современую


  1. LeXaNe
    12.02.2025 17:59

    Мой вердикт: Доверяй, но проверяй.

    Мучил дипПсик преобразованиями, похожими, как в гипотезе коллатца: если остаток по модулю такой-то преобразуем число по такой то формуле, полученное число сверяем с модулем - в зависимости от остатка применяем формулу. В итоге не сразу, но сбивался, считал неправильно остаток и подставлял не ту формулу, что в дальнейшем приводило к дробным числам. Тыкал носом - исправлялся, затем в последующих вычислениях вновь спотыкался об это же число


    1. Vasiliy_S
      12.02.2025 17:59

      Напоминает как моя дочка в 10 классе делает домашку по математике


      1. Wesha
        12.02.2025 17:59

        Очень хочется надеяться, что Ваша дочка после двух-трёх объяснений перестаёт делать одни и те же ошибки.


  1. sdelaypausu
    12.02.2025 17:59

    Транспортное запаздывание изучают в школе? Не подскажете в какой и в каком классе?


    1. aboutmurena
      12.02.2025 17:59

      в этом году отменили Теория (удвоенного времени) Майклa Наки


    1. CHEGOBNK
      12.02.2025 17:59

      Это вполне может быть задачей со звездочкой в любом классе, где дети уже прошли, что такое скорость, объем и поперечное сечение.
      Особо умные догадаются как из расхода воды и сечения получить скорость, благо размерности подсказывают, а путь нам известен (длина трубы). Остальные с помощью учителя сообразят.
      Выглядит как обычная задачка из тех, что мне нравились в школе: "Мы берем всё, чему научились, и теперь решаем необычную и даже реалистичную задачу".


    1. Vytian
      12.02.2025 17:59

      Вообще то это вторая задача Василис Премудрых из мультфильма "Вовка в тридевятом царстве".

      Если серьезно, Вы считаете, грозное название "транспортное запаздывание" делает задачу на вычисление расхода несжимаемой жидкости при постоянном потоке через прямую трубу постоянного сечения -- выходящей за рамки конца 6 класса? В обычной средней школе в 6 классе эта или обратная задача обсуждается на математике и на географии, по теме расход воды.


    1. Pshir
      12.02.2025 17:59

      Конкретно это словосочетание нигде не проходят. Но такую задачу можно давать в 6 классе. Все знания для её решения у 6-классников есть.


  1. CBET_TbMbI
    12.02.2025 17:59

    Да, наши ИИ пока весьма "так себе" в плане рассуждений (вот в рисовании они не лидеры, но вполне неплохи на фоне других бесплатных - только что в комментариях к этой статье сравнивал)

    А вот задача, если нужна для реальной работы, а не в качестве головоломки, совсем не простая. Ибо практически никакой насос не даст стабильный расход вне зависимости от гидравлических факторов. На самом деле любой насос работает с определённой зависимостью расхода от напора (чем больше напор, тем меньше расход). А напор, в свою очередь зависит от характеристик сети (потерь напора). А потери напора, зависят от скорости течения. А скорость течения зависит от расхода. Круг замкнулся. Это всё полноценно может посчитать только тот, кто прошёл полноценный курс гидравлики.


    1. 200sx_Pilot
      12.02.2025 17:59

      Что-то я нигде в задаче не нашел ничего про насос.

      Чтобы вода текла по трубе - насос не обязателен.


      1. aboutmurena
        12.02.2025 17:59

        достаточно чтобы труба сжималась


      1. CBET_TbMbI
        12.02.2025 17:59

        Если труба самотёчная, то тем более нужны гидравлические расчёты. Это только в школе вода из бассейнов вытекает с равномерной скоростью.


        1. Veracious Автор
          12.02.2025 17:59

          Есть емкость объёмом 10 куб. метров установленная в цеху на отметке 20 метров, в неё врезана трубка и через 100 метров в другом конце цеха на другом конце трубки установлен вентиль и расходомер. Открываем вентиль устанавливая расход воды в 100 литров в час. Вода идеально чистая, трубка нержавеющая, ничего не засорится. Через какое время расход воды изменится более чем на 1% при учёте что в ёмкость вода постоянно доливается по сигналу датчика уровня.

          Да примерно никогда, если ничего не сломается.


          1. randomsimplenumber
            12.02.2025 17:59

            Скучно у вас. Насосов нет, клапанов нет, гидроударов нет.


            1. Veracious Автор
              12.02.2025 17:59

              Это Я просто для примера к чему задачу притянуть, в реальности очень не скучно


              1. sansar
                12.02.2025 17:59

                есть и более прикладные - жизненные.

                Какая реально нужна вытяжка, чтоб магистральный газ на кухне не бахнул. Есть подсказки от "высокоразвитой цивилизации" типа СНиП и СП......а есть те самые из "..и так сойдёт.."


          1. CBET_TbMbI
            12.02.2025 17:59

            Если всё уже построено и всё есть константа, то и задачи особо нет. Раз определил и всё. Задача возникает, когда возникнет потребность предсказать изменение. Например:

            • Хотим, чтобы вода доходила не за 45 секунд, а за 10. Какой диаметр взять?

            • Нам надо трубу переложить по новому пути, но увеличение времени не должно составить более 5 секунд. Как этого добиться?

            • Бак высоко, неудобно. Что будет, если мы его на 10 метров ниже поставим?

            Вот тут без хорошего знания гидравлики не обойтись.

            И, кстати, хитрость (если на самом деле такая задача возникнет): эксперементальное определение расхода может служить проверкой расчётов. Наймёте гидравлика, попросите его посчитать и новый трубопровод, и существующее значение расхода по существующей геометрии трубопровода. Если не сильно ошибётся в этом, значит и в другом расчёте прав.


          1. Wesha
            12.02.2025 17:59

            Да примерно никогда, если ничего не сломается.

            Но тогда нахуа кому-то надо знать транспортное запаздывание? Открыл крантик (на конце трубы) — и оно тут же потекло!


            1. sansar
              12.02.2025 17:59

              ну например обоснование рециркуляции ГВС в "бюджетке", например пионер-лагере. Что выгоднее усложнить систему или смириться со "сливом" пока тёпленькая пойдет?! иногда разница очень чувствительна.


    1. Veracious Автор
      12.02.2025 17:59

      В задаче указано что расход воды 100 литров в час, как этого добились другой вопрос. Так что это именно школьная задачка. Не нужно учитывать все сложности вроде характеристик насоса, тем более что его может и не быть, капиллярных эффектов, шероховатостей поверхности, кавитации и прочих умных вещей.


  1. hphphp
    12.02.2025 17:59

    Интересно послушать мнение специалистов Сбера и Яндекса.

    Отличная статься, спасибо - такие тесты всегда будут нужны, вне зависимости от уровня "развитости" ИИ.


    1. house2008
      12.02.2025 17:59

      Сделали на коленке, показали по телевизору, топ менеджмент получил годовые премии, в конце года повторить.


      1. kryvichh
        12.02.2025 17:59

        Да сейчас дообучат DeepSeek на русских текстах - и дело в шляпе. Благо, эта модель запускается на любом серверном утюге.


        1. rPman
          12.02.2025 17:59

          Файнтюнить llm-ки не получится, как минимум нужно ЗНАТЬ обучающую выборку и дополнять ее своими данными, не исключая старые (есть техники прореживания датасета для ускорения). Собственно говоря нейронные сети 'открытые' только тогда, когда известны и алгоритм и обучающие данные... данные это исходники а веса - это скомпилированный бинарник.


          1. kryvichh
            12.02.2025 17:59

            Для дообучения LLM с открытыми весами иметь нужно только свой специфический датасет. Спросите у ChatGPT, что требуется для файнтюнинга LLM.


  1. Regis
    12.02.2025 17:59

    Вообще в принципе к ИИ идти за вычслениями - так себе идея, так как они сильно не для этого предназначены, а интеграция с вычислительными тулами есть не всюду. Поэтому лучше просить написать и объяснить формулу, а вот считать - уже отдельно самостоятельно.
    Но эксперимент хороший, показательный.