Хочу поделиться эмоциями. Нужно было для жены визуализировать что такое ретроградный меркурий. В последнее время все подобные вопросы решаю через ИИ, но думал, что с таким оно не справится. Открыл свой ИИ агрегатор и попросил сделать анимацию солнечной системы с реальными орбитами и скоростями, а при наведении мышкой, чтобы выводил основную информацию по планетам. Все запросы делались через API, а не напрямую в ИИ. Вероятно, если делать напрямую - результат будет лучше. Запрос буквально в несколько строк и получил вот такую штуку http://aipanda.online/test/sun/sunsystem.html

Это меня безумно воодушевило и дальше я попросил сделать визуализацию движения меркурия по небосклону если наблюдатель на земле и визуализировать ретроградность меркурия. Лучше всего с этой задачей справился deepseek и первое, что он выдал и стало финальным вариантом. Это надо видеть в динамике, потыкать можно тут — https://aipanda.online/test/sun/mercury.html

Ну и понеслось. Решил сравнить, как с этой задачей справятся разные нейросети. Сравнивал разные модели: O4 mini, Яндекс, Sonar, GPT 4.1 \nano\mini и deepseek v1\r1 и т.д.
DeepSeek R1
Реально готовый(ctrl+c ctrl+v) и красивый результат выдал только DeepSeek, при этом R1 дает более красивую картинку - https://aipanda.online/test/sun/sunsystemr1.html


Такой красоты вообще не ожидал, окошки с информацией открываются плавно, все двигается, весь интерфейс в едином стиле.
Сам запрос не составлялся специально, а был потоком мысли. И звучал так:
Сделай интерактивную модель солнечной системы на HTML + JS в одном файле. Внизу выведи управление скоростью вращения. Стартовая скорость = 1 год — 20 секунд. При наведении на каждую планету или нажатии выводи во всплывающем окне подсказку с основными данными о планетах: размер, вес, класс, атмосфера, скорость вращения, длина дня, длина года. У каждой планеты должно быть подписано название. Скорость должна быть управляемой.
GPT 4.1 nano - Неудача
Сначала выдал черный экран и шкалу изменения скорости без планет. Попросил исправить. Появились планеты и подсказки, но вся система не двигалась.

попросил исправить еще раз, но анимация так и не появилась и снова все планеты пропали
GPT 4.1 mini
Справился лучше нано, но спалил меркурий в 2027 году об солнце. После нескольких доработок стало работать, первоначальный вариант вот - https://aipanda.online/test/sun/nano.html

При этом выдал довольно чистый код, но визуализация и решения довольно странные, за-то справился раз в 5 быстрее дипсика.
O4 mini - разочарование
Возлагал на него надежды, но не думая выдал какой-то короткий кусок кода, который визуально хуже нано и толком ничего не работало

Яндекс GPT 5 PRO - не программист
Вообще не справился с задачей даже после 3 просьб исправить код.
Perplexity Sonar - приятно удивил и выдал достаточно чистый HTML, JS и CSS
Для бюджетной нейросети справился достаточно неплохо. С первого раза правда накосячил - не выдал подсказки по планетам, но со второго исправился. Отработал на уровне 4.1 mini

GPT 4.1 - самый дорогой, но не самый лучший
В принципе с заданием справился, результат можно посмотреть тут - https://aipanda.online/test/sun/4.html, честно - ожидал от него результата поинтереснее.

Sonnet Cloudy - Google vertex
Должен приклонить колено - лучшая техническая реализация. Визуально тоже очень хорошо. https://aipanda.online/test/sun/sonnet.html - минималистично, все работает, все точно. Чуть менее красиво дипсика и отказался всплывашки делать по клику, только подсказки при наведении.

GROK 4 xAi - технический минимализм
С задачей справился полностью, но визуал очень аскетичен. Самый короткий код - всего 180 строчек. Но все сделал, даже всплывашки по клику, адаптива фактически нет, но декстоп неплох - https://aipanda.online/test/sun/grok.html

Cohere Command A
Можно было не проверять, исправлять доп запросами уже смысла не видел, выглядит стремно, с задачей не справился

Вместо заключения
Вот такой странный обзор-сравнение получилось. Все опыты проводились на собственном агрегаторе нейросетей, так что могут быть чисто технические проблемы в самом сервисе.
Итоги будут такими:
DeepSeek R1 - красавец, пожалуй самая технологичная и красивая реализация
DeepSeek V1 - более минималистичный, но реализация тоже прекрасна, особенно что касается визуализации
Sonnet Cloudy - прекрасная техническая реализация и минимализм в визуале
Остальных не вижу смысла добавлять в сравнение. Всем спасибо, вдруг кому будет полезно.
Комментарии (3)
SolidSnack
11.07.2025 17:05Нейросети это конечно прекрасно, но если посидеть и почесать репу (сырую), можно и самому жену порадовать
rPman
Советую по умерить восторги, потому что если с первого раза с таким простым промптом получается красивый (или насыщенный функционалом) - значит это просто выученный готовый результат.
Хорошим способом проверить будет попытки дальнейшей модификации результата а главное, реакцию на ошибки и способы их исправления.
p.s. openai лучшая версия ИИ - openai:o3 и соответственно o3 pro (80$ за миллион токенов), и моя практика показывает что она косячит более чем.
p.p.s. с ИИ нужно работать как с человеком, точнее системным промптом необходимо из него построить человека-разработчика. Первым делом - ТЗ. Просите ИИ проанализировать задачу, задать наводящие вопросы, и делать это по кругу до тех пор, пока ИИ поймет задачу и у него не останется вопросов. После этого необходимо задать вопрос - какими технологиями эту задачу можно было бы решить, пусть предложит варианты, с достоинствами и недостатками. Затем добавить выбранную технологию в ТЗ... затем попросить ИИ создать структуру приложения (какие файлы), и затем уже просить его заполнять эти файлы содержимым. На каждом шаге нужно дополнять системный промпт собранной информацией (само содержимое файлов не нужно таскать, но для проектов по крупнее возможно таскать 'заголовочные' файлы - список структур, классов, методов с уже созданными именами и документацией по ним, что бы в разных файлах использовались одни и те же.
Очень редко живые разработчики пишут проект целиком за один раз, обычно как раз наоборот, создается какой то начальный проект, и шаг за шагом наполняется функционалом и тестами. Вот и с ИИ нужно делать так же.
Vkkiwi Автор
Серьезной разработкой лучше все таки в средах специальных заниматься, а не общаться как с человеком с базовым ИИ. Тот же курсор. Тут вопрос про то, как решает задачи обывателя базовый функционал. Уже после того, как написал, попробовал нестандартные задачи, например, игры разные. Примерно такой же результат. Могу еще обзор сделать.