Скетч Натальи Киселевой (мой)
Скетч Натальи Киселевой (мой)

В разделе Обзор у ChatGPT можно увидеть список приложений (жпт-шек), созданных и натасканных по определенной теме. 

Именно там я и искала помощника по визуализации данных, чтобы посмотреть, как у нас дела обстоят с автоматизацией создания графиков. 

Выбирала помощника я по количеству комментариев, по описанию и по завлекательности (например, лучшие датавиз практики привлекли меня, несмотря на малое число комментов). А вот в датасаянс я не пошла, там явно акцент на другом. 

Список приложений в ChatGPT на тему визуализации данных
Список приложений в ChatGPT на тему визуализации данных

Во всех ЖПТ-шках процесс моего тестирования был примерно одинаковый:

  • Загружаю таблицу CSV с данными о результатах опроса с компьютера (можно подключить с гуглдиска, но я не стала тут правами делиться).

  • Выбираю один из предложенных вариантов беседы, что поинтереснее (у жпт-шек часто есть варианты диалога, так что не надо все руками писать).

  • Слежу за развитием событий, добавляю пожелания.

ЖПТ-шками, которые занимаются анализом данных, успешно пользоваться получится только под премиум, потому что многие функции сильно ограничены. Несколько запросов в день вы сделать сможете, но на самом интересном месте наступит пауза… Ждите несколько часов. 

У меня сейчас премиум, так что развлекаюсь. 


Data Visualization Expert #1

Итак, первый кандидат. Посмотрим, что он сможет нам визуализировать на примере датасета о предпочтениях в напитках датавиз чата. Это простой набор данных из гугл-опроса, где есть срез по возрастам, полу, географии и профессии, а также список предпочтений в алкогольных и безалкогольных напитках.

Жпт-шка предлагает создать скаттерплот или барчарт на основе датасета. Будем слушаться ее предложений.

Скриншот ответа жпт-шки
Скриншот ответа жпт-шки

Аналитика не особо полезная. Что до визуализации, она тоже не очень удачная:

  • Подписи по диагонали трудно читать. Что стоило сделать барчарт горизонтальным?

  • Нет меток данных, данные воспринмать сложно.

  • Зачем-то нарисована сетка, если от горизонтальной хоть прок есть, вертикальная просто так.

  • Но хоть отсортированы значения, уже хорошо.

В итоге, я нажимала на предложенные кнопки, а он рисовал мне графики. Часто там была проблема с цветом, смысл то был, то не был. В какой-то момент я запросила нормализировать бар-чарты, потому что все распределение показывало в итоге гендерный состав чата, а не информацию о напитках. Дальше он работал уже с процентами.

Не самый удачный выбор визуализации
Не самый удачный выбор визуализации

Так как чатжпт показывает, как он кодит, то видно, что графики сделаны на matplotlib - питоновской библиотеке для анализа данных и визуализации. Но там не так много чего можно настроить красивого, а то, что можно - чатжпт не настраивает. 

Так что красивых визуализаций тут ждать не нужно. Максимум - получится оценить структуру данных. Что тоже может быть неплохо. Но сходу симпатичных отчетов не ждите.

Вот вам еще пример визуализации:

Розовый вошел в чат
Розовый вошел в чат

Ух!

Очень сурово. Опять же, что мешало сделать столбики горизонтальными и отсортировать по одной из категорий
Очень сурово. Опять же, что мешало сделать столбики горизонтальными и отсортировать по одной из категорий

В какой-то момент появилась возможность делать графики интерактивными. Интересное свойство (работает не для всех типов диаграмм). Исследуем!

У графика есть маленькое меню
У графика есть маленькое меню

График вдруг меняется, немного скругляется - возможно, это уже другая библиотека вступает в игру. Спросим. И действительно. Plotly - более мощная питоновская библиотека визуализации, позволяющая интерактивность.

Ответ на мой запрос по теме библиотеки
Ответ на мой запрос по теме библиотеки

Вот так выглядит график с включенной интерактивностью. 

Интерактивный график можно отличить по закругленным барам. И у них есть всплывашки
Интерактивный график можно отличить по закругленным барам. И у них есть всплывашки

В настройках графика появляется возможность изменить цвет легенды. И можно график скачать. Уже неплохо.

Настройки графика
Настройки графика

Кроме собственно визуализаций, жпт-шка делает также выводы, хотя они редко полезные, обычно это общие слова обо всем и ниочем: 

Выводы, который сделало приложение на основе набора данных
Выводы, который сделало приложение на основе набора данных

Предлагаемые варианты анализа дают ка подтверждение своей идеи графики, но это обычно не очень удобно считывается. Зато посмотрите на эту палитру!) Ух, аж захватывает дух!

Да, к цветам сложно остаться равнодушным
Да, к цветам сложно остаться равнодушным

Выводы:

  • Понравилось, что можно просто тыкать в варианты анализа данных.

  • Графики оформленны вообще не по лучшим практикам визуализации данных.

  • Цвета вырви глаз.

  • Классно, что показывает код и что есть настройки графиков, по идее можно запросить визуальное улучшение графиков, но я не стала.


Data Visualization Expert #2


Теперь попробуем этого красавца (мило, что его зовут также как и первого, меня заинтриговало описание про лучшие датавиз практики, которым он следует).

Стартовая страница приложения
Стартовая страница приложения

Ну что ж. После ответа на предложенное “Создать графики на основе этого датасета”, я получаю тот же график в matlibplot только синий. И где же лучшие практики датавиза? почему на бочок не положили, чтобы подписи стали горизонтальными? Где метки данных?.. (риторические вопросы)

Не самое лучшее оформление графика
Не самое лучшее оформление графика

Тогда я решила уже напасть на него серьезнее, не хочется видеть все то же самое, только в синей палитре, что и у прошлого подопытного.

Мой новый запрос
Мой новый запрос
Он сделал мне круговую диаграмму!
Он сделал мне круговую диаграмму!

Пайчарт! Не очень старался:

  • Сектора не отсортированы от полудня.

  • Слишком много секторов (стоило объединить часть в "Прочее").

  • Но есть метки данных, что я начинаю ценить.

О, а вот и барчарт на бочку. На самом деле не все так плохо, визуал и правда стал получше, хотя до лучших практик тут еще ползти и ползти…

  • Зачем у графика рамка?

  • Зачем контуры у баров?

  • Где метки данных? Если бы они были, можно было бы убрать не очень полезную ось.

Барчарт не совсем лучших практик
Барчарт не совсем лучших практик

Следующее мое коварство, конечно, было про дата-сторителлинг: 

Мне хотелось, чтобы он подчеркнул н а графике важное. Но делать он этого, конечно же, не стал.
Мне хотелось, чтобы он подчеркнул н а графике важное. Но делать он этого, конечно же, не стал.

В итоге тоже получаю набор сомнительных графиков и некоторые выводы. Но тут мы уже видим хоть каку-то конкретику, а не только “разнообразные предпочтения”. Хотя график страшен, как смертный грех. И конечно, никакого сторителлинга в нем нет!

Довольно страшный график. Стаккт барчарт и так редко бывает полезен, а уж когда столько цветов...
Довольно страшный график. Стаккт барчарт и так редко бывает полезен, а уж когда столько цветов...
А вот список выводов уже приятнее
А вот список выводов уже приятнее

И тут он меня удивил. Появилась вот такая плашка: 

Оооо!
Оооо!

Конечно, я хочу дашборд! Я люблю дашборды, меня хлебом не корми, дай сделать какой-нибудь дашборд! Больше дашбордов богу дашбордов!!!

скетч Натальи Киселевой (мой)
скетч Натальи Киселевой (мой)

И вот он мой дашборд! Да... Он собрал все те же графики, что выдал мне в начале, кучкой. Ну не милун ли?

Дашборд?
Дашборд?

Потом появилось предложение, от которого BI-аналитику очень сложно отказаться… Мне предложили ДОБАВИТЬ ИНТЕРАКТИВНОСТИ в мой прекрасный дашборд.

О да. Дайте две!

Это было непростой задачей. Он мучался. Что-то писал, переписывал. Получал ошибки и сам разбирался с ними, я в этом не участвовала. Только сочувствовала и ела попкорн перед экраном.

Его саморефлексия и черный экран ошибок...
Его саморефлексия и черный экран ошибок...

И потом предложил мне скачать мой интерактивный дашборд! Я сперва напряглась (картинку дашь, бес??), но это оказался HTML файл. С интерактивным дашбордом! Там можно было наводить на столбик и видеть подсказку! ВОУ ВОУ!

А вы тут кросс-фильтрацию хотели? Ха… (хотя, может, удастся обсудить и это с чатом?)

Интерактивный дашборд?
Интерактивный дашборд?

Из наблюдений за дашбордом - мужчины не пережили переноса в интерактив… Выжили только женские особи. Суровая дашбордная эволюция.

Попытки добыть глубокую аналитику и кросс-фильтрацию провалились. 

Нет, я не хочу устанавливать себе на комп питонские библиотеки...
Нет, я не хочу устанавливать себе на комп питонские библиотеки...

Но, если вы работаете на питоне - то можно довольно быстро наваять интерактивные панельки. Интересно. 

Выводы:

  • На самом деле, несмотря на скромное количество отзывов, жпт-шка довольно мощная. Интерактивный дашборд - это сильно, я вспоминаю, сколько дней я потратила делая простенький html-дашборд на chart.js, и полагаю, с таким помощником это заняло бы максимум полдня. А то и пару часов. 

  • Понравилось, что он правда пытался улучшать диаграммы, хотя успехи его не очень существенны. Понравилось, что выводы стали конкретнее.

  • Так что инструмент перспективный, но конечно ошибки выдает, сам от них страдает - это забавно. 


Interactive Data Visualization

Воодушевившись возможностями интерактива, я выбрала для опытов вот этого малыша

Стартовая страница приложения
Стартовая страница приложения

Этот товарищ с наскока предложил мне сделать диаграмму Облако слов (Word Cloud)! Конечно же я согласилась, он мне показывать результат не стал, пожужжал там и предложил скачать картинку. Штош. Плюс за старание!

Скачанная картинка выглядит эффектно, но бестолково. Куда делись пробелы?
Скачанная картинка выглядит эффектно, но бестолково. Куда делись пробелы?

Дальше я скачивала интерактивный график HTML с распределением по возрастам. 

Ну такое... Это даже не про напитки а про демографию группы.
Ну такое... Это даже не про напитки а про демографию группы.

Дальше он меня опять отправил устанавливать Dash. Так что на улице питонистов конечно перевернулся грузовик с пряниками… Хотя для JS я тоже использую чат жпт, он мне там рисует всякое красивое))

Не хочу я ничего устанавливать, я хочу красивый график
Не хочу я ничего устанавливать, я хочу красивый график

Ключевые инсайты меня заинтриговали и я продолжила общаться с этим чатом:

Мне бы пригодилось сразу видеть эти графики... так себе анализ.
Мне бы пригодилось сразу видеть эти графики... так себе анализ.

Мдамс… распределение показывает четкие группы. Ну теперь-то все понятно. Спасибо, кэп.

Выводы:

  • Сам графики не показывает, дает ссылку на скачивание. Таинственный такой.

  • Готов помогать делать в интерактив, но это уже вне его компетенций из коробки.

  • Выводы делает так себе

  • Не, ну вы видали облако слов??


Data Visualization Expert #3

Как я говорила, я люблю дашборды, люблю Power BI и Tableau, так что не  могла пройти мимо очередного датавиз эксперта, который работает с биай.

Стартовая страница приложения
Стартовая страница приложения

В целом поболтать с ним было интересно, он подготовил мне данные для дашборда в Tableau и говорил что делать. Но я хотела выжать из него креативную сложную визуализацию. Посмотрим, получится ли. 

Данные это хорошо, но давай красоту!
Данные это хорошо, но давай красоту!

Красавчик долго думал и в итоге… сделал мне хордовую диаграмму

Правда это не хордовая.

И не в Tableau, а на питоне..

Но плюс за попытку.

Не хордовая диаграмма, не в Tableau
Не хордовая диаграмма, не в Tableau

Так, давайте будем упрямее.

Мой запрос чату
Мой запрос чату

Ну что, погнали?

Нужные данные и вычисления для создания хордовой диаграммы
Нужные данные и вычисления для создания хордовой диаграммы

Самое классное конечно, что можно делать скриншот ошибки и сразу прикладывать. И он понимает. Богично! 

В итоге я загрузила данные в Tableau, соединила (не с первого раза) две таблицы, создала 6 простых переменных, копируя нужные формулы. Но диаграмма из них так и не собралась… Проблемы с контекстом вычислений, и со скриншотами, и без, мы ее не решили. Опять придется идти на Tableau Public и TuTube, чтобы сделать сложную креативную диаграмму.

Но попытка выглядела реалистично!

Выводы:

  • Потенциал есть, но результата особо не получили

  • Впрочем, хордовая это вам не хухры-мухры, думаю, с обычными диаграммами скрипт неплохо справится. 

  • Очень понравилось кидать скриншоты ошибок. Ведь тут их текстом не добыть. Новый успешный опыт, раньше такого не пробовала. 


Общие выводы

1) Ну что ж, интересно следить за успехами в этом направлении. ChatGPT действительно неплохой помощник в анализе данных - например, когда нужно немного переверстать ваш набор данных и посмотреть общую структуру данных (никуда не ходя). 

2) Прикольно, что он стал хорошим помощником программистов и биайщиков, можно пробовать что-то кодить с их помощью и писать формулы. 

3) Что насчет красивых визуализаций - этого я пока что нигде не вижу. Все-таки точной настройки не хватает, строгих правил. Может быть, мне не попалась хорошая жпт-шка, может быть, АИ этого в принципе пока не понимает. Будеми наблюдать. Пишите, если знаете такое!

4) Много занятных открытий: Дашборды! Интерактивные графики! Чтение ошибки по скриншоту! Облако слов! Псевдохордовая!

Спасибо, что прочитали!

Мена зовут Наталья Киселева. Я эксперт по визуализации данных и смежным направлениям, преподаю и веду каналы по теме датавиза. Про Дата-сторителлинг и про Дата-комиксы.

Комментарии (3)


  1. engine9
    09.01.2025 07:51

    Я использовал o1 для того, чтобы он мне из набора сырых данных (на пару десятков строк, правда) создал код для gnuplot и он справился отлично и помог с оформлением графика. Очень удобно, т.к. я редко используемые синтаксисы забываю.


    1. eolay Автор
      09.01.2025 07:51

      О мне тоже кажется, что для таких целей он прям неплохо работает! Я его заставляла мне код для p5.js писать. Конечно, на некоторых моментах сложных тонкой настройки он буксует, но сделать прям рабочую рыбу с ним можно неплохо! Так что для программистов имхо это прям тема)


  1. eeglab
    09.01.2025 07:51

    Проще нативным 4о или о1 пользоваться. Толку от этих помощников ноль в кубе