В разделе Обзор у ChatGPT можно увидеть список приложений (жпт-шек), созданных и натасканных по определенной теме.
Именно там я и искала помощника по визуализации данных, чтобы посмотреть, как у нас дела обстоят с автоматизацией создания графиков.
Выбирала помощника я по количеству комментариев, по описанию и по завлекательности (например, лучшие датавиз практики привлекли меня, несмотря на малое число комментов). А вот в датасаянс я не пошла, там явно акцент на другом.
Во всех ЖПТ-шках процесс моего тестирования был примерно одинаковый:
Загружаю таблицу CSV с данными о результатах опроса с компьютера (можно подключить с гуглдиска, но я не стала тут правами делиться).
Выбираю один из предложенных вариантов беседы, что поинтереснее (у жпт-шек часто есть варианты диалога, так что не надо все руками писать).
Слежу за развитием событий, добавляю пожелания.
ЖПТ-шками, которые занимаются анализом данных, успешно пользоваться получится только под премиум, потому что многие функции сильно ограничены. Несколько запросов в день вы сделать сможете, но на самом интересном месте наступит пауза… Ждите несколько часов.
У меня сейчас премиум, так что развлекаюсь.
Data Visualization Expert #1
Итак, первый кандидат. Посмотрим, что он сможет нам визуализировать на примере датасета о предпочтениях в напитках датавиз чата. Это простой набор данных из гугл-опроса, где есть срез по возрастам, полу, географии и профессии, а также список предпочтений в алкогольных и безалкогольных напитках.
Жпт-шка предлагает создать скаттерплот или барчарт на основе датасета. Будем слушаться ее предложений.
Аналитика не особо полезная. Что до визуализации, она тоже не очень удачная:
Подписи по диагонали трудно читать. Что стоило сделать барчарт горизонтальным?
Нет меток данных, данные воспринмать сложно.
Зачем-то нарисована сетка, если от горизонтальной хоть прок есть, вертикальная просто так.
Но хоть отсортированы значения, уже хорошо.
В итоге, я нажимала на предложенные кнопки, а он рисовал мне графики. Часто там была проблема с цветом, смысл то был, то не был. В какой-то момент я запросила нормализировать бар-чарты, потому что все распределение показывало в итоге гендерный состав чата, а не информацию о напитках. Дальше он работал уже с процентами.
Так как чатжпт показывает, как он кодит, то видно, что графики сделаны на matplotlib - питоновской библиотеке для анализа данных и визуализации. Но там не так много чего можно настроить красивого, а то, что можно - чатжпт не настраивает.
Так что красивых визуализаций тут ждать не нужно. Максимум - получится оценить структуру данных. Что тоже может быть неплохо. Но сходу симпатичных отчетов не ждите.
Вот вам еще пример визуализации:
Ух!
В какой-то момент появилась возможность делать графики интерактивными. Интересное свойство (работает не для всех типов диаграмм). Исследуем!
График вдруг меняется, немного скругляется - возможно, это уже другая библиотека вступает в игру. Спросим. И действительно. Plotly - более мощная питоновская библиотека визуализации, позволяющая интерактивность.
Вот так выглядит график с включенной интерактивностью.
В настройках графика появляется возможность изменить цвет легенды. И можно график скачать. Уже неплохо.
Кроме собственно визуализаций, жпт-шка делает также выводы, хотя они редко полезные, обычно это общие слова обо всем и ниочем:
Предлагаемые варианты анализа дают ка подтверждение своей идеи графики, но это обычно не очень удобно считывается. Зато посмотрите на эту палитру!) Ух, аж захватывает дух!
Выводы:
Понравилось, что можно просто тыкать в варианты анализа данных.
Графики оформленны вообще не по лучшим практикам визуализации данных.
Цвета вырви глаз.
Классно, что показывает код и что есть настройки графиков, по идее можно запросить визуальное улучшение графиков, но я не стала.
Data Visualization Expert #2
Теперь попробуем этого красавца (мило, что его зовут также как и первого, меня заинтриговало описание про лучшие датавиз практики, которым он следует).
Ну что ж. После ответа на предложенное “Создать графики на основе этого датасета”, я получаю тот же график в matlibplot только синий. И где же лучшие практики датавиза? почему на бочок не положили, чтобы подписи стали горизонтальными? Где метки данных?.. (риторические вопросы)
Тогда я решила уже напасть на него серьезнее, не хочется видеть все то же самое, только в синей палитре, что и у прошлого подопытного.
Пайчарт! Не очень старался:
Сектора не отсортированы от полудня.
Слишком много секторов (стоило объединить часть в "Прочее").
Но есть метки данных, что я начинаю ценить.
О, а вот и барчарт на бочку. На самом деле не все так плохо, визуал и правда стал получше, хотя до лучших практик тут еще ползти и ползти…
Зачем у графика рамка?
Зачем контуры у баров?
Где метки данных? Если бы они были, можно было бы убрать не очень полезную ось.
Следующее мое коварство, конечно, было про дата-сторителлинг:
В итоге тоже получаю набор сомнительных графиков и некоторые выводы. Но тут мы уже видим хоть каку-то конкретику, а не только “разнообразные предпочтения”. Хотя график страшен, как смертный грех. И конечно, никакого сторителлинга в нем нет!
И тут он меня удивил. Появилась вот такая плашка:
Конечно, я хочу дашборд! Я люблю дашборды, меня хлебом не корми, дай сделать какой-нибудь дашборд! Больше дашбордов богу дашбордов!!!
И вот он мой дашборд! Да... Он собрал все те же графики, что выдал мне в начале, кучкой. Ну не милун ли?
Потом появилось предложение, от которого BI-аналитику очень сложно отказаться… Мне предложили ДОБАВИТЬ ИНТЕРАКТИВНОСТИ в мой прекрасный дашборд.
О да. Дайте две!
Это было непростой задачей. Он мучался. Что-то писал, переписывал. Получал ошибки и сам разбирался с ними, я в этом не участвовала. Только сочувствовала и ела попкорн перед экраном.
И потом предложил мне скачать мой интерактивный дашборд! Я сперва напряглась (картинку дашь, бес??), но это оказался HTML файл. С интерактивным дашбордом! Там можно было наводить на столбик и видеть подсказку! ВОУ ВОУ!
А вы тут кросс-фильтрацию хотели? Ха… (хотя, может, удастся обсудить и это с чатом?)
Из наблюдений за дашбордом - мужчины не пережили переноса в интерактив… Выжили только женские особи. Суровая дашбордная эволюция.
Попытки добыть глубокую аналитику и кросс-фильтрацию провалились.
Но, если вы работаете на питоне - то можно довольно быстро наваять интерактивные панельки. Интересно.
Выводы:
На самом деле, несмотря на скромное количество отзывов, жпт-шка довольно мощная. Интерактивный дашборд - это сильно, я вспоминаю, сколько дней я потратила делая простенький html-дашборд на chart.js, и полагаю, с таким помощником это заняло бы максимум полдня. А то и пару часов.
Понравилось, что он правда пытался улучшать диаграммы, хотя успехи его не очень существенны. Понравилось, что выводы стали конкретнее.
Так что инструмент перспективный, но конечно ошибки выдает, сам от них страдает - это забавно.
Interactive Data Visualization
Воодушевившись возможностями интерактива, я выбрала для опытов вот этого малыша.
Этот товарищ с наскока предложил мне сделать диаграмму Облако слов (Word Cloud)! Конечно же я согласилась, он мне показывать результат не стал, пожужжал там и предложил скачать картинку. Штош. Плюс за старание!
Дальше я скачивала интерактивный график HTML с распределением по возрастам.
Дальше он меня опять отправил устанавливать Dash. Так что на улице питонистов конечно перевернулся грузовик с пряниками… Хотя для JS я тоже использую чат жпт, он мне там рисует всякое красивое))
Ключевые инсайты меня заинтриговали и я продолжила общаться с этим чатом:
Мдамс… распределение показывает четкие группы. Ну теперь-то все понятно. Спасибо, кэп.
Выводы:
Сам графики не показывает, дает ссылку на скачивание. Таинственный такой.
Готов помогать делать в интерактив, но это уже вне его компетенций из коробки.
Выводы делает так себе
Не, ну вы видали облако слов??
Data Visualization Expert #3
Как я говорила, я люблю дашборды, люблю Power BI и Tableau, так что не могла пройти мимо очередного датавиз эксперта, который работает с биай.
В целом поболтать с ним было интересно, он подготовил мне данные для дашборда в Tableau и говорил что делать. Но я хотела выжать из него креативную сложную визуализацию. Посмотрим, получится ли.
Красавчик долго думал и в итоге… сделал мне хордовую диаграмму!
Правда это не хордовая.
И не в Tableau, а на питоне..
Но плюс за попытку.
Так, давайте будем упрямее.
Ну что, погнали?
Самое классное конечно, что можно делать скриншот ошибки и сразу прикладывать. И он понимает. Богично!
В итоге я загрузила данные в Tableau, соединила (не с первого раза) две таблицы, создала 6 простых переменных, копируя нужные формулы. Но диаграмма из них так и не собралась… Проблемы с контекстом вычислений, и со скриншотами, и без, мы ее не решили. Опять придется идти на Tableau Public и TuTube, чтобы сделать сложную креативную диаграмму.
Но попытка выглядела реалистично!
Выводы:
Потенциал есть, но результата особо не получили
Впрочем, хордовая это вам не хухры-мухры, думаю, с обычными диаграммами скрипт неплохо справится.
Очень понравилось кидать скриншоты ошибок. Ведь тут их текстом не добыть. Новый успешный опыт, раньше такого не пробовала.
Общие выводы
1) Ну что ж, интересно следить за успехами в этом направлении. ChatGPT действительно неплохой помощник в анализе данных - например, когда нужно немного переверстать ваш набор данных и посмотреть общую структуру данных (никуда не ходя).
2) Прикольно, что он стал хорошим помощником программистов и биайщиков, можно пробовать что-то кодить с их помощью и писать формулы.
3) Что насчет красивых визуализаций - этого я пока что нигде не вижу. Все-таки точной настройки не хватает, строгих правил. Может быть, мне не попалась хорошая жпт-шка, может быть, АИ этого в принципе пока не понимает. Будеми наблюдать. Пишите, если знаете такое!
4) Много занятных открытий: Дашборды! Интерактивные графики! Чтение ошибки по скриншоту! Облако слов! Псевдохордовая!
Спасибо, что прочитали!
Мена зовут Наталья Киселева. Я эксперт по визуализации данных и смежным направлениям, преподаю и веду каналы по теме датавиза. Про Дата-сторителлинг и про Дата-комиксы.
engine9
Я использовал o1 для того, чтобы он мне из набора сырых данных (на пару десятков строк, правда) создал код для gnuplot и он справился отлично и помог с оформлением графика. Очень удобно, т.к. я редко используемые синтаксисы забываю.
eolay Автор
О мне тоже кажется, что для таких целей он прям неплохо работает! Я его заставляла мне код для p5.js писать. Конечно, на некоторых моментах сложных тонкой настройки он буксует, но сделать прям рабочую рыбу с ним можно неплохо! Так что для программистов имхо это прям тема)