Введение

Статей о GPT написано уже немало, и многие знакомые мне аналитики заявляют, что ни разу не использовали его возможности. Ввиду этого, я хочу подробно раскрыть эту тему, предоставив практические примеры и доказательства эффективности.

Жизнь аналитика данных – это постоянная гонка. Каждый день – новые задачи, новые данные, новые дедлайны, и кажется, что объемы информации растут быстрее, чем наши способности их обрабатывать. Это постоянный стресс, борьба с дефицитом времени и постоянная усталость. Но что если я скажу вам, что существует способ значительно упростить вашу жизнь и освободить ценное время для более важных задач, стратегического мышления и креативного анализа? Знакомьтесь, GPT – этот настоящий прорыв в мире генеративного ИИ, который меняет «правила игры» на рынке аналитики данных.

GPT: помощник или угроза для аналитика данных

Нужны ли нам еще аналитики данных в эпоху GPT? Возможно, нет.

Эта модель ИИ с лёгкостью обрабатывает огромные объемы данных, создает замысловатые визуализации и генерирует отчеты с немыслимой быстротой. GPT не только автоматизирует рутинную работу, но и способна выявлять скрытые закономерности, на что традиционным аналитикам уходят месяцы. Возникает вопрос: а нужны ли теперь специалисты, если GPT может делать их работу лучше и быстрее?

Может пора людям начинать бунты и бойкотировать подобные инновации на корню, подобно луддитам в Англии XIX века.

[https://ru.wikipedia.org/wiki/Луддиты]

Рассмотрим, возможности GPT на практике

Автоматизация отчетности: Допустим, вам нужен ежедневный отчет о продажах по каждому региону. Вместо ручного составления отчета из нескольких источников данных и создания графиков, вы можете задать GPT запрос:

Сгенерируй отчет о продажах за вчерашний день, включая данные по каждому региону (Восток, Запад, Север, Юг), с указанием количества проданных единиц и выручки. Представь данные в виде столбчатой диаграммы.

GPT сгенерирует отчет, значительно сокращая время на рутинную работу.
GPT сгенерирует отчет, значительно сокращая время на рутинную работу.

Предобработка данных: Представим, что у вас есть набор данных с пропущенными значениями и некондиционными форматами дат. Вместо ручного заполнения и преобразования данных, вы можете дать GPT команду:

"Очисти данные в файле 'data.csv'. Замени пропущенные значения в столбце 'цена' средним значением, а в столбце 'дата' исправьте формат на YYYY-MM-DD."

GPT выполнит предобработку, экономя ваше время и уменьшая риск ошибок.
GPT выполнит предобработку, экономя ваше время и уменьшая риск ошибок.

Генерация кода: Нужно написать сложный SQL-запрос для извлечения данных из базы данных? Забудьте о часах поиска правильного синтаксиса! Запрос:

"Напиши SQL запрос для извлечения данных о клиентах, совершивших покупки свыше 1000 рублей в период с 1 января по 31 марта 2024 года, включая их ID, имя, email и сумму покупок. База данных – MySQL."

GPT сгенерирует эффективный и корректный код. Пример кода:

SELECT
	customer_id,
	 customer_name,
	customer_email,
	SUM(purchase_amount) AS total_purchases
FROM customers
JOIN purchases ON customers.customer_id = purchases.customer_id
WHERE purchase_date BETWEEN '2024-01-01' AND '2024-03-31'
GROUP BY customer_id, customer_name, customer_email
HAVING SUM(purchase_amount) > 1000;

Первичный анализ текстовых данных: Вам нужно проанализировать 500 отзывов клиентов? GPT поможет:

"Проанализируй предоставленные отзывы клиентов (прикреплен файл 'reviews.csv') и определи три основные темы, выделив положительные и негативные упоминания для каждой темы."

GPT быстро выявит ключевые темы и сэкономит вам часы ручного анализа.
GPT быстро выявит ключевые темы и сэкономит вам часы ручного анализа.

Реальные примеры: измеримое ускорение работы

Пример 1: Автоматизация ежемесячного отчета по маркетинговым кампаниям.

В среднем подготовка данного отчета занимает 2 дня (16 часов). Проблема заключалась в сборе данных из различных источников (ERP-система, CRM-система, внутренняя база данных) и их согласовании. Воспользуемся GPT для генерации текста отчета, запроса данных из разных источников, и создания графиков. Запрос будет примерно таким:

"Сгенерируй отчет по маркетинговым кампаниям за март 2024 года. Источники данных: Прикрепленные csv- файлы. (Желательно указать ключи для связки) Включи данные о CTR, конверсии, стоимости привлечения клиента (CAC) и общей выручке. Представь данные в виде таблиц и графиков."

Время сократилось до 4 часов (75% экономия времени). Более того, можно сделать сравнение с «ручными» отчетами.

Плюс огромное удобство для компаний где до сих пор для анализа используют Excel с излюбленным «ВПР» для связки источников.

Пример 2: Сегментация клиентов на основе анализа отзывов.

Анализ 10 000 отзывов вручную занял бы неделю. Проблема заключалась в большом объеме текста и необходимости выделить ключевые темы и эмоции. Запрос к GPT:

"Проанализируй 10 000 отзывов клиентов (прикреплен файл 'customer_reviews.csv') и классифицируй их по тональности (положительная, отрицательная, нейтральная). Выдели 5 ключевых тем и сгруппируй клиентов по сегментам на основе этих тем."

GPT классифицировал отзывы за 1 час (более чем 90% экономии времени). Это позволило быстро идентифицировать ключевые проблемы (например, низкое качество обслуживания) и разработать целевые маркетинговые кампании, приведшие к 15% росту продаж в целевом сегменте, что подтвердилось A/B тестированием.

Пример 3: Разработка сложного ETL-процесса для миграции данных.

Создание скрипта для извлечения, преобразования и загрузки данных (ETL) обычно занимает несколько дней из-за сложности кода и обработки ошибок, а также углубления в бизнес-процесс. Проблема заключалась в написании надежного и эффективного кода на Python. Используя GPT для генерации фрагментов кода (включая обработку исключений и логирование), и документации, время разработки сократилось в два раза. Запрос:

"Напиши Python скрипт для ETL процесса: извлечение данных из файла CSV 'source.csv', преобразование данных (замена значений, изменение типов данных), и загрузка данных в базу данных PostgreSQL. Важно учесть обработку возможных ошибок и добавь логирование."

Тестирование также сократилось на 40%, благодаря более четкому и структурированному коду.

Пример из моего опыта.

В 2023 году, работая над проектом, я активно использовал GPT для написания SQL-запросов для базы данных Firebird. Проблема заключалась в сложности синтаксиса Firebird и поиске нужных функций. GPT генерировал сложные запросы за секунды, экономия времени составила более 50%, что позволило ускорить разработку и внедрение решений в 2 раза.

Кажется это идеальное решение, зачем же тогда человек для работы с данными?

Ограничения GPT: Человеческий фактор остается важным

GPT демонстрирует значительный потенциал как инструмент, но его функциональность ограничена его зависимостью от данных обучения и отсутствием способности к самостоятельному суждению. И вот что он не умеет:

Понимать нюансы: Однажды GPT анализировал отзывы о новом продукте. Он выделил большое количество негативных отзывов, включая ироничные комментарии довольных клиентов. Человек должен проверить результаты и отфильтровать ироничные отзывы.

Понимать «полет фантазии»: Как часто на вход от бизнес - пользователя мы получаем понятную задачу?

Как правило они больше идут в формате полета фантазии и чтобы сформулировать эту фантазию в четко поставленную задачу требуется погружение в процессы бизнеса.

Выявлять скрытые корреляции: GPT обнаружил корреляцию между продажами и температурой воздуха. Однако, он не смог уловить более сложную взаимосвязь, влияние рекламной кампании, которая была запущена в период повышения температуры. Здесь потребовалась экспертиза человека.

Проверять достоверность данных: GPT сгенерировал отчет, основанный на некорректных данных из устаревшего источника. Это подчеркивает необходимость проверки данных перед использованием результатов GPT.

Принимать сложные решения: GPT предложил несколько вариантов решения проблемы, но окончательное решение, учитывающее бизнес-контекст и риски, человек должен принять сам.

Аналитик vs GPT

Представьте себе: аналитик данных – это опытный шахматист, который продумывает каждый ход, видит сложные комбинации и стратегии. GPT – это мощный шахматный компьютер, который с молниеносной скоростью просчитывает миллионы вариантов, но не понимает стратегической цели игры. Аналитик задает направление, а GPT выполняет сложные вычисления, освобождая аналитика от рутинной работы. Вместе они – непобедимая команда!

GPT пытается стать аналитиком данных

Представим, что GPT решил попробовать себя в роли аналитика данных. Вот что из этого вышло:

Задача: Проанализировать данные о продажах пиццы.

GPT, получив данные, выдал следующий вывод: “Продажи пиццы коррелируют с количеством заказов пиццы. Рекомендация: увеличить количество заказов пиццы.

Данный вывод воплощение абсолютной логики машины.

”Человек бы еще учел сезонность, акции конкурентов и наличие ананаса на пицце.

Задача: Создать дашборд для отслеживания эффективности маркетинговой кампании

GPT сгенерировал дашборд, в котором все графики были разного размера, цветов и стилей. Заголовки были написаны разными шрифтами, а некоторые данные отображались в виде сложных математических формул.

 Человек бы позаботился о визуальной привлекательности и понятности, а также о сценарии использования.

Задача: Сегментировать клиентов по уровню удовлетворенности.

 GPT разделил клиентов на две группы: “довольны” и “недовольны”.

 Аналитик бы создал более детализированную сегментацию, учитывая степень удовлетворенности и причины недовольства.

В итоге, GPT понял, что аналитика данных – это не только обработка данных, но и искусство интерпретации, креативности и глубокого понимания бизнеса. Аналитик – это тот, кто превращает данные в ценные инсайты, а GPT – его верный помощник в этой нелегкой, но увлекательной работе.

Конечно, выше перечисленные примеры указывают лишь на первые итерации запроса в GPT, что бы получить более точные ответы я выделил пару советов по работе с ним.

Основные советы по эффективному взаимодействию с GPT

Эффективность работы с GPT напрямую зависит от того, насколько точно вы формулируете свои запросы. Вот несколько советов:

Четко формулируйте свои запросы: Вместо “дай мне данные о продажах”, лучше: “Предоставь данные о продажах продукта X за период с 01.01.2024 по 31.03.2024, разбитые по регионам и каналам сбыта, в формате CSV”.

Используйте ключевые слова: Вместо “информация о клиентах”, используйте “список клиентов с указанием ID, даты регистрации, суммарных покупок за последний год и среднего чека”.

Экспериментируйте с разными формулировками: Если “Напиши отчет о продажах” не сработало, попробуйте: “Напиши краткий отчет о продажах за прошлый месяц, включая общую сумму, количество проданных товаров, средний чек и конверсию”. Иногда даже незначительное изменение формулировки приводит к значительно лучшему результату.

Указывайте контекст: Для более точных результатов предоставляйте достаточно контекста. Укажите название проекта, тип данных, используемые инструменты и т.д.

Используйте итеративный подход: Не ожидайте идеального ответа с первого раза. Задавайте уточняющие вопросы, вносите коррективы и постепенно доводите результат до совершенства.

Проверяйте результаты: GPT может допускать ошибки. Критическое мышление и самостоятельная проверка результатов остаются важными.

Экспериментируйте с различными функциями: GPT может помочь с переводом текста, резюмированием, написанием кода и многим другим.

Заключение

Миф о полной замене аналитиков ИИ – это преувеличение. GPT, безусловно, виртуозно справляется с множеством задач, автоматизируя составление отчетов, генерацию SQL-запросов и визуализацию данных. Однако его сильные стороны наиболее эффективно проявляются в сочетании с человеческим интеллектом. GPT не заменит вашу способность формулировать стратегические гипотезы, выявлять скрытые закономерности и применять глубокое понимание бизнес-контекста. Вместо этого, он становится вашим надежным партнером, освобождая от рутинной работы и позволяя сосредоточиться на более важных задачах: анализе сложных тенденций, формировании инновационных гипотез и принятии взвешенных решений. Использование GPT — это не просто интеграция новой технологии, а качественный скачок в эффективности вашей работы.

Поделитесь своим опытом в комментариях!

Комментарии (11)


  1. BitWood
    13.12.2024 16:04

    ".. GPT не заменит вашу способность формулировать стратегические гипотезы " - а как определить, что такая способность у конкретного человека есть? Вот сам GPT вполне в состоянии по запросу сформулировать эту самую гипотезу, насколько качественно, и вообще как сравнивать сами эти "стратегические гипотезы" это отдельный интересный вопрос.


    1. Oleg_Dmitriev1 Автор
      13.12.2024 16:04

      Определить, есть ли такая способность у конкретного человека…

      Думаю это зависит от самого человека, каждый индивидуален.

      Не буду спорить, что способность формировать стратегические гипотезы, не даны каждому человеку.

      Вопрос насколько качественно, или как сравнивать.

      Определить без тестирования, мы можем лишь опираясь на наш опыт, обратную связь от других экспертов.

      Если мы выстраиваем стратегию, при невозможности сбора предварительного опыта, то фактически тестировать каждую из полученных стратегий и определяя ценность каждой из них.

      Конечно в ходе тестирования появится множество нюансов, а так же перед стартом может возникнуть масса стоп факторов по которым мы понимаем, что данный эксперимент не применим в конкретной сфере.

      Людям свойственно действовать/ принимать решение по наитию (даже при нехватке данных для анализа) - попросту говоря, авантюризм.


      1. BitWood
        13.12.2024 16:04

        Тут мы выходим на тонкий лёд, в таких рассуждениях получается очередной критерий сегрегации людей. А это не к добру. Лучше поискать другие подходы и пути.

        Причиной того, что изначально, вроде бы, добрые намерения и логичные рассуждения выводят тонки лёд, возможно является априорная установка на достижение некой материальной цели, в частности в виде средства изменения ситуаций, а вообще неких контролируемых изменений в среде обитания. Но обязательно ли нужна практическая цель? Почему бы не поразмыслить над "бесцелевым подходом", в котором всё выстраивается вокруг направления действий или изменений. Разница такая-же как между отрезком и лучом.