Привет, аналитики, руководители и основатели Business intelligence компаний!

Я создаю сервис WikiBot, который обучается по документации и консультирует пользователей в чате, как специалист первой линии поддержки. Наш чат-бот понимает вопрос и отвечает как человек. 

Весь мир двигается в сторону использования ИИ-помощников. Людям нравится получать результаты просто давая команды на родном языке.

Предлагаю вам, совместно с моей командой, создать продукт Dashboard.AI, который будет обладать следующим функционалом: 

  1. Поиск отчетов. Менеджер может попросить бота найти нужный отчет. Например: ”Найди отчет о расходах на рекламу за прошлый год”. Бот, на основе списка отчетов, которые находятся в дата-каталоге, конфлюенс или другой вики, присылает ссылку в чат. 

  2. Написание SQL-запросов. Вместо поиска нужного отчета, менеджер пишет в чате боту: "прибыль по Москве по электронике с мая по июль". Бот присылает нужные показатели и ссылку на нужный отчет, c установленными фильтрами. Если подходящего отчета нет, то сам пишет sql запрос.

  3. Автоматическое создание дашбордов. Менеджер может попросить чат-бота создать дашборд. Бот, задав несколько уточняющих вопросов, выберет оптимальный шаблон и соберет в нем все необходимые SQL-запросы и фильтры. 

Реализация

Поиск отчетов. Список отчетов обычно располагаются в базе знаний, документации или каталоге данных. Современные продукты, такие как SiteGPT, ChatBase, WonderChat, Wikibot (далее агент) отлично умеют делать семантический поиск:

  1. Документация индексируется и сохраняется в векторную базу данных. 

  2. Когда пользователь вводит запрос, в векторной базе находится 5-10 наиболее близких векторов (семантический поиск). Каждый вектор это название и описание отчета.

  3. Запрос пользователя и топ близких векторов отправляются в LLM - большую языковую модель (LLaMA, Falcon, Google Bard,  Anthropic Claude) и она выбирает отчёты которые подходят пользователю. 

Написание SQL-запросов 

Современные LLM уже неплохо пишут SQL (статья с сравнением GPT, Claude, Bard) для  этого им нужно задать вопрос и в промпте передать описание таблиц. Получив запрос пользователя, агент может взять название таблиц из документации, а все поля таблицы из метаданных СУБД.

Сейчас набирают обороты проекты:

  • DB-GPT - позволяет генерировать запросы к базам данных используя локальные LLM

  • PandasAI - делает pandas (и другие популярные библиотеки анализа данных) разговорными, позволяя вам задавать вопросы к вашим DataFrame на естественном языке. 

Автоматическое создание дашбордов

GPT, получив таблицу данных, уже может выбрать из нее наиболее значимые и подходящие

для визуализации столбцы. Комплексный пример, как это делать, описан в в статье “Create AI-powered dashboards”. Добавив к этому шаблоны дашбордов, различные best practice в виде эвристик и уточняющие запросы от бота, можно получить Junior BI-разработчика. 

Взгляд в будущее 

В разделе реализации я описал то, что можно сделать уже сейчас.

Пара идей на будущее:

  1. Если научить проект “Dashboard.AI” создавать дашборды, то следующем шагом станет возможным переносить дашборды из одной системы в другую. Сейчас требуется громадное количество ресурсов, чтобы перенести аналитическую отчетность компании в альтернативный BI-продукт. Кроме того, станет возможным создавать дашборды сразу для нескольких популярных продуктов (Tableau, Power BI, Superset, Metabase, Redash) 

  2. Персональный аналитик который помогает менеджерам быстро получать нужные показатели и искать инсайты может стать супер востребованным продуктом. 

Свяжитесь со мной если:

  • Вам интересно добавить в свой продукт описанный выше функционал 

  • Вы хотите создать похожий продукт совместно с нашей командой, на основе популярных BI-продуктов (Tableau, Power BI, Superset, Metabase, Redash).

Весь мир двигается в сторону использования ИИ-помощников. Людям нравится получать результаты просто давая команды на родном языке.

Мои контакты: Телеграмм, Сайт, Блог

Комментарии (8)


  1. HotPaganini
    30.10.2023 09:37
    +1

    Я искренне желаю Вам успехов, но людям нравится общаться со вменяемой первой линией поддержки, а не с ботом, пусть и ладно складывающим слова. Более того, людям нравится, когда их проблема решается быстро и точно, позволяя людям не стрессовать и не тратить свое время и силы на не свою работу. Так что если ваш бот будет реально решать проблемы, то - отлично. Можно будет и смириться.


    1. xFeature
      30.10.2023 09:37
      +1

      Люди, это хорошо. Но как показывает практика, пипл начинает меняться и дорожить своим временем, т.к зачастую, диалог с живым менеджером это затратное по времени удовольствие (ожидание, некомпетентность менеджера и ТД). Робот поможет намного быстрее, если у клиента нормально сформулированный вопрос.


  1. deepdeeppink
    30.10.2023 09:37

    Вы описываете функционал BI-системы Thoughtspot. Она появилась в 2017-м. С тех пор что-то подобное пытались внедрить основные вендоры (например AskData у Tableau). И сейчас я точно знаю, что подобный функционал есть в дорожной карте развития у китайцев (FineBI).

    ИМХО все упирается в аппаратную мощность. Подобная модель on-premise будет требовать непомерное в мире BI количество ресурсов. Тот же Thoughtspot в 2021-м сначала отделил onprem от облачного продукта а потом и вовсе оставил только облака. Вы видите такую проблему? Как вы ее планируете решать? Какой сервер понадобится, чтобы обеспечить работу вашей системы на 100 пользователей × 100 таблиц ?


    1. tomleto Автор
      30.10.2023 09:37

      Спасибо за информацию, посмотрю эти системы.

      Большинство BI-пользователей используют 5-10 отчетов, им не нужен такой функционал.

      Один запрос к GPT с не очень большим промптом стоит несколько центов. Это гораздо дешевле и быстрее чем просить аналитика сделать отчет.

      Персональные помощники используются всё чаще т.к. цена использования ИИ падает.


  1. S_A
    30.10.2023 09:37
    +2

    Ну... Ничего нового. Посмотрите скажем на visiology. Более того... Дашборд можно составлять (и нужно) из сохраненных запросов.

    text2sql простая задача без всяких data science при наличии метаданных к базе (просто появляется sql builder), просто на одних только ближайших или intent+ner.

    Хотя направление мысли мне нравится. Если будет open source продукт chat with data, типа visGPT без OpenAI и self-hosted... прямо джва (четыре по факту) года жду


    1. tomleto Автор
      30.10.2023 09:37

      Также моё описание похоже на то что сделано https://easyreport.ai, но там семантика настраивается ручную.
      В мой реализации, при наличии базы знаний с описанием таблиц всё автоматом: парсер вики + векторная бд + LLM.

      Как работает всё изнутри, я рассказывал тут 


  1. mBlaze
    30.10.2023 09:37

    Утопичная история, нет, конечно, что-то из этого отчасти будет реализовано и будет востребовано. Остальная часть упрется в качество данных, в качество заранее созданной модели бд человеком, плоских хранилищ, кубов. Сколько не бери чудесных чат ботов - это заранее подготовленные шаблоны ответов, то есть заранее созданный в нашем случае отчёт, кем? - человеком). Более того, что когда чудо бот не может ответить на твой вопрос, он начинает бесить:), а это зачастую сводит всю его мощь к низкоуровневым шаблонным операциям, просто потому что он "я вас не пониманию" - позови человека.


    1. tomleto Автор
      30.10.2023 09:37

      Старые чат-боты и чат-бот с GPT4 под капотом сильно отличаются

      Мне скинули в личку пример такого продукта.

      Spreadsheet нового поколения + AI Assist + Dashboards + Command_K интрефейс

      Выглядит супер классно