Привет, аналитики, руководители и основатели Business intelligence компаний!
Я создаю сервис WikiBot, который обучается по документации и консультирует пользователей в чате, как специалист первой линии поддержки. Наш чат-бот понимает вопрос и отвечает как человек.
Весь мир двигается в сторону использования ИИ-помощников. Людям нравится получать результаты просто давая команды на родном языке.
Предлагаю вам, совместно с моей командой, создать продукт Dashboard.AI, который будет обладать следующим функционалом:
Поиск отчетов. Менеджер может попросить бота найти нужный отчет. Например: ”Найди отчет о расходах на рекламу за прошлый год”. Бот, на основе списка отчетов, которые находятся в дата-каталоге, конфлюенс или другой вики, присылает ссылку в чат.
Написание SQL-запросов. Вместо поиска нужного отчета, менеджер пишет в чате боту: "прибыль по Москве по электронике с мая по июль". Бот присылает нужные показатели и ссылку на нужный отчет, c установленными фильтрами. Если подходящего отчета нет, то сам пишет sql запрос.
Автоматическое создание дашбордов. Менеджер может попросить чат-бота создать дашборд. Бот, задав несколько уточняющих вопросов, выберет оптимальный шаблон и соберет в нем все необходимые SQL-запросы и фильтры.
Реализация
Поиск отчетов. Список отчетов обычно располагаются в базе знаний, документации или каталоге данных. Современные продукты, такие как SiteGPT, ChatBase, WonderChat, Wikibot (далее агент) отлично умеют делать семантический поиск:
Документация индексируется и сохраняется в векторную базу данных.
Когда пользователь вводит запрос, в векторной базе находится 5-10 наиболее близких векторов (семантический поиск). Каждый вектор это название и описание отчета.
Запрос пользователя и топ близких векторов отправляются в LLM - большую языковую модель (LLaMA, Falcon, Google Bard, Anthropic Claude) и она выбирает отчёты которые подходят пользователю.
Написание SQL-запросов
Современные LLM уже неплохо пишут SQL (статья с сравнением GPT, Claude, Bard) для этого им нужно задать вопрос и в промпте передать описание таблиц. Получив запрос пользователя, агент может взять название таблиц из документации, а все поля таблицы из метаданных СУБД.
Сейчас набирают обороты проекты:
DB-GPT - позволяет генерировать запросы к базам данных используя локальные LLM
PandasAI - делает pandas (и другие популярные библиотеки анализа данных) разговорными, позволяя вам задавать вопросы к вашим DataFrame на естественном языке.
Автоматическое создание дашбордов
GPT, получив таблицу данных, уже может выбрать из нее наиболее значимые и подходящие
для визуализации столбцы. Комплексный пример, как это делать, описан в в статье “Create AI-powered dashboards”. Добавив к этому шаблоны дашбордов, различные best practice в виде эвристик и уточняющие запросы от бота, можно получить Junior BI-разработчика.
Взгляд в будущее
В разделе реализации я описал то, что можно сделать уже сейчас.
Пара идей на будущее:
Если научить проект “Dashboard.AI” создавать дашборды, то следующем шагом станет возможным переносить дашборды из одной системы в другую. Сейчас требуется громадное количество ресурсов, чтобы перенести аналитическую отчетность компании в альтернативный BI-продукт. Кроме того, станет возможным создавать дашборды сразу для нескольких популярных продуктов (Tableau, Power BI, Superset, Metabase, Redash)
Персональный аналитик который помогает менеджерам быстро получать нужные показатели и искать инсайты может стать супер востребованным продуктом.
Свяжитесь со мной если:
Вам интересно добавить в свой продукт описанный выше функционал
Вы хотите создать похожий продукт совместно с нашей командой, на основе популярных BI-продуктов (Tableau, Power BI, Superset, Metabase, Redash).
Весь мир двигается в сторону использования ИИ-помощников. Людям нравится получать результаты просто давая команды на родном языке.
Комментарии (8)
deepdeeppink
30.10.2023 09:37Вы описываете функционал BI-системы Thoughtspot. Она появилась в 2017-м. С тех пор что-то подобное пытались внедрить основные вендоры (например AskData у Tableau). И сейчас я точно знаю, что подобный функционал есть в дорожной карте развития у китайцев (FineBI).
ИМХО все упирается в аппаратную мощность. Подобная модель on-premise будет требовать непомерное в мире BI количество ресурсов. Тот же Thoughtspot в 2021-м сначала отделил onprem от облачного продукта а потом и вовсе оставил только облака. Вы видите такую проблему? Как вы ее планируете решать? Какой сервер понадобится, чтобы обеспечить работу вашей системы на 100 пользователей × 100 таблиц ?
tomleto Автор
30.10.2023 09:37Спасибо за информацию, посмотрю эти системы.
Большинство BI-пользователей используют 5-10 отчетов, им не нужен такой функционал.
Один запрос к GPT с не очень большим промптом стоит несколько центов. Это гораздо дешевле и быстрее чем просить аналитика сделать отчет.
Персональные помощники используются всё чаще т.к. цена использования ИИ падает.
S_A
30.10.2023 09:37+2Ну... Ничего нового. Посмотрите скажем на visiology. Более того... Дашборд можно составлять (и нужно) из сохраненных запросов.
text2sql простая задача без всяких data science при наличии метаданных к базе (просто появляется sql builder), просто на одних только ближайших или intent+ner.
Хотя направление мысли мне нравится. Если будет open source продукт chat with data, типа visGPT без OpenAI и self-hosted... прямо джва (четыре по факту) года жду
tomleto Автор
30.10.2023 09:37Также моё описание похоже на то что сделано https://easyreport.ai, но там семантика настраивается ручную.
В мой реализации, при наличии базы знаний с описанием таблиц всё автоматом: парсер вики + векторная бд + LLM.Как работает всё изнутри, я рассказывал тут
mBlaze
30.10.2023 09:37Утопичная история, нет, конечно, что-то из этого отчасти будет реализовано и будет востребовано. Остальная часть упрется в качество данных, в качество заранее созданной модели бд человеком, плоских хранилищ, кубов. Сколько не бери чудесных чат ботов - это заранее подготовленные шаблоны ответов, то есть заранее созданный в нашем случае отчёт, кем? - человеком). Более того, что когда чудо бот не может ответить на твой вопрос, он начинает бесить:), а это зачастую сводит всю его мощь к низкоуровневым шаблонным операциям, просто потому что он "я вас не пониманию" - позови человека.
tomleto Автор
30.10.2023 09:37Старые чат-боты и чат-бот с GPT4 под капотом сильно отличаются
Мне скинули в личку пример такого продукта.
Spreadsheet нового поколения + AI Assist + Dashboards + Command_K интрефейс
Выглядит супер классно
HotPaganini
Я искренне желаю Вам успехов, но людям нравится общаться со вменяемой первой линией поддержки, а не с ботом, пусть и ладно складывающим слова. Более того, людям нравится, когда их проблема решается быстро и точно, позволяя людям не стрессовать и не тратить свое время и силы на не свою работу. Так что если ваш бот будет реально решать проблемы, то - отлично. Можно будет и смириться.
xFeature
Люди, это хорошо. Но как показывает практика, пипл начинает меняться и дорожить своим временем, т.к зачастую, диалог с живым менеджером это затратное по времени удовольствие (ожидание, некомпетентность менеджера и ТД). Робот поможет намного быстрее, если у клиента нормально сформулированный вопрос.