Не нужно много времени, чтобы объяснить, что такое excel, зачем он нужен и чем он полезен. Этот, если можно так сказать, All-on-one инструмент вошел в обиход уже очень давно и применяется не только в рамках аналитической работы. Компания Microsoft проделала большую работу и подарила нам tool неописуемый в своем многообразии. VBA (Visual basic for applications) и возможность интеграции Add-ins только усилила это многообразие, сделав его чуть ли не уникальным.

Но, как и во всем, дьявол кроется в деталях, и когда речь о более, скажем так, «тонкой» аналитической работе или обработке big data, мы сталкиваемся с трудностями.

Нам нужны строки

Если мы говорим о более-менее крупной компании, то мы подразумеваем наличие одной или нескольких систем, регулирующих бизнес-процессы, собирающих информацию о клиентах и бизнес-информации (CRM). Такие системы собирают данные в больших объемах и зачастую, если их положить в одной место, количество доходит до нескольких миллиардов строк.Excel же не вывозит объем строк на листе, превышающий одного миллиона. Менеджер скажет: «А при чем здесь объем? Мне нужна одна цифра». Мы поясним, что для более детальной аналитики нам нужна максимальная детализация. Ответы на вопросы, конечно, на уровне статистики, но, чтобы правильно ее построить – нужно видеть все.

Опытный аналитик скажет: «И что? У меня есть power query. У меня есть СУБД, где я сделаю предрасчет. Давно хотел разобраться в Python, говорят Pandas топ». Мы же ответим, что дело в complexity и применение нескольких инструментов требует и больше времени на выполнение работы, и дополнительных знаний, которыми аналитик может не обладать в данный момент времени. Мы любим учиться, но заказчик не всегда хочет ждать.
Интеграция в работу Power Query – уже сам по себе – жирный намек на то, что чего то не хватает. Если мы закопаемся, из чего состоит тот же Power BI, то мы поймем, что применение Power Query – первый шаг к осознанию, что пора внедрять BI систему.

Нам нужна оптимизация

Мы всегда хотим, чтобы все считалось быстро. С Excel это не всегда удается. В зависимости от объема данных и сложности применяемых расчетов – скорость работы книги может достигнуть бесконечности. Бывалые аналитики закрывали данную проблему и через Access, и через тот же Python, но мы опять возвращаемся к вопросу complexity.

Попытка компании Microsoft сделать универсальный инструмент, в данном контексте, сыграла злую шутку. Excel не использует реляционные модели, поэтому попытка подLOOKUPить данные на большой объем – часто превращается в пытку и шаманизм.
Вообще, работа аналитика по большей части – взять большие объемы данных из разных мест и положить это в одно место для дальнейших расчетов и визуализации. Эта raw data может забираться из разных источников в разных форматах. Не все эти форматы хорошо считываются через excel и тоже требуют дополнительное время на преобразование. Если мы забудем на входе типологизировать данные в столбцах - не будет удивлением, если книга зависнет, прекратит работу или вообще в последующем не откроется.

Справедливости ради стоит сказать, что BI системы тоже могут испытывать трудности, когда мы пытаемся интегрировать данных из нескольких источников, но эта проблема лежит в плоскости развития ETL-процессов, о которых мы в будущем обязательно расскажем.

Нам нужен Visibility

После обработки данных, мы хотим их показать. Такими функциями excel тоже не обделен: графики, гистограммы и пироги любых видов, широкие возможности стилизации каждого как душе угодно. Тут у нас проблема кроется не в функционале, а скорей просто в том, что excel – не для этого.

Мы очень редко показываем результат проделанной работы непосредственно в excel. Когда нам нужно провалидировать с кем-то данные, или подтвердить корректность методологии - да. Конечный же итог, со всеми выводами, мы обычно помещаем в Power Point.

Проблематика здесь проявляется в теме user-friendly. Представим себе менеджера, отвечающего за определенную территорию, в рамках которой у него есть обязанности по реализации нескольких проектов. Менеджер захочет увидеть результативность своей территории по каждому проекту, желательно еще и в сравнении с другими регионами. Ему это необходимо, чтобы принять

определенные бизнес-решения. Возможно, он захочет залезть еще глубже и проверить кое какие инсайды, чтобы увеличить результативность и поделиться опытом с организацией.Как это будет происходить, если все построено на excel и презентациях? Он будет искать способ получить источники, собирать их у себя, задавать вопросы аналитику как читать данные и найти то что он хочет. Будет спрашивать помощи коллег или нанимать нового сотрудника, чтобы он «подготавливал» отчеты исключительно для него. Сценариев может быть несколько, но все они вертятся вокруг удобства работы с конечным результатом работы аналитика.Каждая организация находит свой путь, как делиться результатами работы, но каждый их – далек от идеала и требует отдельной большой работы в плане обучения и информировании организации. Всем, по итогу, все равно хочется увидеть One place, где есть все.

Итоги

Мы описали только часть проблем, но это далеко не все. Но выводы уже напрашиваются сами собой – Excel уже не удовлетворяет современным потребностям работы аналитика и требует модернизации. Excel все также нужен и важен, хотя бы потому что удобен для пользователя, который не занимается аналитикой, но хочет доступным образов провести свое небольшое исследование, возможно даже на основе уже обработанных данных.

Если мы посмотрим, например, на структуру Power BI, то увидим такие интегрированные инструменты как power query и power pivot, которые ранее существовали как Add-ins в Excel. Вполне вероятно, после их создания, Microsoft пришло к выводу, что для воплощения полного потенциала и нивелирования описанных недостатков, необходимо создать принципиально новый продукт.

Этот продукт должен быть такой же функциональный, но: ориентированный на работу с большими объемами данных; возможности «моделирования», создания конечной модели данных, которая ляжет в основу аналитики; визуализации этих данных и упрощенный sharing.

К тому же, мы упустили, что для современной компании важена «периодичность» отчетности, ее актуальность на данных момент времени. Если компания подготовилась и научилась корректно собирать данные в БД (мы подразумевает ETL-процесс), то автоматизация и настройка регулярности обновления тоже являются неоспоримым плюсом BI. Как для аналитика (не нужно постоянно вручную обновлять отчет – он обновится сам, можно заниматься другой работой), так и для организации (не нужно ждать, когда опубликуют новый отчет, ты знаешь когда и где он обновится сам).

Как мы видим, с учетом развития этих систем и растущей их популярности – не только мы приходим к выводу, что BI становится уже не опциональным, а необходимым инструментом. Желаем и вам скорейшего перехода! :-)

Комментарии (13)


  1. biff_33
    00.00.0000 00:00
    +6

    1. Что такое "PowerBI"? (в статье об этом ни слова)
    2. Для реляционных БД используйте MS Access, а не натягивайте сову на глобус!
      Бывалые аналитики закрывали данную проблему и через Access, и через тот же Python, но мы опять возвращаемся к вопросу complexity.

    По усам текло, в рот не попало?


    1. Robastik
      00.00.0000 00:00
      +2

      Для реляционных БД используйте MS Access

      Насколько можно понять, в сообщении речь в первую очередь о получении данных для анализа. В таком контексте уместнее заметить, что Excel способен получать данные из любых источников, в т.ч. из реляционных БД, без дополнительных инструментов (через Access, и через тот же Python).


  1. JuryPol
    00.00.0000 00:00
    +4

    Судя по мелькающему в тексте «мы», читателю предлагается продукт коллективного творчества. И что, ни у кого из этого коллектива даже вопросов к тексту не возникло? Если так, то поздравить ваш коллектив мне не с чем.

    Мне этот текст больше всего напомнил то, как в общежитии ленинградского политеха в 70-х мы в порядке стеба пели «Льет ли теплый rain, падает ли snow, я в подъезде возле home твоего to stay”… Ну дико выглядит «подарила нам tool неописуемый в своем многообразии». Еще можно часть подобного «изюма» списать на устоявшиеся термины, но часть - ни в какие ворота.

    Да, и по поводу кавычек… Вам никто и никогда не объяснял, в каких случаях отдельное слово помещают в кавычки? Уберите кавычки у слов «моделирование» и «периодичность» в конце статьи.


    1. Alexufo
      00.00.0000 00:00

      Оригинал вашей песни

      https://youtu.be/ITXVIK8KZuI


  1. Robastik
    00.00.0000 00:00
    +7

    Не нужно много времени, чтобы объяснить, что такое excel, зачем он нужен и чем он полезен.

    Что ж вам никто не объяснил?

    Вы пытаетесь использовать Excel не для того, для чего он предназначен, и делаете дикие выводы. Это необычный навык для аналитика, которым себя заявляете.


  1. csharpreader
    00.00.0000 00:00
    +1

    Где, заявленная в заголовке, эволюция? Где, заявленные в заголовке, BI-системы?


  1. vtal007
    00.00.0000 00:00
    +1

    Если я правильно понял, то автор хотел сказать, что Excel это не BI-инструмент.

    Так-то конечно да, Excel для мелких BI-задач (сводные таблицы. Плохо что ли? хорошо же) и крутить в нем SQL базы наверно не стоит (хотя если жизнь заставит....)

    но с другой стороны - BI-системы это не Excel PowerBi (табло, гугл-дата-студио) это штуки не для работы с электронными таблицами


    1. Trabant_Vishnya
      00.00.0000 00:00

      Кстати, многих пользователей физически тяжело перестроить с модели “шаманю руками в сырых данных из excel/access” на “делаем нормальные инструменты ввода в CRM/ERP и настраиваем правила обработки данных в модели”. И это я про крупные компании говорю. В мелких наоборот легче, там бездумная работа руками на ПК не в почете


  1. imjustwatching
    00.00.0000 00:00
    +1

    Честно говоря так и не понял из этой статьи почему эксель не топ


  1. aavramenko
    00.00.0000 00:00

    Раскрыта проблематика, не раскрыты решения проблем. Зачем тратить время читателей? (


  1. Propieller
    00.00.0000 00:00

    Какая огромная пропасть оказывается между офисным пользователем excel и теми, кто "подразумевает наличие одной или нескольких систем, регулирующих бизнес-процессы, собирающих информацию о клиентах и бизнес-информации"!

    Excel да, может показать какую-то инфу. В табличке и в диаграмме, может собирать и фильтровать данные. Но это - редактор табличек, с которым все знакомы. В некоторых случаях, когда не настроен нормально процесс - позволяет на коленке собрать какой-то отчет. А проблема с ним не в том, что он всё еще недостаточно универсален. Часто нужен не максимально универсальный инструмент, а то что быстро, здесь и сейчас, без лишних действий сделает регулярную рутинную работу. И даже если там потребуется обработка каких-то данных, полученных их каких только бывают источников - это не должна быть забота ни excel ни его пользователя, это прекрасно может делаться где-то в какой-то внешней системе. А excel - прекрасно и красочно покажет вам результаты такой обработки.


  1. ArtyomPozharov
    00.00.0000 00:00

    Надо понимать, что сравнение Excel и PowerBI будет смотреть пользователь этого самого Excel, который ещё не знаком с PowerBI. Поэтому надо понимать, за счëт чего оказывается подготовить огромные данные и импортировать их с помощью PowerQuery сложнее, чем каким-то образом их обработать непосредственно в PowerBI. В чëм простота правки графиков через PowerBI, а не Excel? Что такое ETL? Подлукапить? Как, вообще, выглядит эта PowerBI? Хотя бы иллюстрации какие-то... Я по-человечески говорю, не злорадствую, я не смог понять идею статьи. Удачи!


    1. Trabant_Vishnya
      00.00.0000 00:00

      Ну, вот как-то так выглядит :)
      https://www.youtube.com/watch?v=TmhQCQr_DCA

      Вообще, на практике людям с Excel-опытом продать интерфейс Power Query куда легче, чем тот же Alteryx (который на простой ETL упирает)