Привет, Хабр!

Datalore Enterprise — это data science платформа для совместной работы с Jupyter-ноутбуками. Ее можно установить в частное облако или на приватный сервер компании.

Новая версия 2021.3 позволяет специалистам по анализу и обработке данных работать с базами данных и SQL-кодом внутри Jupyter-ноутбуков, а также легко делиться результатами работы с коллегами. Также мы интегрировали поддержку ноутбуков R и Scala, добавили новый реактивный режим, реализовали конструкторы графиков и множество других функций.

Читайте дальше, чтобы узнать о новых возможностях Datalore Enterprise 2021.3!

Если вы не знакомы с продуктом Datalore Enterprise, рекомендуем посмотреть короткий видеообзор платформы.

Подключение к БД из редактора и запуск нативного SQL-кода

Подключение к БД из ноутбуков

Новая версия Datalore Enterprise позволяет напрямую подключать Jupyter-ноутбуки к базам данных всего за нескольких кликов. Создав подключение, вы сможете просматривать схему таблиц и получать данные с помощью SQL-ячеек, при этом пароль подключения не будет передан в среду.

Подключение Jupyter-ноутбуков к базам данных
Подключение Jupyter-ноутбуков к базам данных

Datalore Enterprise поддерживает аутентификацию через user/password для баз данных Amazon Redshift, Azure SQL Database, MariaDB, MySQL, Oracle, PostgreSQL, Snowflake и др. Если у вас появятся вопросы по подключению к базам данных, вы всегда можете задать их нам.

SQL-ячейки 

Для выгрузки данных из базы данных можно использовать нативные SQL-ячейки. В них поддерживается подсветка синтаксиса и автодополнение кода на основе интроспекции таблиц базы данных. Результат запроса автоматически передается в pandas DataFrame, после чего вы сможете продолжить анализ данных с помощью Python.

SQL ячейки в Datalore
SQL ячейки в Datalore

Запросить 30-дневную пробную версию Datalore Enterprise для своей команды можно на нашем сайте.

Превращение Jupyter-ноутбуков в интерактивные отчеты

Чтобы наглядно представить результаты своей работы с данными, порой приходится сильно постараться. Просто делиться Jupyter-ноутбуком не всегда удобно, так как в нем бывает слишком много кода, в том числе для промежуточных этапов анализа. Сборка дашборда в Tableau занимает слишком много времени, а слайды Powerpoint требуют ручного обновления при любых изменениях результатов анализа.

Datalore Enterprise предлагает выход — публиковать интерактивные отчеты!

Публикация интерактивных отчетов

Теперь вы можете быстро превратить ноутбук в интерактивный отчет. Делиться интерактивными отчетами можно по ссылке. При этом вы можете скрыть ячейки кода, которые не нужны для презентации.

Каждый, кто получит ссылку на отчет, сможет также работать с ним — изменять элементы управления и запускать соответствующий ноутбук.

Интерактивные отчеты в Datalore
Интерактивные отчеты в Datalore

Хотите узнать больше о возможностях Datalore? Запланируйте демо с нашей командой.

Конструкторы графиков, раскрывающиеся списки и другие интерактивные элементы

Чтобы сделать ваши ноутбуки и отчеты более интерактивными, мы добавили новые типы ячеек:

  • Вы можете добавлять в ноутбуки раскрывающиеся списки, слайдеры и текстовые поля, а также присваивать входные значения переменным.

    Раскрывающиеся списки в Datalore
    Раскрывающиеся списки в Datalore
  • Вы можете легко создавать визуализации при помощи конструкторов графиков в ячейках диаграмм. При этом состояние ячеек обновится и у других пользователей, редактирующих ваш ноутбук, а значит, вы сможете работать над визуализацией вместе.

    Ячейки диаграмм
    Ячейки диаграмм

Настройка параметров видимости ячеек

Предоставляя доступ к ноутбукам или отчетам, вы можете скрыть определенные данные, чтобы не перегружать пользователя информацией. В новой версии Datalore можно скрыть любую ячейку, а также выборочные входные и выходные данные.

Создание R и Scala ноутбуков

Мы добавили поддержку языков R и Scala. Теперь для них можно пользоваться умным автодополнением. Для R также доступен менеджер пакетов conda.

Поддержка R и Scala в Datalore Enterprise
Поддержка R и Scala в Datalore Enterprise

Реактивный режим для воспроизводимых вычислений

В течение последних трех лет мы экспериментировали с решением проблемы воспроизводимости ноутбуков. Сегодня мы рады представить новый реактивный режим! 

При включении реактивного режима Datalore вычисляет ячейки кода сверху вниз, а при изменении ячейки автоматически пересчитывает все ячейки ниже. Подробнее о проблеме воспроизводимости кода и о новом реактивном режиме читайте здесь.

Реактивный режим в Datalore
Реактивный режим в Datalore

Другие улучшения

Скрипты инициализации

Помимо возможности настройки базовых сред и установки библиотек через менеджер пакетов, теперь вы можете добавлять специальные настройки в скрипт, который запускается перед стартом ноутбука. Внутри init.sh вы можете указать все инструменты сборки и зависимости, необходимые для вашего ноутбука.

Поддержка версий Python 3.6+

В Datalore Enterprise 2021.3 вы можете выбрать из множества версий Python (3.6 и более поздние) и пользоваться умными возможностями анализа-кода Datalore для любой из них. Достаточно предварительно настроить несколько базовых сред, и ваша команда сможет переключаться между различными версиями Python буквально в несколько кликов.

Новые графики на вкладке Visualize

Если результатом выполнения кода является pandas DataFrame, Datalore автоматически покажет полученные графики на вкладке Visualize. Мы добавили поддержку:

  • Point plots

  • Bar plots

  • Area plots

  • Correlation plots

Кроме того, теперь вы можете настроить цвет графика на основе определенных значений столбца.

Монтирование бакетов GCS

Помимо бакетов AWS S3, теперь вы также можете монтировать в ноутбук бакеты Google Cloud Storage. Для этого просто укажите имя бакета и содержимое файла аутентификации .json — смонтированный бакет отобразится в виде отдельной папки.

Информация о последнем запуске ячейки

Наведя указатель мыши на время выполнения ячейки, вы увидите полную дату последнего выполнения.

Сворачивание ячеек

Чтобы сосредоточиться на написании кода, теперь вы можете сворачивать любые входные и выходные данные.

Попробуйте бесплатно!

Вы можете попробовать Datalore Enterprise бесплатно в течение 30 дней. Чтобы запросить пробную версию или задать какие-либо вопросы, свяжитесь с нами или назначьте встречу с нашей командой. Все компании, которые пробуют Datalore Enterprise, могут общаться с нами через специальный канал в Slack или тред Zendesk.

Запросить пробную версию или забронировать демо можно на нашем сайте.

Чтобы оставаться в курсе новостей от Datalore, подпишитесь на наш блог и Twitter!

Ваша команда Datalore

Комментарии (6)


  1. crazyproger
    07.12.2021 18:18

    Подскажите, а для того чтобы увидеть опубликованный отчет - нужна так же учетная запись Datalore? Кейс когда есть 5 сайнтистов и 25 потребителей отчетов требует покупки 30 лицензий?


    1. alenaguzharina Автор
      07.12.2021 18:20

      Привет! Для пользователей отчетов лицензии не нужны. Они могут смотреть отчеты без регистрации в Datalore. Т.е. для такой команды нужно купить 5 лицензий.


  1. vba
    08.12.2021 12:07

    Блин вы бы сначала Pycharm в нормальное состояние привели. Поддержка юпитер-ноутбуков там просто стыд какой-то, поддержки юпитер лаб нет совсем. Синтаксическая подсветка барахлит под линух(под виндами не проверял), приходится реиндексировать проект и перегружать все.

    Да да, я в курсе про создание запросов на исправление ошибок, но блин это такие элементарные вещи. Ох, уйду я наверное от вас (Про подписка) к VSCode, раз вам PyCharm в ломы заниматься.


    1. alenaguzharina Автор
      08.12.2021 12:11

      Привет! Согласны, раньше поддержка Jupyter ноутбуков была не очень удобная. В новой версии PyCharm Pro Jupyter ноутбуки получили сильный апгрейд + мы теперь предлагаем отдельную IDE для Data Science - JetBrains DataSpell.


      1. vba
        08.12.2021 12:34

        А это версия которая на днях вышла, скачаем, оценим. Спасибо за информацию.


        1. mkone112
          10.12.2021 11:51

          Да, они реально починили поддержку юпитера - тоже ждал несколько лет.