Помимо своей основной деятельности, мы в Ростелекоме ведем различные образовательные проекты. 28 февраля таких проектов станет больше. Мы начнем «Ростелеком. DataTalks» — цикл лекций о дата-инжиниринге и управлении данными от семи ведущих компаний в этой сфере. Все подробности — в этом посте.



Лекции мы будем проводить в офлайн-режиме, в большом конференц-зале на ВДНХ (Москва, проспект Мира, 119, стр.63; здание «Арт-Техноград»), по понедельникам и четвергам с 19 до 22 часов. Первое занятие запланировано на 28 февраля, последнее — на 8 апреля. Совместно с партнерами мы проведем 12 лекций. Они рассчитаны на студентов старших курсов технических факультетов, а также специалистов с опытом работы в отрасли до трех лет. Среди спикеров — технические и digital-директоры, которые могут и теорией загрузить, и практикой поделиться.

  1. «Подходы к управлению данными: стратегические, организационные, технологические». Ростелеком, Accenture, DIS
  2. «Эволюция аналитических хранилищ данных». Ростелеком
  3. «Направления и тенденции развития баз данных. MPP системы. Основы Greenplum». ArenaData
  4. «Основы Hadoop. Современные подходы к обработке Big Data». ArenaData
  5. «Технологии интеграции данных. Подходы к построению хранилищ данных. Управление метаданными в интеграционных средах».
    DIS Group
  6. «Декомпозиция задач как центральный элемент аналитики. Операционная модель работы с данными». Accenture
  7. «Работа с мастер-данными. Очистка клиентских данных». HFL

    «Управление нормативно-справочной информацией (НСИ). Процессы и решения для повышения качества НСИ». Adastra
  8. «Работа с качеством данных. Профилирование, очистка и DQ мониторинг». DIS Group
  9. «Управление vs. администрирование процессов. Когда начинается аналитика и зачем она нужна. Критерии успеха проекта создания управленческой аналитики. Место аналитики в ИТ-архитектуре предприятия». Qlik
  10. «Современные платформы BI. Критерии выбора. Решение аналитических задач в Qlik». Qlik
  11. «Agile в управлении данными». Ростелеком

Помимо лекций, мы будем давать задания. Некоторые нужно будет делать в классе, некоторые — дома. По итогам 12 лекций будет тест, чтобы вы могли себя проверить. По итогам обучения мы вручим сертификаты. Успешно прошедшие обучение смогут претендовать на вакантные позиции в области управления данными в организациях, которые принимают участие в проекте.

Мы планируем, что слушателями «Ростелеком. DataTalks» станет примерно 100 специалистов — 30 молодых сотрудников из компаний-организаторов и еще 70 сторонних специалистов. Как попасть в их число? Заполните анкету на странице школы: https://datatalks.rt.ru/. При необходимости мы попросим вас поучаствовать в очном интервью и по итогам выберем студентов курса.

12 лекций — это только первый этап программы. По результатам первого цикла лекций мы планируем сделать курсы по более узким специализациям — для бизнес-аналитиков, разработчиков, системных аналитиков. Следующий, третий уровень — это еще более узкая специализация. Если человек, например, всегда мечтал внедрять MDM-системы, то по итогам третьего этапа он станет достаточно грамотен в этой теме.

Митап 7 февраля


Для тех, кто пролистал до конца, — бонус. 7 февраля с 19:30 в DI Telegraph (Москва, Тверская, 7) мы совместно с ArenaData проводим митап. Вот программа:

19:30–20:00. «Миграция с Greenplum 4 на Greenplum 5 и взгляд в сторону open source»
Борис Емельянов, Ростелеком

Мы провели миграцию некоторых наших сред с Greenplum 4 на Greenplum 5. В докладе мы объясним причины перехода, рассмотрим процесс обновления в деталях, обратим внимание на некоторые неочевидные детали и подводные камни.

20:00–20:30. «Гибридная data-платформа: управляем любыми data-cервисами в on-premise и облаках. Презентация Arenadata Cluster Manager (ADCM)»
Дмитрий Павлов, Arenadata.io

По мере того как компания растет и развивается, меняются и ее требования к data-инфраструктуре. Растет количество используемых data-приложений, все сложней становится ландшафт. На смену чистому on-premise приходит микс из железа, публичных и приватных облаков. Arenadata.io разработала Cluster Manager — единую модульную бесплатную open-source платформу управления data-сервисами и инфраструктурой. Дмитрий из Arenadata.io расскажет, какие возможности дает ADCM своим пользователям и как начать использовать, бесплатно и быстро.
 
20:30–21:00. Пицца и свободное общение

21:00–21:30. «GreenHouseSQL — наша внутренняя платформа данных из открытых компонентов»
Максим Вихарев, Alytics

Alytics — SaaS-система аналитики полного цикла. С ее помощью маленькие и большие компании могут анализировать ROI своих рекламных каналов и понимать, что приносит прибыль, а что нет.
Под капотом Alytics реализованы все компоненты современной классической системы аналитики: от коннекторов данных до систем доставки, хранения, обработки и визуализации. За счет сочетания ANSI SQL, MPP и In-memory последняя версия Alytics включает много интересного — сложную аналитику по цепочкам сессий, конфигурируемые интерактивные BI дэшборды с миллисекундным откликом, секундную отчетность на глубоких дриллингах по неаггрегированным данным. Без «классического» «хадупа, s3, престо, друидов, вертики, пентахи» и тому подобного. В парадигме Opensource и полноценного SQL. На митапе будет рассмотрена общая архитектура решения, а также отдельные компоненты. Максим расскажет, в каких необычных условиях они готовят Greenplum, зачем им Clickhouse, какая роль PostgreSQL и как вообще все это работает.

21:30–22:00. «Манная Кафка и микросервисы»

Анатолий Солдатов, Avito

Анатолий расскажет, как в Avito построили шину бизнес-критичных данных на основе Kafka и зачем это нужно:
1. Выбираем крупу (сравнение разных технологий под шину)
2. Заливаем молоко в кастрюлю (настройка кластера Kafka из 3 нод)
3. Ставим на огонь (перформанс-тесты)
4. Готовим (обвязки и архитектура поверх Kafka)
 
22:00–22:30. Свободное общение
 
Регистрация на митап — по ссылке. Дополнительная информация — на сайте митапа. Напоминаем также ссылку на анкету для желающих подать заявку на обучение.

Комментарии (2)


  1. Dadadumdums
    22.01.2019 12:14

    Будут ли видео с «Ростелеком. DataTalks» и будут ли они выложены? Под критерии отбора не подхожу, но в качестве материала для ознакомления было бы очень интересно.


    1. DataTalks Автор
      23.01.2019 08:45

      Стримить лекции точно не будем. Видео запись всех лекций будем вести, но пока не решили выложим ли все в открытый доступ, так как некоторые компании-партнеры, сотрудники которых являются спикерами, не готовы свободно распространять часть материалов.

      Скорее всего в апреле, по факту завершения цикла лекций, только часть материалов появится в открытом доступе.