Материалы с митапа по Кафке: СDC коннекторы, проблемы роста, Kubernetes / forpes.ru

Главная
Материалы с митапа по Кафке: СDC коннекторы, проблемы роста, Kubernetes

Материалы с митапа по Кафке: СDC коннекторы, проблемы роста, Kubernetes +16

30.01.2020 16:22

anna_lesnykh 11 2000 Источник

Привет! Недавно в нашем офисе прошёл митап по Кафке. Очные места на него разлетелись со скоростью света. Как сказал один из спикеров: «Кафка секси».

С коллегами из Booking.com, Confluent, и Авито мы обсуждали подчас нелёкую интеграцию и поддержку Кафки, последствия её скрещивания с Kubernetes, а также известные и собственноручно написанные коннекторы для PostgreSQL

Мы смонтировали видео докладов, собрали со спикеров презентации и отобрали красивые фотографии с митапа. Если вам интересно посмотреть и послушать — заходите под кат.

Видеозаписи докладов

Коннекторы: зачем вас так много — Анатолий Солдатов, Авито

Анатолий рассказал, что такое коннекторы, какие преимущества и недостатки есть у JDBC и Debezium, и как мы в Авито пришли к идее написания своего CDC коннектора.

00:00 — Представление спикера
04:09 — Что такое Kafka Connect, какие коннекторы существуют
18:10 — Для чего обычно используется Connect
23:47 — Первый кейс Авито: data-bus
28:20 — Второй кейс Авито: как мы сделали свой CDC коннектор
41:28 — Ответы на вопросы слушателей

> Презентация Анатолия

Как приручить Apache Kafka? Опыт Booking.com — Александр Миронов, Booking.com

Александр поделился историями о ком, какие сложности возникли у его команды при работе с Кафкой, и как их решили.

00:00 — Представление спикера
06:22 — Какие проблемы появились при росте количества юзкейсов использования Кафки
08:58 — Создание абстракций для пользователей
14:15 — Аутентификация и секьюрити кластеров
23:53 — Сontrol plane, который всё связывает
27:41 — Забавные и не очень истории из практики
34:00 — Ответы на вопросы слушателей

> Презентация Александра

Kafka на Kubernetes: а по Хуану ли сомбреро? — Виктор Гамов, Confluent

Виктор ответил на вопрос о том, стоит ли запускать Apache Kafka и обрабатывающие потоки приложения на Kubernetes.

00:00 — Представление спикера
05:19 — Проблемы запуска stateful-приложений на Kubernates
17:52 — Kubernetes pod
22:33 — Работа с хранилищем
28:24 — Custom Kubernetes controllers
48:58 — Rolling upgrade
58:05 — Ответы на вопросы слушателей

> Презентация Виктора

Плейлист со всеми видео можно найти на нашем ютуб-канале.

Фотографии

Фотографии с митапа мы выложили в Фейсбуке и ВКонтакте. Посмотрите, как всё прошло, и отмечайте себя и друзей, если были на встрече.

Скоро вернемся с анонсами новых мероприятий в московском офисе Авито. До новых встреч!

Комментарии (11)

commanderxo
31.01.2020 15:56
#21215728
Вопрос по второму докладу, о Booking.com: Если вы скрываете настоящее имя топиков за абстракцией в самописной библиотеке, то как конечные пользователи могут определить, что нужные им данные уже есть в Кафке?
Например: Команда А получила от бизнеса заказ на новую фичу и ей нужны исходные данные из другой области. Возможно в фирме уже есть какая-то другая команда Б, в другом проекте, а может даже федерации, которая уже публикует нужные записи. Как команды находят друг друга? Смотрят в Кафку и пытаются по имени топиков определить что там внутри? Пишут email во внутреннюю рассылку? Идут на SchemaRegistry сервер (при условии что сериализация в Avro) и ищут там? Одиним словом как вы поддерживатете знание о содержимом топиков, если их 3k+ штук?
1. anna_lesnykh Автор
  31.01.2020 16:01
  #21215754
  +1
  Cам вопрос потерялся. Допишите, пожалуйста, помогу, чем смогу.
1. anna_lesnykh Автор
  03.02.2020 10:31
  #21223182
  +2
  Принесла ответ от Александра: «Мы не скрываем имена топиков за абстракцией, мы скрываем имена кластеров, а также такие детали как bootstrap-servers, иным словом все, что связано с service discovery. Сами имена топиков имеют структуру «project__service__topic-name». С точки зрения поиска данных этот вопрос пока до конца не решен — мы стараемся помогать пользователям тем, что у каждого топика есть заданное описание, по которому можно понять, что там лежит (включая схему). В остальном юзеры обмениваются информацией самостоятельно. В будущем мне хотелось бы видеть специальный сервис для дискавери данных, как, например это делает Lyft».

VitalySh
31.01.2020 17:43
#21216238
Пока Kafka только разгоняется, Apache Pulsar вовсю наступает на пятки — cloud native, прямая интеграция с kubernetes, pub-sub из коробки и много чего еще. На него с кафки как раз и переехали. Странно что по пульсару никаких новостей нет.
1. EasyGrow
  31.01.2020 18:08
  #21216342
  Вы хотели сказать пока Pulsar разгоняется, наверное :)
  Кафка уже давно разогналась и ее adoption в IT-компаниях явный тому пример.
  
  Мне тоже кажется Pulsar более интересной технологией, но с точки зрения внедрения его в компаниях пока не вижу больших продвижений вперед (в контексте России, в основном. Кажется, в Азии у Pulsar дела получше).
1. EasyGrow
  31.01.2020 18:44
  #21216478
  А можете описать профиты переезда конкретно для вас (не абстрактные Pulsar более заряжен фичами и тд и тп)? Это было бы очень интересно узнать
  1. VitalySh
    01.02.2020 21:39
    #21219770
    +2
    Переезжали ради Pub-Sub, безлимитных топиков и namespaces (один кластер переиспользуют несколько полностью независимых подсистем из микросервисов).
    Производительность отличная, библиотеку с простейшим функционалом набросал за пол часа — у Pulsar простой и понятный Websocket API, так что можно не привязываться к языку разработки и наличию библиотек. Конечно не всё идеально, до прода еще система не добралась, но на данный момент всё устраивает, активно ведем разработку. Есть планы в будущем попробовать Pulsar Functions (аналог AWS Lambda).
    
    EasyGrow
    01.02.2020 23:52
    #21220010
    +2
    А на каких цифрах вы уперлись в лимит Kafka по топикам/производительности?
    
    И еще не совсем понял последнюю часть про прод («до прода еще система не добралась») – у вас Pulsar ведь уже в проде?
    
    И очень интересно было бы еще узнать про сложность администрирования Pulsar vs Kafka

commanderxo
31.01.2020 17:54
#21216306
JSON или AVRO, вот в чём вопрос!
- С одной стороны, Avro активно пропагандируется изобретателями Кафки как компактный, а главное документирующий формат.
- С другой — по отзывам из разных фирм многие всё же используют JSON, потому как так «проще и гибче»
- При этом закрадывается подозрение, что JSON решает проблемы на стороне продюсера (нет схемы — нет проблем), но при этом перекладывает ответсвенность за правильную интерпретацию на консумера. Получатель должен знать особенности структуры данных отправителя, а это противоречит идее независимых команд разработчиков, обменивающихся данными через небольшое количество хорошо определённых интерфейсов.
В первом докладе Avito часто упоминается Avro, вы выбрали его?
1. EasyGrow
  31.01.2020 18:25
  #21216412
  +2
  Мы выбрали скрывать формат за абстракцией (Brief – www.youtube.com/watch?v=VjMloZzEq2A). Сервисы работают с нашим форматом, а внутри может быть Avro, Proto, JSON и тд). У Brief есть свой аналог schema registry и схемы.
  
  В целом, формат может быть любой исходя из вашей задачи. Если вам нужны схемы, кодогенерация или если вы упираетесь в производительность – смотрите в сторону Avro, тем более вся экосистема вокруг Kafka его любит.
  
  Если вы все-таки используете JSON, то стоит под него сразу написать свой простенький schema registry, т.к. «гибкий» JSON вообще без схем скоро превратит данные в вашем кластере в kakafku. Ну и готовьтесь гонять больше данных по сети, больше времени тратить на сериализацию/десериализацию и тд.
  
  «нет схемы — нет проблем», это скорее «нет схемы – вы еще не знаете о проблемах». Один продюсер без схемы может сломать абсолютно всех консьюмеров. Кажется, что лучше такие изменения найти и поправить одном месте, чем сломаться сразу во многих.

commanderxo
31.01.2020 18:52
#21216514
В идеальном мире все ошибки должны отлавливаться на этапе тестирования, но у нас однажды баг утёк в продакшн и некоторые сообщения в топике стали рушить десериализатор. В «обычной» системе, когда проекты обмениваются информацией через базу данных, можно пойти к DBA, и те, грязно ругаясь, в виде абсолютного исключения, могут стереть дефектные данные прямо в PROD базе. Весьма опасный сценарий, но плохой план починки лучше чем ничего.

В кафке же, «что написано пером, то не вырубишь топором», поэтому пришлось срочно патчить консумеры, причём другой команде разработчиков, не виновных в этом косяке. На 2 повреждённых записи приходилось 8 нормальных, поэтому просто «перемотать» руками оффсеты в consumer group и перепрыгнуть весь плохой кусок означало потерю нужных даных.

Это проблема не только кафки, а всех append-only event log, но интересно кто как это решает?