[SDK и UI-библиотеки] Введения. SDK: Проблемы и решения / forpes.ru

Главная
[SDK и UI-библиотеки] Введения. SDK: Проблемы и решения

[SDK и UI-библиотеки] Введения. SDK: Проблемы и решения

10.07.2023 06:07

forgotten 5 670 Источник

Это главы 40 и 41 раздела «SDK и UI-библиотеки» моей книги «API». Второе издание книги будет содержать три новых раздела: «Паттерны API», «HTTP API и REST», «SDK и UI‑библиотеки». Если эта работа была для вас полезна, пожалуйста, оцените книгу на GitHub, Amazon или GoodReads. English version on Substack.

Глава 41. О содержании раздела

Как мы отмечали, аббревиатура «SDK» («Software Development Kit»), как и многие из обсуждавшихся ранее терминов, не имеет конкретного значения. Считается, что SDK отличается от API тем, что помимо программных интерфейсов содержит и готовые инструменты для работы с ними. Определение это, конечно, лукавое, поскольку почти любая технология сегодня идёт в комплекте со своим набором инструментов.

Тем не менее, у термина SDK есть и более узкое значение, в котором он часто используется: это клиентская библиотека, которая предоставляет высокоуровневый (обычно, нативный) интерфейс для работы с некоторой нижележащей платформой (и в частности с клиент‑серверным API). Чаще всего речь идёт о библиотеках для мобильных ОС или веб браузеров, которые работают поверх HTTP API сервиса общего назначения.

Среди подобных клиентских SDK особо выделяются те, которые предоставляют не только программные интерфейсы для работы с API, но также и готовые визуальные компоненты, которые разработчик может использовать. Классический пример такого SDK — это библиотеки картографических сервисов; в силу исключительной сложности самостоятельной реализации движка работы с картами (особенно векторными) вендоры API карт предоставляют и «обёртки» к HTTP API (например, поисковому), и готовые библиотеки для работы с географическими сущностями, которые часто включают в себя и визуальные компоненты общего назначения — кнопки, метки, контекстные меню — которые могут применяться и совершенно самостоятельно вне контекста API (SDK) как такового.

Настоящий раздел будет посвящён именно двум этим видам программных инструментов:

клиентским «обёрткам» поверх клиент‑серверных API;
клиентским библиотекам, предоставляющие визуальные компоненты, с которыми конечный пользователь может взаимодействовать напрямую.

Во избежание нагромождения подобных оборотов мы будем называть первый тип инструментов просто «SDK», а второй — «UI‑библиотеки».

NB: вообще говоря, UI‑библиотека может как включать в себя обёртку над клиент‑серверным API, так и предоставлять чистый API к графическому движку. В рамках этой книги мы будем говорить, в основном, о первом варианте как о более общем случае (и более сложном с точки зрения проектирования API). Многие паттерны дизайна SDK, которые мы опишем далее, применимы и к «чистым» библиотекам без клиент‑серверной составляющей.

Глава 42. SDK: проблемы и решения

Первый вопрос об SDK (напомним, так мы будем называть нативную клиентскую библиотеку, предоставляющую доступ к technology‑agnostic клиент‑серверному API), который мы должны прояснить — почему вообще такое явление как SDK существует. Иными словами, почему использование обёртки для фронтенд‑разработчика является более удобным, нежели работа с нижележащим API напрямую.

Некоторые причины лежат на поверхности:

Протоколы клиент‑серверных API, как правило, разрабатываются так, что не зависят от конкретного языка программирования и, таким образом, без дополнительных действий полученные из API данные будут представлены в не самом удобном формате. Например в JSON нет типа данных «дата и время», и его приходится передавать в виде строки; или, скажем, поддержка (де)сериализации хэш‑таблиц в протоколах общего назначения отсутствует.
Большинство языков программирования императивные (и чаще всего — объектно‑ориентированные), в то время как большинство форматов данных — декларативные. Работать с сырыми данными, полученными из API, таким образом почти всегда неудобно с точки зрения написания кода, программистам зачастую было бы удобнее работать с полученными из API данными как с объектами.
Разные языки программирования предполагают разный стиль кодирования (кейсинг, организация неймспейсов и т. п.), в то время как концепция API не предполагает адаптацию форматирования под запрашивающую платформу.
Как правило, платформа/язык программирования диктуют свою парадигму работы с возникающими ошибками (в виде исключений и/или механизмов defer/panic), что опять же неприменимо в концепции универсального для всех клиентов сетевого API.
API идёт в комплекте с рекомендациями (машино‑ или человекочитаемыми) по организации перезапросов в случае недоступности эндпойнтов. Эту логику необходимо реализовать разработчику клиента, поскольку библиотеки работы с сетью её, как правило, не предоставляют (и в общем‑то не могут этого делать для потенциально неидемпотентных запросов). Этот пункт, при всей видимой малозначительности, является критически важным для любого крупного API, поскольку именно на этом уровне разработчики API могут заложить предохранители от потенциальной перегрузки серверов API лавиной перезапросов, поскольку разработчики клиентов этой частью традиционно пренебрегают: * читать заголовок Retry-After и не пытаться перезапросить эндпойнт раньше, чем указал сервер; * ввести увеличивающие интервалы между перезапросами.

Наличие собственного SDK устранило бы указанные проблемы, которые в некотором смысле являются тривиальными: для их решения не требуетя изменять порядок работы с API (каждому вызову и каждому ответу в API однозначно соответствует какая‑то конструкция на языке платформы, и достаточно описать правила построения такого соответствия) — достаточно адаптировать платформо‑независимый формат API к правилам конкретного языка программирования, что часто можно автоматизировать.

Однако, помимо тривиальных проблем при разработке SDK к клиент‑серверному API мы сталкиваемся и с проблемами более высокого порядка:

В клиент‑серверных API данные передаются только по значению; чтобы сослаться на какую‑то сущность, необходимо использовать какие‑то внешние идентификаторы. Например, если у нас есть два набора сущностей — рецепты и предложения кофе — то нам необходимо будет построить карту рецептов по id, чтобы понять, на какой рецепт ссылается какое предложение:

// Запрашиваем информацию о рецептах
// лунго и латте
const recipes = await api
  .getRecipes(['lungo', 'latte']);
// Строим карту, позволяющую обратиться
// к данным о рецепте по его id
const recipeMap = new Map();
recipes.forEach((recipe) => {
  recipeMap.set(recipe.id, recipe);
});
// Запрашиваем предложения
// лунго и латте
const offers = await api.search({
  recipes: ['lungo', 'latte'],
  location
});
// Для того, чтобы показать предложения
// пользователю, нужно из каждого
// предложения извлечь id рецепта,
// и уже по id найти описание
promptUser(
  'Найденные предложения',
  offers.map((offer) => {
    const recipe = recipeMap
      .get(offer.recipe_id);
    return {offer, recipe};
  }));

Указанный код мог бы быть вдвое короче, если бы мы сразу получали из метода api.search предложения с заполненной ссылкой на рецепт:

// Запрашиваем информацию о рецептах
// лунго и латте
const recipes = await api
  .getRecipes(['lungo', 'latte']);
// Запрашиваем предложения
// лунго и латте
const offers = await api.search({
  // Передаём не идентификаторы
  // рецептов, а ссылки на объекты,
  // описывающие рецепты
  recipes,
  location
});
promptUser(
  'Найденные предложения',
  // offer уже содержит
  // ссылку на рецепт
  offers
);

Клиент-серверные API, как правило, стараются декомпозировать так, чтобы одному запросу соответствовал один тип возвращаемых данных. Даже если эндпойнт композитный (т.е. позволяет при запросе с помощью параметров указать, какие из дополнительных данных необходимо вернуть), это всё ещё ответственность разработчика этими параметрами воспользоваться. Код из примера выше мог бы быть ещё короче, если бы SDK взял на себя инициализацию всех нужных связанных объектов:
```
// Запрашиваем предложения
// лунго и латте
const offers = await api.search({
  recipes: ['lungo', 'latte'],
  location
});
// SDK сам обратился к эндпойнту
// getRecipes и получил данные
// по лунго и латте
promptUser(
  'Найденные предложения',
  offers
);
```
При этом SDK может также заполнять программные кэши сущностей (если мы не полагаемся на кэширование на уровне протокола) и/или позволять «лениво» инициализировать объекты.

Вообще, хранение данных (таких, как токены авторизации, ключи идемпотентности при перезапросах, идентификаторы черновиков при двухфазных коммитах и т.д.) между запросам также является ответственностью клиента и с трудом поддаётся формализации. Если SDK возьмёт на себя эти функции, в коде приложений, использующих API, будет допущено намного меньше ошибок.
Получение обратных вызовов в клиент-серверном API, даже если это дуплексный канал, с точки зрения клиента выглядит крайне неудобным в разработке, поскольку вновь требует наличия карт объектов. Даже если в API реализована push-модель, код выходит чрезвычайно громоздким:
```
// Получаем текущие заказы
const orders = await api
  .getOngoingOrders();
// Строим карту заказов
const orderMap = new Map();
orders.forEach((order) => {
  orderMap.set(order.id, order);
});
// Подписываемся на события
// изменения состояния заказов
api.subscribe(
  'order_state_change',
  (event) => {
    const order = orderMap
      .get(event.order_id);
    // Выполняем какие-то
    // действия с заказом,
    // например, обновляем UI
    // приложения
    UI.update(order);
  }
);
```
Если же API требует поллинга изменений состояний объектов, то разработчику придётся ещё где-то реализовать периодический опрос эндпойнта со списком изменений, и ещё следить за тем, чтобы не перегружать сервер запросами.

Кроме того, обратите внимание, что в вышеприведённом фрагменте кода [разработчиком приложения] допущены множественные ошибки:
- сначала получается список заказов, а затем происходит подписывание на их изменения; если между двумя этими вызовами какой-то из заказов изменился, приложение об этом не узнает;
- если пришло событие изменения какого-то неизвестного приложению заказа (который, например, был создан с другого устройства или в другом потоке исполнения), поиск в карте заказов вернёт пустой результат, и обработчик события выбросит исключение, которое никак не обработано.
И вновь мы приходим к тому, что недостаточно продуманный SDK приводит к ошибкам в работе использующих его приложений. Разработчику было бы намного удобнее, если бы объект заказа позволял подписаться на свои события, не задумываясь о том, как эта подписка технически работает и как не пропустить события:
```
const order = await api
  .createOrder(…)
  // Нет нужды подписываться
  // на *все* события и потом
  // фильтровать их по id
  .subscribe(
    'state_change',
    (event) => { … }
  );
```
NB: код выше предполагает, что объект order изменяется консистентным образом: даже если между вызовами createOrder и subscribe состояние заказа успело измениться на сервере, состояние объекта order будет консистентно списку событий state_change, полученных наблюдателем. Как это организовать технически — как раз забота разработчика SDK.
Восстановление после ошибок в бизнес-логике, как правило, достаточно сложная операция, которую сложно описать в машиночитаемом виде. Разработчику клиента необходимо самому продумать эти сценарии.
```
// Получаем предложения
const offers = await api
  .search(…);
// Пользователь выбирает
// подходящее предложение
const selectedOffer =
  await promptUser(offers);
let order;
let offer = selectedOffer;
let numberOfTries = 0;
do {
  // Пытаемся создать заказ
  try {
    numberOfTries++;
    order = await api
      .createOrder(offer, …);
  } catch (e) {
    // Если количество попыток
    // пересоздания заказа превысило
    // какое-то разумное значение
    // следует бросить попытки
    // восстановиться
    if (numberOfTries > TRY_LIMIT) {
      throw new NoRetriesLeftError();
    }
    // Если произошла ошибка
    // «предложение устарело»
    if (e.type == 
      api.OfferExpiredError) {
      // если попытки ещё остались,
      // пытаемся получить новое
      // предложение
      offer = await api
        .renewOffer(offer);
    } else {
      // Обработка других видов
      // ошибок
      …
    }
  }
} while (!order);
```
Как мы видим, простая операция «попробовать продлить предложение» выливается в громоздкий код, в котором легко ошибиться, и, что ещё важнее, который совершенно не нужен разработчику приложения, поскольку он не добавляет никакой новой функциональности для конечного пользователя. Было бы гораздо проще, если бы этой ошибки вовсе не было в SDK, т.е. попытки обновления и перезапросы выполнялись бы автоматически.

Аналогичные ситуации возникают и в случае нестрого-консистентных API или оптимистичного управления параллелизмом — и вообще в любом API, в котором фон ошибок является ожидаемым (что в случае распределённых клиент-серверных API является нормой жизни). Для разработчика приложения написание кода, имплементирующего политики типа «read your writes» (т.е. передачу токенов последней известной операции в последующие запросы) — попросту напрасная трата времени.
Наконец, ещё одна важная функция, которая может быть доверена SDK — это изоляция нижележащего API и смена парадигмы версионирования. Доступ к функциональности API может быть скрыт (т.е. разработчики не будут иметь доступ к низкоуровневой работой с API), тем самым обеспечивая определённую свободу работы с API изнутри SDK, вплоть до бесшовного перехода на новые мажорные версии API. Этот подход, несомненно, предоставляет вендору API намного больше контроля над приложениями клиентов, но требует и намного больше ресурсов на разработку, и, что важнее, грамотного проектирования SDK — такого, чтобы у разработчиков не было необходимости обращаться к API напрямую в обход SDK по причине отсутствия в нём необходимых функций или их плохой реализации, и при этом SDK могу пережить смену мажорной версии низкоуровневого API.

Суммируя написанное выше, хорошо спроектированный SDK служит, помимо поддержания консистентности платформе и предоставления «синтаксического сахара», трём важным целям:

снижение количества ошибок в клиентском коде путём имплементации хелперов, покрывающих неочевидные и слабоформализуемые аспекты работы с API;
избавление клиентских разработчиков от необходимости писать код, который им совершенно не нужен;
предоставление разработчику API большего контроля над интеграциями.

Кодогенерация

Как мы убедились, список задач, стоящих перед разработчиком SDK (если, конечно, его целью является качественный продукт) — очень и очень значительный. Учитывая, что под каждую целевую платформу необходим отдельный SDK, неудивительно, что многие вендоры API стремятся полностью или частично заменить ручной труд машинным.

Одно из основных направлений такой автоматизации — кодогенерация, то есть разработка технологии, которая позволяет по спецификации API сгенерировать готовый код SDK на целевом языке программирования для целевой платформы. Многие современные стандарты обмена данными (в частности, gRPC) поставляются в комплекте с генераторами готовых клиентов на различных языках; к другим технологиям (в частности, OpenAPI/Swagger) такие генераторы пишутся энтузиастами.

Генерация кода позволяет решить типовые проблемы: стиль кодирования, обработка исключений, (де)сериализация сложных типов — словом все те задачи, которые зависят не от особенностей высокоуровневой бизнес‑логики, а от конвенций конкретной платформы. Относительно недорого разработчик SDK может дополнить такой автоматизированный «перевод» удобными хелпера: обеспечить автоматические перезапросы для идемпотентных эндпойнтов (с реализацией какой‑то политики управления интервалами повторных вызовов), кэширование результатов, сохранение данных (например, токенов авторизации) в системном хранилище и т. д.

Такой сгенерированный SDK часто называют термином «клиент к API». Удобство использования и функциональные возможности кодогенерации столь привлекательны, что многие вендоры API только ей и ограничиваются, предоставляя свои SDK в виде сгенерированных клиентов.

Как мы, однако, видим из написанного выше, проблемы более высокого порядка — получение серверных событий, обработка ошибок в бизнес‑логике и т. п. — никак не может быть покрыта кодогенерацией, во всяком случае — стандартным модулем без его доработки применительно к конкретному API. В случае нетривиальных API со сложным основным циклом работы очень желательно, чтобы SDK решал также и высокоуровневые проблемы, иначе вы просто получите множество разработанных поверх API приложений, раз за разом повторяющие одни и те же «детские ошибки». Тем не менее, это не повод отказываться от кодогенерации полностью — её можно использовать как базис, на котором будет разработан высокоуровневый SDK.

Комментарии (5)

SpiderEkb
10.07.2023 07:04
#25736300
Как мы отмечали, аббревиатура «SDK» («Software Development Kit»), как и многие из обсуждавшихся ранее терминов, не имеет конкретного значения. Считается, что SDK отличается от API тем, что помимо программных интерфейсов содержит и готовые инструменты для работы с ними.

На мой взгляд несколько спорное утверждение. Сами аббревиатуры говорят за себя:

API - Application Program Interface - набор интерфейсов (экспортируемых функций, выполняющих какие-то задачи), предоставляемых кем-то. В частности, это могут быть системные API, предоставляемые операционкой, это могут быть API, предоставляемые фреймворком и т.п.

SDK - Software Development Kit - набор [инструментов] для разработки программ. Сюда входит документация по API (часто с примерами), заголовочные файлы с описаниями прототипов этих API, если необходимо - библиотеки импорта.

В целом можно пользоваться API и без SDK (хотя это и преодоление), но вот SDK без API бесполезен.
1. forgotten Автор
  10.07.2023 07:04
  #25736340
  Ну, в теории да, на практике нет. Скажем, Google свой веб-API карт называет Google Maps API, ArcGIS — Maps SDK, а Майкрософт свой поначалу называл Bing Maps SDK, а потом переименовал и вовсе в Web Control. Кто во что горазд, короче.
1. qw1
  10.07.2023 07:04
  #25741302
  Как мне кажется, SDK — это софтварный продукт (включающий документацию, инструменты, примеры, и т.д.).
  
  То есть, главное отличие — SDK можно скачать/купить, сохранить на диск, установить (если предусмотрен инсталлятор).
  1. forgotten Автор
    10.07.2023 07:04
    #25741494
    Ну такое. Вот Amazon SDK for JavaScript https://docs.aws.amazon.com/sdk-for-javascript/v3/developer-guide/welcome.html
    
    А вот, скажем, Ethereum JavaScript API: https://web3js.readthedocs.io/en/v1.10.0/getting-started.html
    
    Казалось бы, найди 5 отличий в том, как их надо подключать.
  1. SpiderEkb
    10.07.2023 07:04
    #25742942
    То есть, главное отличие — SDK можно скачать/купить, сохранить на диск, установить (если предусмотрен инсталлятор).
    
    В целом - да. API - кем-то предоставляемый набор интерфейсов. ОС, кем-то в сети и т.п.
    
    SDK - пакет который устанавливаешь себе сам для работы с этими интерфейсами.
    
    Как пример - есть WinAPI - экспортируемые системные функции которые реализованы в ядре ОС. WinSDK - пакет для работы с этими функциями - заголовочные файлы, библиотеки импорта, оффлайновая документация.
    
    В принципе, можно и без SDK - почитать про нужную функцию на MSDN, самому написать заголовочный файл, получить ее адрес через GetProcAddress (или самому сделать библиотеку импорта нужного модуля при помощи implib).
    
    Но если функций много таких, то это все дополнительные затраты времени и сил.