$> set -o pipefail
$> fortune | head -1 > /dev/null && echo "Повезло!" || echo "Вы проиграли"
Повезло!
$> fortune | head -1 > /dev/null && echo "Повезло!" || echo "Вы проиграли"
Вы проиграли
Здесь fortune
условная программа без exit(rand())
.
Можете объяснить что здесь глючит?
Первый раз с этим Гейзенбагом я познакомился четверть века назад. Тогда для шлюза в FaxNET требовалось сделать несколько утилит через pipes «играющих в шашки» под FreeBSD. Как положено, я считал себя продвинутым и достаточно опытным программистом. Поэтому намеревался сделать всё максимально аккуратно и тщательно, уделив особое внимание обработке ошибок…
Усердия в «тщательной обработке ошибок» мне тогда добавил предыдущий опыт борьбы с багами в sendmail и uucp/uupc. Погружаться в детали той истории смысла нет, но боролся с этим Гейзенбагом я недели две по 10-14 часов. Поэтому запомнилось, и вот вчера этот старый знакомый снова заглянул в гости.
В одном из моих сегодняшних GNUMakefile
есть такой фрагмент:
echo '#define MDBX_BUILD_COMPILER "$(shell set -o pipefail; $(CC) --version | head -1 || echo 'Please use GCC or CLANG compatible compiler')"'
Подобный boilerplate можно встретить где угодно. В этом месте он появился давно и прекрасно везде работал (Linux, Solaris, OSX, FreeBSD, WSL и т.д.). Но вчера в AltLinux на платформе Эльбру?с 2000 (E2K) я заметил:
#define MDBX_BUILD_COMPILER "lcc:1.23.20:Sep--4-2019:e2k-v3-linux Please use GCC or CLANG compatible compiler"
Признаться я не сразу разглядел старого "знакомого". Более того, проект уже многократно проверялся на "Эльбрусах" и под массой различных дистрибутивов, в том числе с "Альтом". С различными компиляторами, версиями GNU Make и bash. Поэтому своей оплошности я тут видеть никак не хотел.
При попытке воспроизвести проблему и/или понять в чем дело странностей стало больше.
Заклинание в командной строке:
echo "#define MDBX_BUILD_COMPILER '$(set -o pipefail; LC_ALL=C cc --version | head -1 || echo \"Please use GCC or CLANG compatible compiler\")'"
Через-раз то выдавало лишний текст, то нет… Нередко один из вариантов залипал достаточно долго, но если потыкать подольше то всегда получались оба!
Конечно, strace
наше всё! И вот набрав strace-тираду, но не успев нажать Enter я узнал своего старого знакомого мистера Гейзенбага, а в разработчиках компилятора себя самого 25 лет назад, Nostalgie... И решил взгрустнуть написать эту заметку ;)
Кстати, как любой уважающий себя Гейзенбаг, под strace
предпочитает не воспроизводиться.
Так что же происходит?
- Утилита
head
вправе (скорее даже вынуждена) закрыть читаемый канал, сразу как только прочитает запрошенное количество строк. - Генерирующая данные программа-писатель (в данном случае
cc
) может выводить несколько строк и вольна делать это посредством нескольких вызововwrite()
. - Если читатель успеет закрыть канал со своей стороны до окончания записи на стороне писателя, то писателю прилетит ошибка.
- Программа-писатель вправе как проигнорировать ошибку записи в канал, так и отразить её в своем коде завершения.
- Вследствие установки
set -o pipefail
код завершения конвейера будет ненулевым (ошибочным) при ненулевом результате хотя бы от одного элемента, и тогда отработает|| echo "Please use GCC or CLANG compatible compiler"
.
Могут быть вариации, в зависимости от того как программа-писатель работает с сигналами. Например, программа может быть аварийно завершена (с автоматическим формированием ненулевого/ошибочного статуса завершения), либо write()
вернет результат о записи меньшего количества байтов чем запрошено и установит errno = EPIPE
.
Кто виноват?
В описываемом случае все понемногу. Обработка ошибок в cc
(lcc:1.23.20:Sep--4-2019:e2k-v3-linux) не является избыточной. Во многих случаях лучше перебдеть, хотя это и выявляет внезапные недочеты в boilerplate рассчитанным на традиционное поведение.
Что делать?
Неправильно:
fortune | head -1 && echo "Повезло, но вы рискуете!" || echo "WTF?"
Правильно:
(fortune && echo "Успешно" || echo "Ошибка") | head -1
Здесь раннее закрытие канала будет обработано интерпретатором команд при обслуживании вложенного конвейера ("внутри" скобок). Соответственно, если
fortune
сообщит в статусе об ошибки записи в закрытый канал, то вывод|| echo "Ошибка"
уже никуда не попадет, так как канал уже закрыт.
fortune | cat - | head -1 && echo "Успешно" || echo "Ошибка"
Здесь утилита
cat
выступает демпфером, так как игнорирует ошибкуEPIPE
при выводе. Этого достаточно пока выводfortune
небольшой (несколько строк) и помещается в канальном буфере (от 512 байт до ?64К, в большинстве ОС ?4К). В противном случае проблема может вернуться.
Как правильно обрабатывать EPIPE
и другие ошибки при записи?
Единственно верного решения нет, но есть простые рекомендации:
EPIPE
требуется обязательно обрабатывать (и отражать в статусе выхода) при выводе данных требующих целостности. Например, в ходе работы архиваторов или утилит резервного копирования.EPIPE
лучше игнорировать при выводе информационных и вспомогательных сообщений. Например, при выводе информации по опциям--help
или--version
.- Если разрабатываемый код допустимо использовать в конвейере перед
| head
, тоEPIPE
лучше игнорировать, иначе лучше обрабатывать и отражать в статусе выхода.
Пользуясь случаем хочу выразить благодарность коллективам МЦСТ и AltLinux за огромную результативную работу. Ваша целеустремлённость восхищает!
Так держать Camarades, до встречи осенью!
Спасибо berez за исправление очепяток и ошибок.
КДПВ от Георгий А.
AEP
Не понял, почему это правильно. Теперь вместо одной точки, где pipe может неожиданно закрыться, есть две, и вместо одной программы, которая может завершиться из-за EPIPE или SIGPIPE, есть две.
yleo Автор
Согласен, конструктивное замечание.
Дополню статью пояснениями.