Предыдущая часть: Bash-скрипты: начало

В прошлый раз мы рассказали об основах программирования для bash. Даже то немногое, что уже разобрано, позволяет всем желающим приступить к автоматизации работы в Linux. В этом материале продолжим рассказ о bash-скриптах, поговорим об управляющих конструкциях, которые позволяют выполнять повторяющиеся действия. Речь идёт о циклах for и while, о методах работы с ними и о практических примерах их применения.

image

Внимание: в посте спрятана выгода!

Циклы for


Оболочка bash поддерживает циклы for, которые позволяют организовывать перебор последовательностей значений. Вот какова базовая структура таких циклов:

for var in list
do
команды
done

В каждой итерации цикла в переменную var будет записываться следующее значение из списка list. В первом проходе цикла, таким образом, будет задействовано первое значение из списка. Во втором — второе, и так далее — до тех пор, пока цикл не дойдёт до последнего элемента.

Перебор простых значений


Пожалуй, самый простой пример цикла for в bash-скриптах — это перебор списка простых значений:

#!/bin/bash
for var in first second third fourth fifth
do
echo The  $var item
done

Ниже показаны результаты работы этого скрипта. Хорошо видно, что в переменную $var последовательно попадают элементы из списка. Происходит так до тех пор, пока цикл не дойдёт до последнего из них.


Простой цикл for

Обратите внимание на то, что переменная $var сохраняет значение при выходе из цикла, её содержимое можно менять, в целом, работать с ней можно как с любой другой переменной.

Перебор сложных значений


В списке, использованном при инициализации цикла for, могут содержаться не только простые строки, состоящие из одного слова, но и целые фразы, в которые входят несколько слов и знаков препинания. Например, всё это может выглядеть так:

#!/bin/bash
for var in first "the second" "the third" "I’ll do it"
do
echo "This is: $var"
done

Вот что получится после того, как этот цикл пройдётся по списку. Как видите, результат вполне ожидаем.


Перебор сложных значений
TNW-CUS-FMP — промо-код на 10% скидку на наши услуги, доступен для активации в течение 7 дней"

Инициализация цикла списком, полученным из результатов работы команды


Ещё один способ инициализации цикла for заключается в передаче ему списка, который является результатом работы некоей команды. Тут используется подстановка команд для их исполнения и получения результатов их работы.

#!/bin/bash
file="myfile"
for var in $(cat $file)
do
echo " $var"
done

В этом примере задействована команда cat, которая читает содержимое файла. Полученный список значений передаётся в цикл и выводится на экран. Обратите внимание на то, что в файле, к которому мы обращаемся, содержится список слов, разделённых знаками перевода строки, пробелы при этом не используются.


Цикл, который перебирает содержимое файла

Тут надо учесть, что подобный подход, если ожидается построчная обработка данных, не сработает для файла более сложной структуры, в строках которого может содержаться по несколько слов, разделённых пробелами. Цикл будет обрабатывать отдельные слова, а не строки.

Что, если это совсем не то, что нужно?

Разделители полей


Причина вышеописанной особенности заключается в специальной переменной окружения, которая называется IFS (Internal Field Separator) и позволяет указывать разделители полей. По умолчанию оболочка bash считает разделителями полей следующие символы:

  • Пробел
  • Знак табуляции
  • Знак перевода строки

Если bash встречает в данных любой из этих символов, он считает, что перед ним — следующее самостоятельное значение списка.

Для того, чтобы решить проблему, можно временно изменить переменную среды IFS. Вот как это сделать в bash-скрипте, если исходить из предположения, что в качестве разделителя полей нужен только перевод строки:

IFS=$'\n'

После добавления этой команды в bash-скрипт, он будет работать как надо, игнорируя пробелы и знаки табуляции, считая разделителями полей лишь символы перевода строки.

#!/bin/bash
file="/etc/passwd"
IFS=$'\n'
for var in $(cat $file)
do
echo " $var"
done

Если этот скрипт запустить, он выведет он именно то, что от него требуется, давая, в каждой итерации цикла, доступ к очередной строке, записанной в файл.


Построчный обход содержимого файла в цикле for

Разделителями могут быть и другие символы. Например, выше мы выводили на экран содержимое файла /etc/passwd. Данные о пользователях в строках разделены с помощью двоеточий. Если в цикле нужно обрабатывать подобные строки, IFS можно настроить так:

IFS=:

Обход файлов, содержащихся в директории


Один из самых распространённых вариантов использования циклов for в bash-скриптах заключается в обходе файлов, находящихся в некоей директории, и в обработке этих файлов.

Например, вот как можно вывести список файлов и папок:

#!/bin/bash
for file in /home/likegeeks/*
do
if [ -d "$file" ]
then
echo "$file is a directory"
elif [ -f "$file" ]
then
echo "$file is a file"
fi
done

Если вы разобрались с предыдущим материалом из этой серии статей, вам должно быть понятно устройство конструкции if-then, а так же то, как отличить файл от папки. Если вам сложно понять вышеприведённый код, перечитайте этот материал.

Вот что выведет скрипт.


Вывод содержимого папки

Обратите внимание на то, как мы инициализируем цикл, а именно — на подстановочный знак «*» в конце адреса папки. Этот символ можно воспринимать как шаблон, означающий: «все файлы с любыми именами». он позволяет организовать автоматическую подстановку имён файлов, которые соответствуют шаблону.

При проверке условия в операторе if, мы заключаем имя переменной в кавычки. Сделано это потому что имя файла или папки может содержать пробелы.

Циклы for в стиле C


Если вы знакомы с языком программирования C, синтаксис описания bash-циклов for может показаться вам странным, так как привыкли вы, очевидно, к такому описанию циклов:

for (i = 0; i < 10; i++)
{
printf("number is %d\n", i);
}

В bash-скриптах можно использовать циклы for, описание которых выглядит очень похожим на циклы в стиле C, правда, без некоторых отличий тут не обошлось. Схема цикла при подобном подходе выглядит так:

for (( начальное значение переменной ; условие окончания цикла; изменение переменной ))

На bash это можно написать так:

for (( a = 1; a < 10; a++ ))

А вот рабочий пример:

#!/bin/bash
for (( i=1; i <= 10; i++ ))
do
echo "number is $i"
done

Этот код выведет список чисел от 1 до 10.


Работа цикла в стиле C

Цикл while


Конструкция for — не единственный способ организации циклов в bash-скриптах. Здесь можно пользоваться и циклами while. В таком цикле можно задать команду проверки некоего условия и выполнять тело цикла до тех пор, пока проверяемое условие возвращает ноль, или сигнал успешного завершения некоей операции. Когда условие цикла вернёт ненулевое значение, что означает ошибку, цикл остановится.

Вот схема организации циклов while
while команда проверки условия
do
другие команды
done


Взглянем на пример скрипта с таким циклом:

#!/bin/bash
var1=5
while [ $var1 -gt 0 ]
do
echo $var1
var1=$[ $var1 - 1 ]
done

На входе в цикл проверяется, больше ли нуля переменная $var1. Если это так, выполняется тело цикла, в котором из значения переменной вычитается единица. Так происходит в каждой итерации, при этом мы выводим в консоль значение переменной до его модификации. Как только $var1 примет значение 0, цикл прекращается.


Результат работы цикла while

Если не модифицировать переменную $var1, это приведёт к попаданию скрипта в бесконечный цикл.

Вложенные циклы


В теле цикла можно использовать любые команды, в том числе — запускать другие циклы. Такие конструкции называют вложенными циклами:

#!/bin/bash
for (( a = 1; a <= 3; a++ ))
do
echo "Start $a:"
for (( b = 1; b <= 3; b++ ))
do
echo " Inner loop: $b"
done
done

Ниже показано то, что выведет этот скрипт. Как видно, сначала выполняется первая итерация внешнего цикла, потом — три итерации внутреннего, после его завершения снова в дело вступает внешний цикл, потом опять — внутренний.


Вложенные циклы

Обработка содержимого файла


Чаще всего вложенные циклы используют для обработки файлов. Так, внешний цикл занимается перебором строк файла, а внутренний уже работает с каждой строкой. Вот, например, как выглядит обработка файла /etc/passwd:

#!/bin/bash
IFS=$'\n'
for entry in $(cat /etc/passwd)
do
echo "Values in $entry –"
IFS=:
for value in $entry
do
echo " $value"
done
done

В этом скрипте два цикла. Первый проходится по строкам, используя в качестве разделителя знак перевода строки. Внутренний занят разбором строк, поля которых разделены двоеточиями.


Обработка данных файла

Такой подход можно использовать при обработке файлов формата CSV, или любых подобных файлов, записывая, по мере надобности, в переменную окружения IFS символ-разделитель.

Управление циклами


Возможно, после входа в цикл, нужно будет остановить его при достижении переменной цикла определённого значения, которое не соответствует изначально заданному условию окончания цикла. Надо ли будет в такой ситуации дожидаться нормального завершения цикла? Нет конечно, и в подобных случаях пригодятся следующие две команды:

  • break
  • continue

Команда break


Эта команда позволяет прервать выполнение цикла. Её можно использовать и для циклов for, и для циклов while:

#!/bin/bash
for var1 in 1 2 3 4 5 6 7 8 9 10
do
if [ $var1 -eq 5 ]
then
break
fi
echo "Number: $var1"
done

Такой цикл, в обычных условиях, пройдётся по всему списку значений из списка. Однако, в нашем случае, его выполнение будет прервано, когда переменная $var1 будет равна 5.


Досрочный выход из цикла for

Вот — то же самое, но уже для цикла while:

#!/bin/bash
var1=1
while [ $var1 -lt 10 ]
do
if [ $var1 -eq 5 ]
then
break
fi
echo "Iteration: $var1"
var1=$(( $var1 + 1 ))
done

Команда break, исполненная, когда значение $var1 станет равно 5, прерывает цикл. В консоль выведется то же самое, что и в предыдущем примере.

Команда continue


Когда в теле цикла встречается эта команда, текущая итерация завершается досрочно и начинается следующая, при этом выхода из цикла не происходит. Посмотрим на команду continue в цикле for:

#!/bin/bash
for (( var1 = 1; var1 < 15; var1++ ))
do
if [ $var1 -gt 5 ] && [ $var1 -lt 10 ]
then
continue
fi
echo "Iteration number: $var1"
done

Когда условие внутри цикла выполняется, то есть, когда $var1 больше 5 и меньше 10, оболочка исполняет команду continue. Это приводит к пропуску оставшихся в теле цикла команд и переходу к следующей итерации.


Команда continue в цикле for

Обработка вывода, выполняемого в цикле


Данные, выводимые в цикле, можно обработать, либо перенаправив вывод, либо передав их в конвейер. Делается это с помощью добавления команд обработки вывода после инструкции done.

Например, вместо того, чтобы показывать на экране то, что выводится в цикле, можно записать всё это в файл или передать ещё куда-нибудь:

#!/bin/bash
for (( a = 1; a < 10; a++ ))
do
echo "Number is $a"
done > myfile.txt
echo "finished."

Оболочка создаст файл myfile.txt и перенаправит в этот файл вывод конструкции for. Откроем файл и удостоверимся в том, что он содержит именно то, что ожидается.


Перенаправление вывода цикла в файл

Пример: поиск исполняемых файлов


Давайте воспользуемся тем, что мы уже разобрали, и напишем что-нибудь полезное. Например, если надо выяснить, какие именно исполняемые файлы доступны в системе, можно просканировать все папки, записанные в переменную окружения PATH. Весь арсенал средств, который для этого нужен, у нас уже есть, надо лишь собрать всё это воедино:

#!/bin/bash
IFS=:
for folder in $PATH
do
echo "$folder:"
for file in $folder/*
do
if [ -x $file ]
then
echo " $file"
fi
done
done

Такой вот скрипт, небольшой и несложный, позволил получить список исполняемых файлов, хранящихся в папках из PATH.


Поиск исполняемых файлов в папках из переменной PATH

Итоги


Сегодня мы поговорили о циклах for и while в bash-скриптах, о том, как их запускать, как ими управлять. Теперь вы умеете обрабатывать в циклах строки с разными разделителями, знаете, как перенаправлять данные, выведенные в циклах, в файлы, как просматривать и анализировать содержимое директорий.

Если предположить, что вы — разработчик bash-скриптов, который знает о них только то, что изложено в первой части этого цикла статей, и в этой, второй, то вы уже вполне можете написать кое-что полезное. Впереди — третья часть, разобравшись с которой, вы узнаете, как передавать bash-скриптам параметры и ключи командной строки, и что с этим всем делать.

Уважаемые читатели! В комментариях к предыдущему материалу вы рассказали нам много интересного. Уверены, всё это окажет неоценимую помощь тем, кто хочет научиться программировать для bash. Но тема эта огромна, поэтому снова просим знатоков поделиться опытом, а новичков — впечатлениями.
Поделиться с друзьями
-->

Комментарии (28)


  1. Alukardd
    07.04.2017 16:14
    +8

    О-о-ох, а Вы всё продолжаете писать ужасный код, и ладно бы сами писали для себя скрипты, так нет, это статья на весь рунет!
    Прочтите для начала Bash Pitfalls, а то я не знаю с чего начать комментирование Вашей статьи…


    1. redfs
      07.04.2017 16:50
      +4

      Это перевод, конечно, но из той серии, которую переводить лучше не стоит. Автор вообще сам себе противоречит, сначала пишет, что в названиях файлов/директорий могут быть пробелы, а потом что-то типа:

      for file in $folder/*
      
      Согласен. Не стоит учиться на таких переводах.


      1. selivanov_pavel
        07.04.2017 18:05
        -1

        С пробелами в данном случае прокатит. А вот например если имя файла содержит *, то попробует раскрыть как вайлдкард.


        1. redfs
          07.04.2017 18:24
          +2

          С пробелами в данном случае прокатит

          $ ls 
          folder 1  folder 2
          $ for folder in $(ls); do for file in $folder/*; do echo $file; done; done
          folder/*
          1/*
          folder/*
          2/*
          


          1. selivanov_pavel
            07.04.2017 18:50

            Если вывод ls парсить, то не прокатит. А если напрямую раскрывать for file in folder/*, то вполне:


            $ ls -1
            a b
            c d
            $ for i in ./*; do echo $i; done
            ./a b
            ./c d


            1. redfs
              07.04.2017 19:02
              +2

              Давайте поясню. В статье $folder — переменная. Каким образом ей присвоили значение — совершенно неважно, важно то, что в примере она используется с ошибкой. Я тупо взял пример из статьи, без всяких «если» :)


              1. selivanov_pavel
                07.04.2017 20:33

                Запутался, про пробелы в каком месте речь :) Да, если в $folder пробел, тоже сломается.


                1. ghostinushanka
                  07.04.2017 22:26
                  +1

                  find /path -print0 |  while IFS= read -r -d $'\0' path; do
                      #спасает от... от чего только не спасает, проверить можно просто:
                      echo -e "${path}"
                    done
                  

                  While там для того, чтобы можно было с переменной path оперировать дальше.


                  1. selivanov_pavel
                    07.04.2017 22:58

                    С read -d $'\0' трюк не знал, спасибо :)


                    Тут кстати ещё одна проблема возникает — while в таков варианте запустит сабшел, изменения переменных в котором не видны в родительском. Поэтому обмен данными с командами, которые внутри while работают, может быть проблематичен.


                    1. ghostinushanka
                      08.04.2017 10:13

                      while в таков варианте запустит сабшел

                      Это скорее сила привычки и того что «внутренности» while в моём конкретном случае не были нужны. «Исправляется» очень просто:
                      while IFS= read -r -d $'\0' path; do
                        echo -e "${path}"
                      done < <(find /path -print0)
                      


                      1. iig
                        08.04.2017 10:32

                        find | xargs же.
                        Зачем писать мутные 3 строчки, если можно в одну?


                        1. selivanov_pavel
                          08.04.2017 15:11

                          Если одной команды после xargs не достаточно, а нужна сложная обработка, с условиями и переменными.


                          1. iig
                            08.04.2017 15:24

                            Например? ;)


                            1. selivanov_pavel
                              08.04.2017 15:26

                              Пример: https://selivan.github.io/2017/04/08/ansible-check-on-commit-vault-files-are-encrypted.html Вот только закончил писать статью в блог и сразу повод попиарить её на хабре :)


                              1. iig
                                09.04.2017 08:00

                                Perl же. Там есть и чтение чужого выхлопа в массив, и анализ файла на вхождение строки, и достаточно по человеческих выглядит, и не нужно бояться, что в имени файла попадется не тот символ.


                            1. ghostinushanka
                              08.04.2017 16:45
                              +1

                              Так я надеюсь понятнее (вместе с объяснениями Павла)?

                              #!/usr/bin/env bash
                              
                              TOPVAR="this is topvar"
                              
                              find ~ -maxdepth 1 -type d -print0 |    while IFS= read -r -d $'\0' path; do
                                      TOPVAR="this is done in subshell"
                                  done
                              
                              echo -e "subshell version"
                              #prints - "this is topvar", because pipe creates subshell
                              echo -e "${TOPVAR}"
                              
                              #----------------
                              echo -e ""
                              # let's do it again without subshell
                              while IFS= read -r -d $'\0' path; do
                                  TOPVAR="this is not done in the subshell, result is visible"
                              done < <(find ~ -maxdepth 1 -type d -print0)
                              
                              echo -e "non-subshell version"
                              # prints - this is not done in the subshell, result is visible
                              echo -e "${TOPVAR}"
                              


                              selivanov_pavel
                              Не вводите пож. людей в заблуждение фразой
                              while loop creates separate subshell

                              Сабшел создаёт пайпа.


                              1. selivanov_pavel
                                08.04.2017 16:52

                                Сабшел создаёт пайпа

                                Поправлю, спасибо


  1. Ordinatus
    07.04.2017 18:13
    +7

    Пора запретить статьи о bash на хабре конвенцией ООН.
    Только за эту неделю психика линуксоидов подверглась геноциду раз, два, три (эта публикация) раза


  1. iig
    07.04.2017 18:16
    +1

    Статью нужно назвать иначе, что-то в стиле «Основы программирования на примере bash». Излагается все для тех, кто никогда про циклы не слышал.
    Предлагаю также примеры брать более жизненные. Например, тот же анализ passwd — но чтобы результат был осмысленным. Зачем может пригодиться такой вот дамп форматированного файла?


  1. ghostinushanka
    07.04.2017 18:18
    +2

    КДПВ отлично иллюстрирует автоцензуру того, что я подумал при прочтении.
    Сколько можно снова и снова плодить по кусочкам разбитые (и не полные) гайды по написанию скриптов на баше?
    Есть замечательный документ — http://tldp.org/LDP/abs/html/, кто владеет английским — просто читайте его.
    Авторам из ruvds предлагаю помогать перевести вышеупомянутый источник на русский, раз уж так руки чешутся. Пользы будет в разы больше.


    1. ru_vds
      07.04.2017 18:34

      Здравствуйте, спасибо за комментарий. В первой статье мы спрашивали нужно ли переводить остальные части, по результатам было принято решение переводить дальше

      Результаты голосования
      image


      1. saboteur_kiev
        07.04.2017 19:07
        +1

        Окей, переводите дальше.

        Но можете хотя бы оформлять код так, чтобы оно соответствовало bash style, отделять вложенные блоки отступом, именовать переменные в UPPERCASE?

        #!/bin/bash
        for VAR1 in 1 2 3 4 5 6 7 8 9 10
        do
          if [ $VAR1 -eq 5 ]
          then
            break
          fi
          echo "Number: $VAR1"
        done
        


        1. ghostinushanka
          07.04.2017 22:08
          +1

          Стиль и отступы мелочь по сравнению вот с этим из первой статьи:

          Нас интересует bash, поэтому первая строка файла будет такой:
          #!/bin/bash
          

          Причём на хабре это уже как минимум один раз обсуждалось вот тут (советую пойти по ссылкам вглубь): https://habrahabr.ru/post/319670/#comment_10017494

          Если лень искать и ходить по ссылкам, вот хорошо написано:
          http://stackoverflow.com/questions/10376206/what-is-the-preferred-bash-shebang

          И можно на самом деле продолжать дальше, но мы лишь будем обсуждать то, что уже наверняка обсуждалось и наверняка не один раз.


  1. selivanov_pavel
    07.04.2017 18:54
    +3

    Не надо парсить /etc/passwd, надо использовать getent. Иначе потом эти скрипты не будут работать на хостах, где пользователи прилетают из какого-нибудь LDAP


    1. iig
      07.04.2017 23:38

      Если скрипт должен что-то искать именно в локальной базе — почему бы и нет.


  1. romanegunkov
    07.04.2017 20:05
    +3

    Всё, что вы напишите в sh, может быть использовано против вас.


  1. Crystal_HMR
    08.04.2017 20:45
    +1

    Больше рассказывайте "почему" вы делаете так, а не иначе. Даже простое объяснение разницы между


    if [ условие ]; then
    #
    fi

    и


    if [[ условие ]] 
    then
       #
    fi

    было бы полезнее, чем десяток очевидных примеров из статьи. Может она и для новичков, но учите новичков не только плохому, пожалуйста.


  1. nickolaym
    12.04.2017 19:58

    По поводу разделителей.
    Чем менять переменную IFS, которая повлияет и на последующую работу (т.е. надо не забыть восстановить), и на вложенные вызовы (как изолировать?), — лучше использовать транслятор символов.

    echo $PATH

    /mingw64/bin:/usr/local/bin:/usr/bin:/bin:/mingw64/bin:/usr/bin:.......

    echo $PATH | tr ':' '\n'

    /mingw64/bin
    /usr/local/bin
    /usr/bin
    /bin
    /mingw64/bin
    /usr/bin
    .....

    for d in `echo $PATH | tr : '\n'`; do echo "--- $d ---"; done

    --- /mingw64/bin ---
    --- /usr/local/bin ---
    --- /usr/bin ---
    --- /bin ---
    --- /mingw64/bin ---
    --- /usr/bin ---
    .....