Ни одно собеседование на дата аналитика/дата инженера/мл инженера не проходит без блока про SQL. Вы можете работать в стартапе из трех человек, пользоваться таблицей excel из 10 строчек, но понимать как выполняются запросы из базы данных все равно надо.

Разберем топ вопросов на знание SQL, которые чаще всего задают на собеседованиях. Я собрала в этот топ свой опыт и опыт коллег, которые недавно проходили собеседования.

Порядок выполнения операторов в запросе

Хороший вопрос на понимание работы запросов из базы данных.

1. FROM - выбор таблицы

2. WHERE - фильтрация строк

3. GROUP BY - группировка

4. Агрегатные функции (COUNT, SUM, AVG)

5. HAVING - фильтрация групп

6. SELECT - выбор полей

7. ORDER BY - сортировка

Обычно хотят услышать такой ответ, но будьте готовы ответить, что на самом деле последний в списке LIMIT - отбирает конкретное количество строк в выводе.

Отличие having от where

Честно вам скажу, я долгое время сама плавала в понимании этого вопроса. Обычно просто отчеканивала выученный ответ и все, но недавно наконец до меня дошло, попробую объяснить своими словами.

Where - это просто оператор фильтрации. Мы поставили фильтр зарплата больше 100 рублей, и в таблице остались только те строки, которые удовлетворяют этому условию.

Having же фильтрует не всю таблицу, а только результат группировки. Например, мы сначала группируем пользователей по отделам, считаем среднюю зарплату, и только потом мы накладываем условие что средняя зарплата больше 100 рублей.

Обратите внимание, что where стоит перед having и groupby в порядке выполнения запроса, поэтому если вы сразу поставите фильтр с помощью where, то эти значения не будут учтены при группировке.

WHERE

  • Фильтрует строки ДО группировки

  • Работает с отдельными записями

  • Не может использовать агрегатные функции

  • Выполняется раньше GROUP BY

HAVING

  • Фильтрует группы ПОСЛЕ группировки

  • Работает с результатами агрегации

  • Обязательно использует агрегатные функции

  • Выполняется после GROUP BY

Примеры:

WHERE (фильтрация до группировки):

SELECT department, AVG(salary)

FROM employees

WHERE salary > 30000 фильтруем сотрудников с з/п > 30k

GROUP BY department;

HAVING (фильтрация после группировки):

SELECT department, AVG(salary)

FROM employees

GROUP BY department

HAVING AVG(salary) > 50000; фильтруем отделы со средней з/п > 50k

Комбинированное использование

SELECT department, COUNT(*) as emp_count, AVG(salary)

FROM employees

WHERE hire_date > '2020-01-01' только новейшие сотрудники GROUP BY department

HAVING AVG(salary) > 40000 только отделы со средней з/п > 40k AND COUNT(*) > 3; и более 3 сотрудников

Типичные ошибки:

Неправильно:

SELECT department, AVG(salary)

FROM employees

WHERE AVG(salary) > 50000 Ошибка! WHERE не может использовать агрегатные функции GROUP BY department;

Правильно:

SELECT department, AVG(salary)

FROM employees

GROUP BY department HAVING AVG(salary) > 50000; Корректно

Оконные функции

Что такое? Отличия от groupby? Какие бывают? Вопросы по агрегирующим функциям зависят от места, куда вы собеседуетесь.

Обо всем по порядку.

Оконные функции позволяют производить вычисления над "окном" данных — группой строк, связанных с текущей строкой, при этом сохраняя все исходные строки в результате.

Ключевые особенности:

  • Не группируют данные (все строки сохраняются)

  • Используют OVER() clause для определения "окна"

  • Работают с контекстом текущей строки

Синтаксис:

function_name() OVER ( PARTITION BY column1, column2... ORDER BY column3, column4... frame_clause )

Основные компоненты:

1. PARTITION BY — разделяет данные на группы (аналог GROUP BY, но без свертывания)

SELECT name, department, salary, AVG(salary) OVER (PARTITION BY department) as avg_department_salary FROM employees;

2. ORDER BY — определяет порядок данных внутри окна

SELECT name, salary, SUM(salary) OVER (ORDER BY salary) as running_total FROM employees;

3. Frame Clause — определяет границы окна относительно текущей строки

ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING

Отличие от GROUP BY

Представьте, что у вас есть таблица с сотрудниками: имя, отдел и зарплата.

GROUP BY — это когда вы говорите: "Сгруппируй всех сотрудников по отделам и покажи мне только общую информацию по каждому отделу — среднюю зарплату, сумму зарплат и количество человек". В результате вы получите компактную табличку: одна строка на отдел с итогами. Все детали о каждом конкретном сотруднике исчезнут. Вы видите только общую картину, как будто смотрите на отчет свысока.

Оконные функции — это совершенно другой подход. Вы говорите: "Я хочу увидеть ВСЕХ сотрудников списком, но в дополнение к их имени и зарплате, посчитай и покажи рядом в отдельном столбце среднюю зарплату по их отделу". В результате вы получаете полный список всех сотрудников, и у каждого в строке есть его личные данные плюс новый столбец с аналитикой. Вы не теряете ни одной детали, но при этом получаете сводную информацию.

GROUP BY уменьшает количество строк в результате, оставляя только группы.

Оконные функции сохраняют все строки, но добавляют к ним новые вычисляемые поля.

Функции агрегации оконных выражений

1. Агрегирующие функции

Выполняют стандартные агрегатные операции, но в рамках окна.

  • SUM() - Сумма значений.

  • AVG() - Среднее арифметическое.

  • COUNT() - Количество строк.

  • MIN() - Минимальное значение.

  • MAX() - Максимальное значение.

2. Функции ранжирования

Присваивают порядковый номер или ранг строке в рамках её раздела.

  • ROW_NUMBER() - Присваивает уникальный номер каждой строке.

  • RANK() - Присваивает ранг с пропусками (при одинаковых значениях ранг совпадает, а следующий пропускается).

  • DENSE_RANK() - Присваивает ранг без пропусков.

  • NTILE(n) - Разбивает строки на n примерно равных групп (бакетов).

3. Функции смещения (доступа к соседним строкам)

Позволяют обращаться к данным из других строк в том же окне.

  • LAG(column, offset) - Возвращает значение из строки, находящейся на offset строк назад.

  • LEAD(column, offset) - Возвращает значение из строки, находящейся на offset строк вперёд.

  • FIRST_VALUE(column) - Возвращает первое значение в окне.

  • LAST_VALUE(column) - Возвращает последнее значение в окне.

4. Аналитические функции

Выполняют статистический анализ.

  • CUME_DIST() - Вычисляет cumulative distribution (относительное положение) значения.

  • PERCENT_RANK() - Вычисляет относительный ранг строки в рамках окна.

Что такое CTE?

CTE (Common Table Expression) — это временный именованный результат запроса, который существует только в течение выполнения основного запроса.

Основные характеристики CTE:

  • Временность: Результат CTE не сохраняется в базе данных и доступен только для одного последующего оператора SELECT, INSERT, UPDATE, DELETE или MERGE.

  • Улучшение читаемости: Позволяет разбивать сложные запросы на более простые и понятные логические блоки.

  • Рекурсия: Поддерживает рекурсивные запросы (с помощью WITH RECURSIVE), что полезно для работы с иерархическими данными (например, деревьями).

  • Синтаксис: Определяется с помощью ключевого слова WITH.

Простая структура:

WITH название_cte AS ( Здесь ваш подзапрос SELECT ... ) Основной запрос, использующий CTE SELECT * FROM название_cte;

На практике SQL проверяют не на «знаешь/не знаешь», а на глубину понимания. Именно такие вопросы часто отличают кандидатов, которые просто писали запросы, от тех, кто понимает, как они работают.

Если хотите прокачать именно это понимание — разбирайте не только «как написать», но и «как выполнится».

Периодически делюсь такими разборами и опытом собеседований в Telegram

Комментарии (4)


  1. Qulisun
    22.04.2026 10:59

    Спасибо. Может небольшое уточнение только. В статье написано:

    HAVING — Обязательно использует агрегатные функции

    Это не совсем так, HAVING может фильтровать и по столбцам из GROUP BY без агрегатов:

    SELECT department, COUNT(*)
    FROM employees
    GROUP BY department
    HAVING department <> 'HR';


    1. natalia_ostapenko Автор
      22.04.2026 10:59

      Отлично подмечено, спасибо


    1. Xander_d
      22.04.2026 10:59

      А разве COUNT не агрегатная функция?..


  1. Ninil
    22.04.2026 10:59

    Зачем это на Хабре? Это ж пересказ документации просто.