Запись видео UI автотестов, работающих в headless Chrome / forpes.ru

Главная
Запись видео UI автотестов, работающих в headless Chrome

Запись видео UI автотестов, работающих в headless Chrome +17

23.05.2020 18:08

IvanFilippov 10 2400 Источник

Всем привет!

В данной статье хочется рассказать о том, как была решена задача записи видео автотестов, работающих в headless Chrome (с записью в не headless режиме проблем быть не должно). Будет рассмотрено несколько разных подходов, рассказано про трудности и пути их решения.

Постановка задачи

Тесты выполняются под Windows
Тесты используют Selenium Web Driver + Headless Chrome
Тесты запускаются в несколько потоков

Для упавших тестов нужно сохранить видео, при этом

Время выполнения должно вырасти не более чем на 10%.
Обойтись минимумом изменений в текущей имплементации

Если интересно решение, добро пожаловать под кат.

Наивный подход. Cкриншоты

В нашем тестовом фреймворке есть низкоуровневая обертка над Selenium. Поэтому первая имплементация была очень простой и крайне наивной: во все места, изменяющие страницу (Click, Set textbox, Navigate и т.п.) был добавлен код, сохраняющий скриншот экрана через Selenium Web Driver

Driver.TakeScreenshot().SaveAsFile(screenshotPath);

Время выполнения тестов с таким подходом выросло в разы. Причина: операция сохранения скриншота работает совсем не быстро — от 0.5 секунды до нескольких секунд.

Cкриншоты в отдельном потоке

Вместо кода, сохраняющего скриншоты во всех местах, изменяющих страницу (Click, Set textbox, Navigate) был добавлен код, постоянно сохраняющий скриншоты в отдельном потоке

Скрытый текст

...
var timeTillNextFrame = TimeSpan.Zero;
while (!_stopThread.WaitOne(timeTillNextFrame))
{
    var screenShotDriver = Driver as ITakesScreenshot;
    if (screenShotDriver == null)
    {
        continue;
    }

    var screenShot = screenShotDriver.GetScreenshot();
    ...
}

Время выполнения тестов, по-прежнему, было очень долгим. С причиной задержки я не стал разбираться. Скорее всего Selenium отказывается что-то делать, пока идет сохранение скриншота. Возможно, помог бы еще один инстанс Selenium, законнекченный к той же сессии.

Cкриншоты в отдельном потоке через Puppeteer

Делать два инстанса Selenium было не очень интересно, так как я давно хотел попробовать puppeteer-sharp в деле — а тут нашлась подходящая причина. Сбоку от Selenium был создан Puppeteer, который просто приконнектился к Chrome, уже созданному через Selenium

Скрытый текст

var options = new ConnectOptions()
{
    BrowserURL = $"http://127.0.0.1:{debugPort}"
};

_puppeteerBrowser = Puppeteer.ConnectAsync(options).GetAwaiter().GetResult();

Тест пошел своей дорожкой через Selenium, а скриншотами в отдельном потоке занялся Puppeteer

Скрытый текст

...
var timeTillNextFrame = TimeSpan.Zero;
while (!_stopThread.WaitOne(timeTillNextFrame))
{
    var pages = _puppeteerBrowser.PagesAsync().GetAwaiter().GetResult();
    if (pages.Length <= 0)
    {
        continue;
    }
    
    var page = pages[0];
    
    page.SetViewportAsync(new ViewPortOptions
    {
        Width = screenWidth,
        Height = screenHeight
    }).GetAwaiter().GetResult();
    
    var screen = page.ScreenshotStreamAsync().GetAwaiter().GetResult();
    ...
}

Эта имплементация дала обнадеживающие результаты, время выполнения увеличилось на допустимые 10%.

Минусы

Время сохранения скриншотов через Puppeteer не мгновенное, часть фреймов будет потеряна, а в них может оказаться, что-то интересное для разбора.
Если Selenium переключает табы, нужно уведомить Puppeteer, иначе он будет скриншотить только первый таб в коде выше (возможно, есть способ найти активный таб — надо смотреть).

Первый минус для меня оказался блокирующим, поэтому переходим к следующему решению.

Screencast

В Chrome есть интересная фишка — Page.startScreencast. По описанию — она как раз делает то, что надо — кастит измененные фреймы, чтобы желающие могли их перехватить и что-нибудь интересное с ними сделать.

И в Selenium, и в Puppeteer можно стартовать Page.startScreencast, но добавить обработчики нельзя ни в одном, ни в другом. Хотелка такая уже озвучена — ждем имплементацию.

Я попробовал подружиться с библиотечкой ChromeDevTools. К сожалению, быстро наладить хорошие отношения у меня с ней не получилось. После дальнейших поисков было найдено решение для ScreenCast в mafredri/cdp Из исходного примера была убрана ненужная навигация и были добавлены необходимые входные параметры:

Скрытый текст

package main

import (
    "os"
    "context"
    "fmt"
    "io/ioutil"
    "log"
    "time"
    "flag"

    "github.com/mafredri/cdp"
    "github.com/mafredri/cdp/devtool"
    "github.com/mafredri/cdp/protocol/page"
    "github.com/mafredri/cdp/rpcc"
)

func main() {

    folderPtr := flag.String("folder", "", "folder path for screenshots: example c:\\temp\\screens\\")
    chromePtr := flag.String("chrome", "http://localhost:9222", "chrome connection - example: http://localhost:9222")
    
    widthPtr := flag.Int("width", 1280, "screencast width")
    heightPtr := flag.Int("height", 720, "screencast height")
    qualityPtr := flag.Int("quality", 100, "screencast quality")
    
    flag.Parse()

    if err := run(*folderPtr, *chromePtr, *widthPtr, *heightPtr, *qualityPtr); err != nil {
        panic(err)
    }
}

func run(folder string, chromeConnection string, width int, height int, quality int) error {
    ctx, cancel := context.WithCancel(context.TODO())
    defer cancel()
    
    chromePath := chromeConnection
    folderPath := folder

    devt := devtool.New(chromePath)

    pageTarget, err := devt.Get(ctx, devtool.Page)
    if err != nil {
        return err
    }

    conn, err := rpcc.DialContext(ctx, pageTarget.WebSocketDebuggerURL)
    if err != nil {
        return err
    }
    defer conn.Close()

    c := cdp.NewClient(conn)

    err = c.Page.Enable(ctx)
    if err != nil {
        return err
    }

    // Start listening to ScreencastFrame events.
    screencastFrame, err := c.Page.ScreencastFrame(ctx)
    if err != nil {
        return err
    }

    go func() {
        defer screencastFrame.Close()

        for {
            ev, err := screencastFrame.Recv()
            if err != nil {
                log.Printf("Failed to receive ScreencastFrame: %v", err)
                os.Exit(0)
            }
            log.Printf("Got frame with sessionID: %d: %+v", ev.SessionID, ev.Metadata)

            err = c.Page.ScreencastFrameAck(ctx, page.NewScreencastFrameAckArgs(ev.SessionID))
            if err != nil {
                log.Printf("Failed to ack ScreencastFrame: %v", err)
                os.Exit(0)
            }

            // Write to screencast_frame-[timestamp].png.
            name := fmt.Sprintf("screencast_frame-%d.png", ev.Metadata.Timestamp.Time().Unix())
            
            filePath := folderPath + name

            // Write the frame to file (without blocking).
            go func() {
                err = ioutil.WriteFile(filePath, ev.Data, 0644)
                if err != nil {
                    log.Printf("Failed to write ScreencastFrame to %q: %v", name, err)
                }
            }()
        }
    }()

    screencastArgs := page.NewStartScreencastArgs().
        SetQuality(quality).
        SetMaxWidth(width).
        SetMaxHeight(height).
        SetEveryNthFrame(1).
        SetFormat("png")
    err = c.Page.StartScreencast(ctx, screencastArgs)
    if err != nil {
        return err
    }

    // Random delay for our screencast.
    time.Sleep(600 * time.Second)

    err = c.Page.StopScreencast(ctx)
    if err != nil {
        return err
    }

    return nil
}

Далее данный файлик был собран командой:

go build -o screencast.exe main.go

И я смог использовать его в C# solution с тестами:

Скрытый текст

var startInfo = new ProcessStartInfo(screenCastPath)
{
    WindowStyle = ProcessWindowStyle.Minimized,

    Arguments = $"-folder={_framesFolderPath} " +
                $"-chrome=http://localhost:{_debugPort} " +
                "-width=1024 " +
                "-height=576 " +
                "-quality=0"
};

Process.Start(startInfo);

Отдельный поток для записи скриншотов был выкинут за ненадобностью. Алогритм работы получился таким:

Стартуем Chrome через Selenium
Стартуем Screencast через собранный бинарник — он коннектится к Chrome и начинает сохранять поток фреймов в указанную нами папку
По окончании теста закрываем Chrome — автоматом закрывается бинарник
Если тест упал — создаем видео
Зачищаем папку с фреймами

Данный подход дал лучший результат по времени выполнения (задержек практически нет). Плюс он обеспечил максимум информации по тесту (потерянных фреймов практически нет).

Минусы

1. Невысокое разрешение для screencast. Если запустить тесты в пару потоков и выставить разрешение 2560*1440 для Chrome — то произойдет переполнение буфера, отведенного под передачу данных.

2. C ростом разрешения, возрастает нагрузка на CPU.

В итоге, под screencast я выбрал разрешение 1024*576 — на таком разрешение тесты отработали нормально в 6 потоков, процессор работал в комфортном режиме (6-ти ядерник i7-5820).

Собираем видео

Осталось собрать фреймы в видео. Для этого я использовал библиотечку SharpAvi

Скрытый текст

private void GenerateVideoFromScreens(string videoPath)
{
    try
    {
        var videoWriter = new AviWriter(videoPath) { FramesPerSecond = 1, EmitIndex1 = true };

        var videoStream = videoWriter.AddMotionJpegVideoStream(1024, 576);

        var screens = new DirectoryInfo(_framesFolderPath).GetFiles().OrderBy(f => f.CreationTimeUtc.Ticks).ToList();
        foreach (var screen in screens)
        {
            try
            {
                using (var bmp = new Bitmap(screen.FullName))
                {
                    var bits = bmp.LockBits(new Rectangle(0, 0, videoStream.Width, videoStream.Height), ImageLockMode.ReadOnly, PixelFormat.Format32bppRgb);
                    var videoFrame = new byte[videoStream.Width * videoStream.Height * 4];
                    Marshal.Copy(bits.Scan0, videoFrame, 0, videoFrame.Length);
                    bmp.UnlockBits(bits);

                    videoStream.WriteFrameAsync(
                        true,
                        videoFrame,
                        0,
                        videoFrame.Length).GetAwaiter().GetResult();
                }
            }
            catch(Exception ex)
            {
                // ignore all video related errors per frame
            }
        }

        videoWriter.Close();
    }
    catch
    {
        // ignore all video related errors per streams
    }
}

Upscale картинок

Так как разрешение screencast совсем небольшое 1024*576, нужно выставить и небольшое разрешение самому Chrome, иначе будут проблемы с мелким текстом.

Chrome 2560*1440 -> screencast в 1024*576 = мелкий текст практически нечитаем
Chrome 1920*1080 -> screencast в 1024*576 = мелкий текст читается с трудом
Chrome 1408*792 -> screencast в 1024*576 = мелкий текст читается без проблем

Полученное видео 1024*576 можно улучшить — если фреймы заапскейлить до 1920*1080 с помощью библиотечки PhotoSauce

Скрытый текст

public Bitmap ResizeImage(Bitmap bitmap, int width)
{
	using (var inStream = new MemoryStream())
	{
		bitmap.Save(inStream, ImageFormat.Png);
		inStream.Position = 0;
		using (MemoryStream outStream = new MemoryStream())
		{
			var settings = new ProcessImageSettings { Width = width };
			MagicImageProcessor.ProcessImage(inStream, outStream, settings);
			return new Bitmap(outStream);
		}
	}
}

В итоге получились такие параметры: Chrome работает в 1408*792, ScreenCast в 1024*576, итоговое видео для просмотра апскейлится до 1920*1080. По ссылке можно посмотреть пример финального результата.

Спасибо

Спасибо, всем кто дочитал — если есть более простое решение исходной задачки, напишите, пожалуйста, в комментарии. Так же принимается любая критика, в том числе злобная по написанному выше.

Всем здоровья и скорейшего окончания ковидных ограничений!

Комментарии (10)

dikkini
23.05.2020 23:17
#21651606
сколько времени в человеко-часах заняла поиск оптимальноо решения и реализация от начала работы до финального результата?

IvanFilippov Автор
23.05.2020 23:31
#21651644
Привет! По времени получилось порядка 20 часов — с разработкой и экспериментами.
1. dikkini
  24.05.2020 00:32
  #21651818
  В рабочее время или ночь?
  1. IvanFilippov Автор
    24.05.2020 00:47
    #21651862
    По разному получилось — сначала поисследовал вечерами в нерабочее время (благо сейчас самоизоляция). Когда понял, что реально сделать, поговорил с ребятами и доделал уже в рабочее время.

amakhrov
25.05.2020 02:13
#21655108
+1
Cypress тоже записывает видео упавших тестов. Насколько я понял, тоже через Хромовый ScreencastFrame: https://github.com/cypress-io/cypress/blob/f5284c66050690b7d768e241dd5177cf5553c5b7/packages/server/lib/modes/run.js#L503

Им проще — они напрямую работают с браузером, без прослойки в виде puppeteer / webdriver
1. IvanFilippov Автор
  25.05.2020 10:30
  #21655816
  спасибо!

Ytugator
25.05.2020 13:13
#21656520
+1
А зачем так сложно, если есть Selenoid?
Он может просто писать видеопоток из коробки. Дальше если хочется можно отрезать его в духе за 10 секунд до падения или по каким-то иным триггерам и уже отправлять куда-то где его будут смотреть.
1. IvanFilippov Автор
  25.05.2020 13:48
  #21656694
  Спасибо, за ответ. У нас есть нюанс — перейти на запуск тестов в контейнерах проблематично, так как для нашего софта, требуется установленный Windows клиент. Этим клиентом мы управляем через Microsoft UI Automation. Прошлый раз, когда я поверял — Microsoft UI Automation отказывался корректно работать в windows контейнере.
  
  Отправляется видео у нас в Allure. Про отрезать «за 10 секунд до падения» — отличная идея.
  1. ProBr
    26.05.2020 14:58
    #21661362
    +1
    Тесты могут жить на windows, а Selenoid на отдельной машине с Linux, на которой запускаются контейнеры с браузером.
    
    IvanFilippov Автор
    26.05.2020 15:21
    #21661494
    Спасибо за ответ. У нас браузер должен жить рядом с клиентским приложением на одной машинке (клиент = связка браузера и клиентского приложения). Разнести их не получится.
    
    Решения в которых есть готовая, проверенная, стабильно работающая функциональность из коробки — безусловно лучше собственных костылей с одной стороны. С другой стороны — мы стараемся максимально ограничить как количество сторонних компонент, так и нашу инфраструктуру CI.
    
    То есть, если от решения X нам требуется 0.1% функциональности, которую мы можем сделать самим и избежать зависимости — то стараемся делать сами)

Запись видео UI автотестов, работающих в headless Chrome +17

Наивный подход. Cкриншоты

Cкриншоты в отдельном потоке

Cкриншоты в отдельном потоке через Puppeteer

Screencast

Собираем видео

Upscale картинок

Спасибо

Комментарии (10)

dikkini

IvanFilippov Автор

dikkini

IvanFilippov Автор

amakhrov

IvanFilippov Автор

Ytugator

IvanFilippov Автор

ProBr

IvanFilippov Автор