Альянс за открытые медиа (AOMedia) выпустит спецификацию открытого видеокодека AV2 до конца года в качестве обновления ныне широко используемого видеокодека AV1 с сокращением пропускной способности до 40% при том же уровне качества.
Тем временем Дебаргха Мукерджи, ведущий инженер Google, поделился отчетом о прогрессе AV2, сначала предложив историческую перспективу со списком цифровых видеокодеков с 1990 по 2030 год (ожидается), затем обозначив цели AV2 и рассмотрев требования, инструменты кодирования и достигнутые на данный момент результаты. Одиннадцатиминутное выступление (04:27 – 15:30) доступно в конце этой статьи, либо можно продолжить чтение для ознакомления с ключевыми моментами доклада.
AV2 будет выпущен очень скоро, в то время как проприетарный видеокодек H.267 может быть выпущен только около 2030 года. Поддержка для H.266 пока не получила широкого распространения, поэтому остается открытым вопрос, увидит ли H.267 свет.
Разработка AV2 началась в 2020 году с целями достижения на 40% меньшей пропускной способности по сравнению с AV1 и сохранения сложности/площади декодера в контролируемых пределах (не более чем в 2 раза выше AV1) для поддержания конкурентоспособной цены аппаратного декодера. Инструменты и исходный код эталонной реализации AV2 полностью размещены на GitLab .
Далее Дебаргха рассматривает ключевые особенности AV2. Во-первых, становится ясно, что AV2 не является ИИ-кодеком, хотя он использует некоторые инструменты на основе данных, поэтому он называет его «традиционным гибридным кодеком». Затем перечисляются различные достижения в области внутри- и межкадрового сжатия, преобразований, фильтров и т.д. Много технических терминов, которые сложно понять без знакомства с последними достижениями в обработке изображений/видео…
AV2 обеспечивает «эффективную с точки зрения аппаратного обеспечения конструкцию», что, вероятно, означает, что AV2 все еще значительно сложнее AV1 и требует больше ресурсов, но были приложены усилия для минимизации увеличения требований к пропускной способности, оперативной памяти и хранилищу. AV2 значительно улучшает кодирование без потерь и синтез зернистости пленки по сравнению с AV1, а также добавляет поддержку форматов цветности (YUV) 4:2:2 и 4:4:4 в дополнение к существующему формату 4:2:0.
Заключительная часть презентации охватывает производительность AV2. Так достигнуты ли поставленные цели? Первый слайд показывает результаты объективных метрик с использованием автоматизированных инструментов. Дебаргха поясняет, что строка RA (Random Access) является наиболее важной, и здесь AV2 демонстрирует примерно на 30% меньший требуемый битрейт по сравнению с улучшенной реализацией AV1. Стандарт PSNR (Peak Signal-to-Noise Ratio) и VMAF (Video Multimethod Assessment Fusion) — это алгоритм оценки качества видео, разработанный Netflix.
Финальный слайд показывает субъективные метрики производительности AV2. Подобные тесты для сжатия изображений проводились во время стажировки в Университете Бата, когда люди за компьютером с двумя идентичными дисплеями сравнивали бок обок сжатые с разными параметрами фотографии и выбирали наиболее качественные. Google провел аналогичный эксперимент с видео AV2 и (модифицированным) AV1 в формате 4K UHD и обнаружил, что в среднем (столбец BD-rate) AV2 требовалось на 38% меньше битов, чем улучшенной версии AV1, при одинаковом воспринимаемом качестве. Для одного образца (DrivingPOV3) значение BD-rate даже опустилось до -50.63%.
Видеозапись вебинара AOMedia «Будущее инноваций открыто» приведена ниже. Полное видео длится 1 час 22 минуты, но презентация по AV2 занимает всего 11 минут.
Выражаем свою благодарность источнику, с которого взята и переведена статья, сайту cnx-software.com.
Оригинал статьи вы можете прочитать здесь.






