IEC TS 63499:2024 — это техническая спецификация, разработанная Международной электротехнической комиссией (МЭК), которая содержит рекомендации по кодированию видео для Interoperable Master Format (IMF) Application 6. Опубликованный в феврале 2024 года, этот стандарт является продуктом TA 6, подкомитета в составе Технического комитета МЭК TC 100, сосредоточенного на носителях данных, структурах данных и системном оборудовании.
В связи с быстрым ростом контента телевидения сверхвысокой четкости (UHDTV) вещатели сталкиваются с двойной проблемой времени обработки и емкости хранилища. IMF Application 6 (SMPTE ST 2067-60) предназначен для решения этих проблем, оптимизируя рабочий процесс файлов мастер-программ с помощью операций на основе файлов. Например, если на поздних этапах производства требуется редактирование и внесение правок, рендеринг и контроль качества можно выполнять только для измененных кадров, избегая повторной обработки всего фильма и значительно повышая эффективность.
Interoperable Master Format — это основанная на файлах структура компонентов рабочего процесса, используемая для предоставления взаимозаменяемых окончательных мастер-файлов. Основные компоненты IMF включают:
| Название компонента | Описание функции | Технические характеристики |
|---|---|---|
| Файл дорожки изображения | Сохраняет данные кодирования видео в упаковке кадров | Формат MXF OP1a |
| Список воспроизведения композиции (CPL) | Указывает на каждый файл элемента и содержит метаданные, связанные с временной шкалой | SMPTE ST 2067-2 |
| Карта активов | Предоставляет информацию о местоположении всех необходимых файлов | SMPTE ST 2067-3 |
| Список упаковки (PKL) | Содержит список всех файлов в IMP | SMPTE ST 2067-4 |
Основные преимущества IMF заключаются в управлении файлами и емкости хранилища. Как показано на рисунке 3, когда программа имеет несколько версий (например, звуковые дорожки на разных языках), но один и тот же видеоконтент, традиционные методы требуют создания полных файлов по отдельности. Однако подход IMF может значительно сэкономить место на диске, включая общие элементы в один пакет.
Глава 5 стандарта подробно описывает ограничения кодирования AVC/H.264 в приложениях IMF6. Эти ограничения разработаны для обеспечения быстрого доступа к целевым изображениям и снижения сложности декодера.
Согласно рекомендациям SMPTE ST 381-3 Annex C, потоки Long GOP должны соответствовать следующим ограничениям:
Эти ограничения делают структуру GOP эквивалентной MPEG-2 (за исключением Br-кадров), поэтому методы декодирования и редактирования с переменной скоростью, разработанные для MPEG-2, могут быть применены к AVC/H.264 видеопотоки.
Набор параметров последовательности (SPS) и набор параметров изображения (PPS) содержат ключевую информацию, необходимую для декодирования сжатых потоков AVC/H.264. Стандарт предусматривает три схемы реализации:
| Схема конфигурации | Технические характеристики | Применимые сценарии | Анализ преимуществ и недостатков |
|---|---|---|---|
| Начальная позиция каждого кадра | SPS/PPS размещается в начале блока доступа каждого изображения | Сценарии с частым редактированием видео | Простое редактирование, но избыточность параметров |
| Начальная позиция каждой группы изображений | SPS/PPS размещается в блоке доступа начального I-кадра каждой группы изображений | Декодирование длинного потока GOP | Высокая эффективность декодирования, поддержка редактирования на уровне GOP |
| Начальная позиция потока | SPS/PPS размещаются только в блоке доступа в начале потока | Последовательности параметров постоянны | Легко кодируется, но требует дополнительной обработки во время редактирования |
SMPTE ST 381-3 определяет элементы метаданных в поддескрипторе AVC в метаданных заголовка MXF для идентификации реализации SPS и PPS в потоках AVC/H.264. Декодеры могут идентифицировать конфигурацию набора параметров, ссылаясь на эти элементы метаданных.
Многослойное кодирование делит изображение на несколько слайсов для кодирования, что важно для достижения высокоскоростного декодирования видео на многоядерных процессорах. Стандарт рекомендует использовать от 4 до 16 слайсов для изображений UHDTV.
Поскольку процесс декодирования для каждого слайса по существу независим (за исключением деблокирующей фильтрации), его можно выполнять параллельно. Распространенность многоядерных процессоров в современных компьютерах обеспечивает высокую производительность как аппаратного, так и программного обеспечения за счет параллельной обработки.
Многослойное кодирование также представляет сложности: необходимо координировать обработку каждого слайса, чтобы определить оптимальный коэффициент сжатия. Сжатие видео использует избыточность движущихся изображений, но эта избыточность может значительно варьироваться в зависимости от содержимого изображения и даже демонстрировать экстремальные пространственные отклонения в пределах одного изображения.
При кодировании нескольких срезов избыточность изображения, содержащаяся в каждом срезе, может значительно варьироваться. Вообще говоря, когда избыточность изображения высока, ухудшение качества изображения не заметно, даже если более высокая степень сжатия уменьшает объем данных. Однако, когда избыточность низкая, ухудшение качества изображения может быть заметным, если не использовать более низкую степень сжатия для увеличения объема данных.
Следовательно, при кодировании нескольких срезов объем сжатых данных должен быть адаптивно распределен для каждого среза. Если этот процесс адаптивного распределения затруднен, может произойти локализованное ухудшение качества изображения. Адаптивное распределение в пределах одного среза может быть выполнено как серия процессов, что дает преимущества в управлении качеством изображения.
В таблице 1 стандарта перечислены типы блоков NAL, относящиеся к элементарным потокам видео, указанным в ISO/IEC 14496-10. Для реализации End_of_Sequence и End_of_stream необходимо отметить, что если конечная точка изменяется во время редактирования потока, эти данные необходимо сгенерировать заново.
В блоке SEI NAL может быть записана информация об атрибутах потока AVC/H.264, такая как незарегистрированные пользовательские данные, указанные отдельными пользователями. Однако, если эти данные записываются только в блок SEI NAL, эта информация не может быть извлечена, пока не будут декодированы все потоки AVC/H.264.
Стандарт рекомендует помещать информацию об атрибутах (такую как информация о дате и времени съемки) в метаданные MXF вместо записи ее в блок SEI NAL. Это может снизить нагрузку на устройства воспроизведения и приложения редактирования, а также улучшить оперативность реагирования.
На основе технических требований IEC TS 63499:2024 вещательным компаниям предоставляются следующие рекомендации по внедрению:
При проектировании и внедрении рабочих процессов IMF Application 6 следует учитывать общую архитектуру системы. Такие факторы, как система хранения файлов, пропускная способность сети и производительность узла обработки, должны быть согласованы с выбором параметров кодирования.
Учитывая характеристики контента UHDTV, рекомендуется использовать профиль High 4:2:2 для формата изображения 3840×2160. При выборе количества срезов следует соблюдать баланс между преимуществами параллельной обработки и требованиями к контролю качества изображения. Обычно рекомендуется 8-12 фрагментов.
Создайте комплексную стратегию управления метаданными, храня технические метаданные и описательные метаданные в соответствующих местах. Технические параметры должны храниться в SPS/PPS, а производственные метаданные — в заголовке MXF.
Создание процесса контроля качества на основе IMF с использованием гибкости CPL для реализации частичного рендеринга и проверки качества значительно повышает эффективность изменений на этапе постобработки, обеспечивая при этом согласованность между разными версиями.
Стандарт IEC TS 63499:2024 представляет собой значительный шаг вперед в стандартизации рабочих процессов вещания. Благодаря постоянному развитию технологий возможна дальнейшая эволюция в следующих областях:
Во-первых, достижения в технологии кодирования могут поддерживать более эффективные стандарты кодирования видео, такие как HEVC/H.265 или VVC/H.266, что позволит еще больше снизить битрейт при сохранении того же визуального качества.
Во-вторых, развитие облачных вычислений и периферийных вычислений откроет новые возможности для рабочих процессов IMF, а распределенная обработка и хранение еще больше повысят эффективность рабочих процессов.
Наконец, применение технологий искусственного интеллекта и машинного обучения оптимизирует процессы выбора параметров кодирования и контроля качества, обеспечивая более интеллектуальные рабочие процессы производства контента.
Следуя рекомендациям IEC TS 63499:2024, вещательные компании смогут создавать эффективные стандартизированные рабочие процессы и лучше решать технические проблемы эпохи UHD.

© 2025. Все права защищены.