ITU-T P.863-2018 Перцептивное объективное прогнозирование качества прослушивания (Исследовательская группа 12) - Стандарты и спецификации PDF

ITU-T P.863-2018
Перцептивное объективное прогнозирование качества прослушивания (Исследовательская группа 12)

Стандартный №
ITU-T P.863-2018
Дата публикации
2018
Разместил
ITU-T - International Telecommunication Union/ITU Telcommunication Sector
сфера применения
В настоящей Рекомендации1 определен единый алгоритм для оценки качества речи в существующих и ближайших системах телефонии, в которых используется широкий спектр технологий кодирования, транспорта и улучшения речи. На основе результатов эталонных тестов, представленных в рамках исследований МСЭ-Т@, обзор технологий и приложений кодирования тестовых факторов@, к которым применяется настоящая Рекомендация, приведен в таблицах 1–4. В таблице 1 представлены факторы и приложения, включенные в техническое задание и которые использовались на этапе выбора алгоритма ITU-T P.863. Следует отметить, что производительность алгоритма ITU-T P.863 при каждом отдельном условии в Таблице 1 не отражена в этой таблице. В таблице 2 представлен список условий, при которых данная Рекомендация не предназначена для использования. В таблице 3 представлены тестовые переменные, для которых необходимо дальнейшее исследование@ или в отношении которых согласно ITU-T P.863 заявлено о предоставлении неточных прогнозов при использовании в сочетании с ними. Наконец, в Таблице 4 перечислены факторы, технологии и приложения, для которых алгоритм ITU-T P.863 в настоящее время не прошел валидацию. Обратите внимание, что алгоритм ITU-T P.863 не может использоваться для замены субъективного тестирования. Следует также отметить, что алгоритм ITU-T P.863 не обеспечивает комплексную оценку качества передачи. Он измеряет только влияние односторонних искажений речи и шума на качество речи. Эффекты задержки@ самопрослушивания@ эха@ и других ухудшений, связанных с двусторонним взаимодействием (например, центральное ограничение), не отражаются в оценках ITU-T P.863. Поэтому@ можно иметь высокие оценки по ITU-T P.863@, но при этом низкое общее качество разговора. Следует отметить, что ITU-T P.863 более нечувствителен к очень низким уровням шума в полнополосном режиме, чем в узкополосном режиме. Тестовый набор ITU-T P.863 охватывает следующие языки: Американский английский@ Британский английский@ Китайский (мандаринский диалект)@ Чешский@ Голландский@ Французский@ Немецкий@ Итальянский@ Японский@ Шведский@ Швейцарский немецкий. Субъективные эксперименты проводились в лабораториях субъективных испытаний, расположенных в соответствующих странах. ITU-T P.863 — это технология тестирования качества голосовой связи нового поколения для фиксированных, мобильных и IP-сетей. ITU-T P.863 был выбран в качестве нового стандарта тестирования качества голосовой связи ITU-T. Данная Рекомендация была разработана в период с 2006 по 2010 год в рамках конкурса, проведенного МСЭ-Т@ с целью определения обновления технологии для [b-ITU-T P.862]. Целью целевой модели ITU-T P.863 является прогнозирование общего качества прослушиваемой речи для узкополосных (от 300 до 3 400 Гц) @ широкополосных (50–7 000 Гц) @ сверхширокополосных (от 50 до 14 000 Гц) и полнополосных частот. (от 20 до 20 000 Гц) сценарии электросвязи, как их воспринимает пользователь. Сюда входят все компоненты обработки речи, обычно используемые для телекоммуникаций в чистых и шумных условиях. Термин «качество речи при прослушивании» означает общее качество речи, воспринимаемое и оцениваемое людьми в эксперименте по оценке абсолютной категории в соответствии с [ITU-T P.800] или [ITU-T P.830]. В полнополосном режиме оценки ITU-T P.863 прогнозируются по полнополосной шкале MOS ACR; Подробная информация о планировании эксперимента представлена в Приложении II. В узкополосном режиме @ оценки ITU-T P.863 прогнозируются по узкополосной шкале MOS ACR. Выходные данные модели в двух режимах называются MOS-LQOn и MOS-LQOf. Как и в случае с [b-ITU-T P.861] и [b-ITU-T P.862]@, подход МСЭ-Т P.863 называется «полным эталонным» или «двусторонним»@, что означает что прогнозирование качества основано на сравнении неискаженного опорного сигнала и принятого сигнала, подлежащего оценке. ITU-T P.863 может применяться к сигналам, записанным на электрическом интерфейсе (как это было в случае с [b-ITU-T P.862]), а также к сигналам ?C в полнополосном режиме работы, записанным с использованием симулятор искусственного уха. Другие технологии или компоненты@, такие как форматы хранения речи@ или нетелефонные приложения@, такие как сети общественной безопасности или профессиональные мобильные радиосвязи@, не участвовали в конкурсе и критериях отбора. Режимы работы ITU-T P.863 Важно понимать и учитывать два различных режима работы, поддерживаемые ITU-T P.863: ? полнополосный @ и ? узкополосный. В таблице 5 обобщены применимости режимов работы ITU-T P.863 к различным сценариям электросвязи. Основное различие между обоими режимами заключается в полосе пропускания опорного речевого сигнала, используемого моделью, а также в диапазоне частот, в котором будут обнаруживаться искажения. В полнополосном режиме принятый (и потенциально ухудшенный) речевой сигнал сравнивается с полнополосным эталонным сигналом. Следовательно, ограничения полосы частот рассматриваются как ухудшение качества и оцениваются соответствующим образом. Качество прослушивания моделируется так, как оно воспринимается слушателем-человеком с использованием наушников с выравниванием диффузного поля и диотической презентацией (одинаковый сигнал на обеих чашках наушников). В прогнозировании используется полнополосная шкала качества прослушивания, где алгоритм ITU-T P.863 достигает насыщения при MOS-LQOf = 4,8 для прозрачного полнополосного сигнала. Полнополосные сигналы оценивались в тесте «только прослушивание» ITU-T P.800 ACR на этапе оценки ITU-T P.863. Напротив, в узкополосном режиме принятый (и потенциально ухудшенный) речевой сигнал сравнивается с узкополосным (от 300 до 3400 Гц) эталонным. Следовательно@ обычные ограничения полосы пропускания телефонной связи не считаются серьезным ухудшением качества и оцениваются меньше. Этот узкополосный режим сохраняет совместимость с ранее разработанными моделями, такими как [b-ITU-T P.862] в сочетании с [b-ITU-T P.862.1]. Качество прослушивания моделируется так, как оно воспринимается слушателем-человеком, использующим слабосвязанную трубку типа IRS на одном ухе (монотичное представление). В прогнозировании используется обычная узкополосная шкала качества прослушивания, где алгоритм ITU-T P.863 достигает насыщения при MOS-LQOn = 4,5 для прозрачного узкополосного сигнала. ПРИМЕЧАНИЕ 1 ?C Для двух режимов работы оценки качества получаются по двум различным шкалам@, а именно по традиционной шкале для узкополосного режима и по шкале, ориентированной на будущее, для полнополосного режима. ПРИМЕЧАНИЕ 2 ?C Акустические записи@, а также влияние уровня представления@ можно прогнозировать только в полнополосном рабочем режиме. Узкополосный рабочий режим ограничен электрической записью и номинальным представлением для совместимости с [b-ITU-T P.862] в сочетании с областями применения [b-ITU-T P.862.1]. ПРИМЕЧАНИЕ 3. В целях обратной совместимости сверхширокополосные эталонные файлы также могут использоваться в полнополосном режиме. Разница между сверхширокополосным и полнополосным сигналом слишком мала, чтобы ее можно было идентифицировать в типичном тесте ACR, поэтому ITU-T P.863 оценивает их как эквивалентные. Однако будут учитываться искажения в диапазоне частот между сверхширокополосным и полнополосным измерениями, которые могут привести к значительным различиям между обычными сверхширокополосными и полнополосными измерениями. Если ухудшенный сигнал также имеет полосу пропускания, ограниченную сверхширокополосным диапазоном, результаты P.863 Ed. 3 и стр.863 Изд. 2.0 будет эквивалентным. 1 Данная Рекомендация включает электронное приложение, содержащее подробные описания в формате pdf (см. Приложение B) и данные испытаний на соответствие (см. Приложение A).



© 2023. Все права защищены.