| Технические параметры | Требования ISO/IEC 30122-2 | Сравнение отраслевых практик |
|---|---|---|
| Проектирование произношения | Требуется Международный фонетический алфавит (IPA) или аннотация SAMPA | Большинство производителей предоставляют только базовые библиотеки произношения |
| Размер тестовой выборки | ≥10 образцов/≥10 испытуемых | В коммерческих продуктах обычно используется 5-8 образцов |
| Расчет скорости распознавания | Три показателя: предложение/слово/точность | Обычно сообщаются только скорости распознавания слов. |
Пункт 5.3 стандарта явно требует использования многосложных фраз и избегает использования легко спутанных односложных слов. Для слов с вариациями произношения (например, британское/американское произношение) все вариации должны быть зарегистрированы с атрибутами голосовой команды.
В пункте 5.4.2 стандарта указано, что испытуемые должны включать четыре группы: постоянных пользователей, опытных пользователей, неопытных пользователей и людей с нарушением зрения. Тестовая среда должна имитировать реальные условия использования. Например, система, установленная на транспортном средстве, должна тестироваться при уровне фонового шума 55–65 дБ.
| Показатели оценки | Формула расчета | Эталонный показатель отрасли |
|---|---|---|
| Процент распознавания предложений | (Количество правильно распознанных предложений / Общее количество предложений)×100% | ≥90% |
| Точность слов | [(Количество правильно вставленных слов - Количество неправильно вставленных слов) / Общее количество слов]×100% | ≥85% |
Настоящий стандарт и ISO/IEC 30122-1 образуют полную структуру. Техническое развитие отражено в: 1) Добавлении требований к обработке вариаций произношения; 2) Уточнении классификации тестовых выборок; 3) Введении концепции точности слов. Рекомендуемая реализация:

© 2025. Все права защищены.