| Параметры качества | Индикаторы обнаружения | Методы обнаружения | Квалифицированные пороговые значения |
|---|---|---|---|
| Полнота | Тип файла, диапазон содержимого, полнота документа | Метод точечной проверки | 100% совпадение |
| Нормальность | Формат хранения, наименование файлов, структура каталогов | Пакетная проверка | Соответствие формату ≥99% |
| Достоверность | Читаемость файла, совместимость с системой | Тестирование с моделированием окружающей среды | Отчет об отсутствии ошибок |
| Точность | Качество текста, индексации и носителя | Выборочное тестирование | Частота ошибок ≤ 0,5‰ |
Стандарт требует, чтобы результаты обработки включали семь типов объектов данных, включая текстовые файлы и файлы изображений. Документация по управлению качеством должна включать в себя план тестирования и отчёт. В типичном сценарии применения проекты оцифровки старинных книг должны обеспечивать строгое соответствие между номерами страниц отсканированных изображений и OCR-текстом.
Файлы хранятся в иерархической структуре каталогов. Например, в этом примере ISBN_9787501346950 является основной папкой, в которой хранятся подпапки, такие как PDF и XML. Для долгосрочного хранения следует использовать несжатый формат, например TIFF или BWF.
Стандарт предлагает инновационный четырехмерный метод контроля:
По сравнению с предыдущей версией стандарта, версия 2020 года имеет следующие основные Обновления:
Компаниям рекомендуется внедрять этот стандарт в три этапа:
| Период подготовки | Создание документов стандартных операционных процедур (СОП), соответствующих стандарту |
| Период внедрения | Настройка автоматизированных инструментов тестирования (например, валидатора формата JHOVE) |
| Период оптимизации | Создание системы ключевых показателей эффективности (КПЭ) на основе таблицы оценки качества 6.1 |

© 2025. Все права защищены.