4.2 Основные принципы управления качеством данных Управление качеством данных должно следовать следующим принципам: а) Применимость: относится к тому, являются ли собранные статистические данные полезными и отвечают потребностям пользователей. б) Точность: данные должны быть правдивыми, отражать реальную ситуацию; и имеют небольшие ошибки; c) Своевременность: Предоставляйте данные своевременно; d) Сопоставимость: Международная сопоставимость, внутренняя сопоставимость, постоянный статистический уровень могут быть связаны между собой. e) Полнота: Содержание элементов данных является полным и не может быть связано; неполный. f) Простота: информация краткая, менее, но точная; g) Доступность: удобно получать данные и сопутствующие консультационные услуги по статистической информации. h) Полный процесс: охватывает планирование, сбор, хранение, совместное использование, обслуживание, применение и уничтожение; данных Каждый этап всего жизненного цикла 4.3 Процесс управления качеством данных: сбор данных, проверка формата, проверка содержания, интеграция данных и аудит данных. 5 Система оценок 5.1 Оценка качества данных a) Должны быть установлены стандарты оценки качества данных, и должна проводиться комплексная оценка на основе полноты сообщаемых данных и оценок пользователей, а результаты должны динамически обновляться. б) Уровень качества данных должен включать как минимум два уровня: уровень качества I и уровень качества II. Уровень качества данных I: Все данные соответствуют требованиям спецификаций данных и проходят проверку формата данных и проверку содержания данных. Уровень качества данных II: Все необходимые данные соответствуют требованиям спецификаций данных и проходят проверку формата данных и проверку содержания данных, но не требуемые данные не полностью соответствуют требованиям спецификации данных. Данные уровня качества II являются основной целью последующей корректировки и дополнительной регистрации данных. 5.2 Классификация использования данных. Уровни использования данных должны устанавливаться на основе значения, содержания и сферы применения данных, а степень открытости данных и объем совместного использования данных должны управляться в соответствии с уровнями. Обычно он имеет два уровня: совместное использование в Интернете и совместное использование в автономном режиме: а) Совместное использование в режиме онлайн: пользователи могут запрашивать, просматривать и загружать данные через портал службы центра обработки данных, каждый выделенный портал службы центра обработки данных, каждый совместно созданный портал службы центра обработки данных. и т. д. Включая публичный и авторизованный обмен. Публичный обмен означает, что зарегистрированные пользователи могут загружать общедоступные данные онлайн после входа в систему. Авторизованный обмен означает, что некоторые личные данные загружаются онлайн посредством авторизации, и соответствующие разрешения на загрузку личных данных предоставляются в зависимости от функций каждого устройства. б) Совместное использование в автономном режиме: включая общий доступ к приложениям и расширенный общий доступ. Заявка на обмен означает, что пользователь подает заявку на использование данных в соответствующий центр обработки данных, и после одобрения соответствующим компетентным органом каждого центра данные получаются через CD-ROM при поддержке технических средств безопасности. Расширенное совместное использование означает, что пользователи подают заявки на более специализированную и глубокую обработку данных. После того как производители данных выполняют расчет и обработку данных в соответствии с пользовательскими приложениями, они предоставляют их пользователям через компакт-диски с поддержкой технических средств безопасности. 5.3 Классификация безопасности данных a) Сортировка доменов конфиденциальных данных Определенные наборы данных с более высоким уровнем конфиденциальности называются доменами конфиденциальных данных. Поскольку «оценка» включает в себя конфиденциальные данные, эти данные не ориентированы на бизнес и используют только свои собственные атрибуты для определения присвоения оценки, то есть значением поля является соответствующая область данных. В общепринятом методе сортировки домены конфиденциальных данных делятся на общедоступные домены конфиденциальных данных (с юридической точки зрения), отраслевые домены данных (с точки зрения отраслевых норм) и институциональные домены конфиденциальных данных (с точки зрения внутренних норм). Поля общедоступных конфиденциальных данных и поля данных, чувствительных к отрасли, обычно определяются в нормативных документах, а сортировка институциональных полей конфиденциальных данных зависит от понимания участниками бизнес-системы. б) Установка уровней чувствительности отличается от категорий данных в зависимости от бизнес-факторов. Уровни чувствительности делятся в зависимости от уровня конфиденциальности данных. Способы формирования уровней чувствительности можно разделить по объему воздействия, вызванного утечкой данных, поражаемым объектам и степени воздействия. в) Сформулируйте категории данных. Обычно бизнес-категория делится на «родительскую категорию», «родительскую категорию», «подкатегорию», «внучатую категорию» или более, а в качестве минимальной классификации может использоваться предметная область данных. d) Метаданные, принадлежащие домену данных. После сортировки домена конфиденциальных данных поля делятся на домены конфиденциальных данных для последующих операций классификации. Если у вас есть возможность управлять метаданными или поля были предварительно обработаны при сортировке полей конфиденциальных данных, вы можете проигнорировать этот этап. В противном случае поля необходимо назначить доменам конфиденциальных данных. В этом процессе может помочь интеллектуальное программное обеспечение для обнаружения. д) Классификация и агрегирование данных могут напрямую классифицировать предметные области данных путем создания системы управления метаданными. Если система управления метаданными не создана, каждое поле каждой таблицы в каждой базе данных, участвующей в бизнес-системе, необходимо классифицировать и иерархизировать. Этот процесс можно выполнить с помощью интеллектуального программного обеспечения. f) Несколько наборов классификации и градации. В практических приложениях, поскольку бизнес-задачи могут быть разными, нет необходимости создавать только одну систему классификации и градации. При необходимости можно создать несколько наборов систем классификации и градации для разных видов бизнеса. потребности. Если классификация и классификация выполняются для удовлетворения нормативных требований, сначала необходимо выполнить требования соответствия. Эту работу могут выполнять юридические и консалтинговые группы, чтобы разобраться в законах и правилах, которые необходимо соблюдать в зависимости от сферы деятельности. ...
T/JSIA 0004-2024 История
2024T/JSIA 0004-2024 Спецификация для управления качеством больших данных в здравоохранении
2023T/JSIA 0004-2023 Руководство по наращиванию потенциала управления данными Green Software Park
2022T/JSIA 0004-2022 Спецификации оценки для ключевых предприятий по разработке программного обеспечения в рамках схемы планирования провинции Цзянсу