GB/T 42755-2023 (Англоязычная версия) Процедура маркировки данных, ориентированная на искусственный интеллект, для машинного обучения - Стандарты и спецификации PDF

GB/T 42755-2023
Процедура маркировки данных, ориентированная на искусственный интеллект, для машинного обучения (Англоязычная версия)

Стандартный №
GB/T 42755-2023
язык
Китайский, Доступно на английском
Дата публикации
2023
Разместил
General Administration of Quality Supervision, Inspection and Quarantine of the People‘s Republic of China
Последняя версия
GB/T 42755-2023
 

сфера применения

1. Предпосылки разработки стандартов и технологическая эволюция

С быстрым развитием технологий искусственного интеллекта аннотация данных играет всё более важную роль в машинном обучении. GB/T 42755—2023, «Спецификация аннотации данных для искусственного интеллекта и машинного обучения», направлен на стандартизацию процесса аннотации данных, обеспечение качества и согласованности аннотаций, а также предоставление высококачественной поддержки данных для обучения моделей ИИ.

2. Сравнение стандартных фреймворков

Измерения GB/T 42755—2023 Сравнение с международными стандартами
Технические требования Подробно описывает процесс аннотации данных, включая подготовку задачи, выполнение и вывод. Соответствует ISO/IEC 23053, делает акцент на стандартизации аннотации.
Меры управления Введены инструкции по задачам аннотации и механизмы проверки качества. Соответствует ANSI/INCITS 497, уделяя особое внимание управлению процессами.
Стандарты качества Четко определите показатели качества и приемки данных и поддерживайте несколько методов проверки. Соответствуйте международным передовым практикам аннотации данных.

3. Рекомендации по внедрению

3.1 Предварительная подготовка к задачам аннотации

  • Четко определите инструкции по задачам аннотации, включая формат данных, масштаб и требования к качеству.
  • Выберите подходящий инструмент маркировки, например Amazon Mechanical Turk или Label Studio.

3.2 Этап выполнения задачи маркировки

  • Создайте механизм обучения и оценки компетентности для этикетировщиков.
  • Используйте комбинацию машинной проверки и ручного просмотра для обеспечения качества.

3.3 Вывод результатов маркировки и последующее обслуживание

  • Внедрите внутреннюю проверку качества, чтобы гарантировать, что предоставление данных соответствует требованиям.
  • Создайте механизм исправления и обновления данных для обеспечения долгосрочной доступности.

4. Объяснение терминологии

Описание задачи маркировки: Это письменный документ, предоставленный заказчиком данных, в котором разъясняются конкретные требования и критерии приемки для задачи маркировки. Например, в задачах распознавания изображений требуются подробные описания типов этикеток, методов аннотации и примеры.


5. Заключение

GB/T 42755-2023 содержит всеобъемлющее руководство по аннотации данных с помощью ИИ. Благодаря научному управлению процессом и строгому контролю качества эффективность и точность аннотации данных могут быть значительно повышены, что закладывает прочную основу для обучения моделей машинного обучения.

GB/T 42755-2023 Ссылочный документ

  • GB/T 35274-2017 Технология информационной безопасности. Требования к возможностям безопасности для служб больших данных.
  • GB/T 37973-2019 Технологии информационной безопасности. Руководство по управлению безопасностью больших данных.

GB/T 42755-2023 История

  • 2023 GB/T 42755-2023 Процедура маркировки данных, ориентированная на искусственный интеллект, для машинного обучения
Процедура маркировки данных, ориентированная на искусственный интеллект, для машинного обучения

стандарты и спецификации




© 2025. Все права защищены.