Стандарт IEEE 3304-2023 официально принимает версию 1 Технической спецификации водяных знаков нейронных сетей, разработанной организацией MPAI (кодирование движущихся изображений, звука и данных искусственным интеллектом). Стандарт был одобрен Комитетом по стандартам IEEE SA 8 ноября 2023 года и официально выпущен 12 февраля 2024 года. Являясь ключевым стандартом в области безопасности ИИ, он предоставляет стандартизированную структуру оценки для защиты авторских прав, проверки целостности и аутентификации источника моделей нейронных сетей.
С широким распространением технологии ИИ модели нейронных сетей стали ценным цифровым активом для предприятий и частных лиц. Однако кража моделей, фальсификация и несанкционированное распространение становятся все более серьезными проблемами. Стандарт MPAI-NNW был разработан для решения этой проблемы и обеспечения надежности, сопоставимости и совместимости технологии водяных знаков с помощью стандартизированных методов оценки технологии водяных знаков.
Стандарт MPAI-NNW определяет три основных параметра оценки, которые составляют полную систему оценки технологии водяных знаков:
| Параметры оценки | Содержание оценки | Ключевые технические показатели | Сценарии применения | ||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Незаметность | Влияние внедрения водяных знаков на производительность модели | Изменения точности, различия в индексах качества | Защита авторских прав на модель | ||||||||||||||||||||||||||||||||||||||||||||
| Надежность | Защита от атак и подделок Возможности | Частота ложных срабатываний, частота пропущенных срабатываний, частота ошибок символов | Проверка целостности | ||||||||||||||||||||||||||||||||||||||||||||
| Шаги | Содержание операции | Технические требования |
|---|---|---|
| 1 | Определение обучающих и тестовых наборов данных | Объем данных как минимум на один порядок больше обучаемых параметров |
| 2 | Выбор моделей и полезных нагрузок нейронных сетей без водяных знаков | Модели M, полезные нагрузки данных D |
| 3-4 | Применение технологии водяных знаков и обработка данных | Создание M×D моделей с водяными знаками |
| 5-8 | Тестирование производительности и оценка качества | Использование одного и того же тестового набора данных |
В случае внедрения водяных знаков во время обучения модели стандарт требует, чтобы нейронная сеть с водяными знаками оценивалась как обычная нейронная сеть, с упором на общую производительность окончательной модели.
Глава 7 стандарта определяет подробный процесс оценки надежности, который проверяет живучесть водяного знака путем моделирования различных методов атак:
| Тип атаки | Диапазон параметров | Цель теста |
|---|---|---|
| Добавление гауссовского шума | Коэффициент стандартного отклонения шума 0,1–0,3 | Устойчивость теста к случайным шумам |
| Отсечение L1 | Коэффициент отсечения 1%–90% | Тест на устойчивость к сжатию модели |
| Случайное отсечение | Коэффициент отсечения 1%-10% | Тест на устойчивость к случайному удалению параметров |
| Атака квантования | Количество бит: 32-2 бита | Тест на устойчивость к снижению точности |
| Тонкая настройка/перенос обучения | Дополнительные эпохи обучения: 0,5x | Тест на устойчивость к непрерывному обучению |
| Извлечение знаний | Размер набора данных 10 000–1 000 000 слов | Тестовая устойчивость к перегонке модели |
| Покрытие водяными знаками | Количество покрытий: 2–4 | Тестовая устойчивость к нескольким водяным знакам |
В процессе оценки необходимо рассчитать ключевые показатели, такие как Процент ложноположительных результатов, Процент ложноотрицательных результатов и Процент ошибочных символов, чтобы гарантировать, что технология водяных знаков по-прежнему будет эффективно работать при различных атаках.
Глава 8 стандарта определяет метод оценки вычислительной стоимости, охватывающий три этапа внедрения водяного знака, его обнаружения и декодирования:
Метрики оценки включают: использование памяти, время обработки на эпоху, количество требуемых эпох и время вывода нейронной сети водяных знаков. Стандарт рекомендует проводить оценку в двух тестовых средах: средней и большой:
| Тестовая среда | Конфигурация оборудования | Применимые сценарии |
|---|---|---|
| Средняя среда | Один графический процессор (16 ГБ/6144 ядра CUDA) + 8-ядерный процессор (2,6 ГГц) | Обычные научно-исследовательские институты и малые и средние предприятия |
| Большая среда | Два графических процессора (32 ГБ/12288 ядер CUDA) + 16-ядерный процессор (3,4 ГГц) | Большая Предприятия и научно-исследовательские институты |
Общее время обработки и использование памяти используются для характеристики вычислительной стоимости процесса обнаружения и декодирования, чтобы гарантировать осуществимость технологии водяных знаков в практических приложениях.
1. Этап выбора технологии: выберите подходящую технологию водяных знаков на основе сценария применения, принимая во внимание тип модели, ожидаемый тип атаки и требования к производительности
2. Настройка тестовой среды: настройте аппаратную и программную платформу в соответствии с требованиями стандарта к тестовой среде, чтобы обеспечить сопоставимость результатов тестирования
3. Выполнение процесса оценки: Строго следуйте процессу тестирования, указанному в стандарте, чтобы гарантировать полноту и точность оценки
4. Оптимизация производительности: Оптимизируйте алгоритм водяных знаков на основе результатов оценки, чтобы найти оптимальный баланс между незаметностью, надежностью и вычислительными затратами
Случай 1: Защита авторских прав на модель
Компания, занимающаяся ИИ, использовала стандарт MPAI-NNW для оценки своей технологии водяных знаков на модели и успешно внедрила информацию об авторских правах в модель классификации изображений. После стандартизированного тестирования на надежность водяной знак все еще может быть правильно извлечен после квантования модели (уменьшения до 8 бит) и обрезки (удаления 20% параметров), что эффективно предотвращает кражу модели.
Случай 2: Проверка целостности
Финансовые учреждения используют технологию водяных знаков для проверки целостности моделей управления рисками. Благодаря стандартизированной оценке незаметности подтверждено, что влияние внедрения водяных знаков на точность модели составляет менее 0,5%, и может быть обнаружено любое незаконное изменение параметров модели.
Случай 3: Многосторонняя совместная прослеживаемость
В сценарии совместного обучения каждый участник использует технологию водяных знаков для маркировки обновлений модели, которые он вносит. Благодаря стандартизированной оценке вычислительных затрат была выбрана схема водяных знаков, подходящая для обработки в реальном времени, что обеспечивает точную прослеживаемость вкладов.
Как первый стандарт водяных знаков нейронных сетей, принятый IEEE, MPAI-NNW V1 заложил важную основу для развития отрасли. С быстрым развитием технологий ИИ будущие версии стандартов, возможно, должны будут учитывать следующие направления эволюции:
1. Реакция на новые атаки: Расширьте область тестирования надежности для устранения новых угроз, таких как состязательные атаки и кража моделей
2. Поддержка разнообразных моделей: Адаптация к требованиям водяных знаков новых архитектур, таких как Transformer и графовые нейронные сети
3. Улучшение защиты конфиденциальности: Объедините технологии защиты конфиденциальности, такие как дифференциальная конфиденциальность и федеративное обучение, для разработки решений по водяным знакам, обеспечивающих конфиденциальность
4. Стандартизированная совместимость: продвижение стандартов совместимости между различными технологиями водяных знаков и достижение совместной защиты с помощью нескольких водяных знаков
Выпуск стандарта IEEE 3304-2023 знаменует собой новый этап в стандартизации и нормализации технологии нейронных сетей водяных знаков и обеспечит надежную техническую поддержку и основу для оценки безопасности защиты моделей ИИ.

© 2025. Все права защищены.