GB/T 45288.2-2025 (Англоязычная версия) Большая модель искусственного интеллекта, часть 2: метрики и методы оценки - Стандарты и спецификации PDF

GB/T 45288.2-2025
Большая модель искусственного интеллекта, часть 2: метрики и методы оценки (Англоязычная версия)

Стандартный №
GB/T 45288.2-2025
язык
Китайский, Доступно на английском
Дата публикации
2025
Разместил
General Administration of Quality Supervision, Inspection and Quarantine of the People‘s Republic of China
Последняя версия
GB/T 45288.2-2025
 

сфера применения

Анализ стандартной базовой структуры

Параметры возможностей Унимодальные индикаторы Мультимодальные индикаторы Точки инноваций
Способность понимания 19 пунктов, включая текст/изображение/аудио 12 пунктов, включая графику/текст/текст и аудио Создание многомодальной унифицированной структуры оценки впервые
Способность генерации 7 пунктов для текста 8 пунктов включая графику/текст/текст и аудио Охватывает весь сценарий от генерации кода до синтеза видео

Подробное объяснение ключевых технических индикаторов

5.1.3 Возможности извлечения информации

Стандарт требует, чтобы модели обладали пятью возможностями, включая извлечение ключевых слов и извлечение взаимосвязей. В финансовых приложениях эти модели должны достигать базового уровня точности ≥ 85% и полноты ≥ 80%.

5.2.7 Возможности генерации кода

Оценка охватывает распространённые языки программирования, такие как Python и Java, требующие, чтобы сгенерированный код прошёл проверку синтаксиса и модульное тестирование. Типичный пример показывает, что бизнес-модели достигают 72% успеха с первого раза при решении задач LeetCode среднего уровня.


Методология реализации оценки

Этапы Ключевые действия Требования к инструментам
Фаза подготовки Определение базовых/расширенных возможностей в соответствии с таблицей 3 Инструменты тестирования API/Инструменты веб-автоматизации
Фаза выполнения Возьмите среднее значение 3 повторных тестов Поддержка расчета таких показателей, как BLEU/Ruge
Фаза оценки Ручной просмотр + кросс-валидация большой модели Система оценки MOS

Стандартные рекомендации по внедрению

  1. Подготовка данных: Рекомендуется использовать смешанный набор данных, при этом доля данных с открытым исходным кодом должна составлять не более 40%, и необходимо включить корпуса в таких профессиональных областях, как медицина и юриспруденция.
  2. Конфигурация среды: Видеопамять GPU ≥ 32 ГБ, поддержка точных вычислений FP16 и требование к задержке < 500 мс/запрос.
  3. Проверка результатов: Ключевые бизнес-сценарии должны сочетать использование объективных методов A.1 и субъективных оценок A.2.

Анализ развития технологий

По сравнению с В проекте 2023 года основные достижения этого стандарта отражены в:

  • Добавлены шесть мультимодальных индикаторов, включая аудио- и видеовопросы и ответы
  • Оптимизированы параметры оценки понимания длинного текста и введены требования к анализу структуры абзацев.
  • Включена этическая оценка в систему оценки MOS (см. Таблицу A.1 Параметр вредоносности)

GB/T 45288.2-2025 Ссылочный документ

  • GB/T 42755-2023 Процедура маркировки данных, ориентированная на искусственный интеллект, для машинного обучения
  • GB/T 45288.1 Искусственный интеллект: Большие модели, Часть 1: Общие требования*2026-06-20 Обновление

GB/T 45288.2-2025 История

  • 2025 GB/T 45288.2-2025 Большая модель искусственного интеллекта, часть 2: метрики и методы оценки
Большая модель искусственного интеллекта, часть 2: метрики и методы оценки

Специальные темы по стандартам и нормам

стандарты и спецификации

GB/T 5271.29-2006 Информационные технологии. Словарь. Часть 29. Искусственный интеллект. Распознавание и синтез речи. GB/T 5271.31-2006 Информационные технологии. Словарь. Часть 31. Искусственный интеллект. Машинное обучение. GB/T 5271.34-2006 Информационные технологии. Словарь. Часть 34. Искусственный интеллект. Нейронные сети. DB37/T 4658.3-2023 Классификация сценариев применения искусственного интеллекта. Часть 3: Уход за пожилыми людьми GB/T 45079-2024 Технические характеристики адаптации платформы глубокого обучения искусственного интеллекта к нескольким аппаратным платформам AS ISO/IEC 23053:2023 Платформа для систем искусственного интеллекта (ИИ), использующих машинное обучение (ML) GB/T 45081-2024 Система управления искусственным интеллектом PD CEN CLC TR 17894:2024 Искусственный Интеллект - Оценка соответствия Искусственного Интеллекта PD ISO/IEC TS 06254:2025 Информационные технологии — Искусственный интеллект — Цели и подходы к интерпретации и объяснимости моделей машинного обучения (ML) и систем искусственного интеллекта (AI) DB21/T 4380-2026 Промышленная искусственная интеллектовая эталонная архитектура GB/T 45923.2-2025 Платформа приложения знаний искусственного интеллекта. Часть 2: Требования к производительности и методы испытаний GB/T 45288.1-2025 Большая модель искусственного интеллекта, часть 1: общие требования GB/T 45654-2025 Основные требования безопасности для служб генеративного искусственного интеллекта в кибербезопасности GB/T 45652-2025 Технология кибербезопасности Генеративный искусственный интеллект Предварительное обучение и оптимизация Спецификации безопасности данных обучения ITU-T F.748.17-2022 Техническая спецификация для облачной платформы искусственного интеллекта Разработка модели искусственного интеллекта GB 45438-2025 Технология кибербезопасности, искусственный интеллект, созданный с помощью метода идентификации синтетического контента GB/T 45288.3-2025 Большая модель искусственного интеллекта, часть 3: Оценка зрелости возможностей сервиса GB/T 15934-2024 Комплекты электрических аксессуаров и соединительные шнуры ISO/IEC TS 42119-2:2025 Искусственный интеллект — Тестирование ИИ — Часть 2: Обзор тестирования систем искусственного интеллекта

GB/T 45288.2-2025 - Все части




© 2026. Все права защищены.