BS ISO 24613-1:2019 Отслеживаемые изменения. Управление языковыми ресурсами. Структура лексической разметки (LMF). Базовая модель - Стандарты и спецификации PDF

BS ISO 24613-1:2019
Отслеживаемые изменения. Управление языковыми ресурсами. Структура лексической разметки (LMF). Базовая модель

Стандартный №
BS ISO 24613-1:2019
Дата публикации
2020
Разместил
British Standards Institution (BSI)
состояние
 2024-01
быть заменен
BS ISO 24613-1:2024
Последняя версия
BS ISO 24613-1:2024
 

сфера применения

Развитие и история развития стандартных технологий

Стандарт LMF 2019 года, являясь комплексным пересмотром ISO 24613:2008, принимает модель выпуска по частям. В базовой модели (часть 1) добавлены классы LexiconInformation и GrammaticalInformation, исходный класс Representation преобразован в класс OrthographicRepresentation, а также введена метамодель Cross-Reference (CrossREF), значительно улучшающая поддержку взаимодействия с многоязычной лексикой.


Анализ архитектуры базовой модели

Основные классы Характеристики наследования Ключевые категории данных
LexicalResource Без подклассов languageCoding/scriptCoding
LexicalEntry Разрешить подклассы formType/partType
OrthographicRepresentation Разрешить подклассы representationType/xml:lang

Механизм выбора категории данных

Стандарт обеспечивает гибкое моделирование посредством DCS (выбор категории данных):

  1. Стандартизированное распределение: обязательное использование языковых кодов ISO 639 и текстовых кодов ISO 15924
  2. Настройка пользователем: расширение специальных требований с помощью определенных пользователем категорий данных
  3. Типизированная реализация: эквивалентное моделирование может быть достигнуто путем создания экземпляра подкласса (например, подкласса Lemma) или путем назначения категории данных

Пример применения: при разработке арабских словарей одно и то же корневое слово может быть связано с несколькими LexicalEntry, а морфологическая аннотация реализуется через категорию данных formStructure=root.


Спецификации кросс-модельных ссылок

Пакет CrossREF предоставляет три типа ключевых ограничений:

  • Тип ссылки: внутренняя/внешняя
  • Тип связи: 12 предустановленных значений, включая синоним/антоним/вариант
  • Спецификация идентификатора: поддерживает несколько систем идентификаторов, таких как IRI/URI/URL

Предложения по реализации

Принцип упрощения модели на основе пункта 5.5.6 стандарта:

Сценарий Рекомендуемое решение Риск потери данных
Одноязычный словарь Предпочитает наследование подклассов Низкий
Многоязычная база данных Ориентация на выбор категории данных Требуется проверка совместимости метаданных
Машинно-читаемый словарь (MRD) В сочетании с OrthographicRepresentation подклассификацией Средний

BS ISO 24613-1:2019 Ссылочный документ

  • ISO 15924 Информация и документация — Коды для представления названий сценариев — Приложение 1
  • ISO 16642 Компьютерные приложения в терминологии - Структура терминологической разметки
  • ISO 639 Код для отдельных языков и языковых групп*2023-06-01 Обновление

BS ISO 24613-1:2019 История

  • 2024 BS ISO 24613-1:2024 Управление языковыми ресурсами. Структура лексической разметки (LMF) — базовая модель
  • 2020 BS ISO 24613-1:2019 Отслеживаемые изменения. Управление языковыми ресурсами. Структура лексической разметки (LMF). Базовая модель
Отслеживаемые изменения. Управление языковыми ресурсами. Структура лексической разметки (LMF). Базовая модель

стандарты и спецификации

BS ISO 24613-5:2022 Отслеживаемые изменения. Управление языковыми ресурсами. Структура лексической разметки (LMF). Сериализация обмена лексическими базами (LBX ISO 24613-1:2024 Управление языковыми ресурсами UNI ISO 24613-1:2024 Управление языковыми ресурсами - Структура лексической разметки (LMF) - Часть 1: Основная модель ISO 24613-1:2019 Управление языковыми ресурсами. Структура лексической разметки (LMF). Часть 1. Базовая модель ISO 24613-5:2022 Управление языковыми ресурсами. Структура лексической разметки (LMF). Часть 5. Сериализация обмена лексическими базами (LBX DANSK DS/ISO 24613-5:2022 Управление языковыми ресурсами. Структура лексической разметки (LMF). Часть 5. Сериализация обмена лексическими базами (LBX SS-ISO 24613-1:2019 Управление языковыми ресурсами - Структура лексической разметки (LMF) - Часть 1: Основная модель (ISO 24613-1:2019, IDT BS ISO 24613-1:2024 Управление языковыми ресурсами. Структура лексической разметки (LMF) — базовая модель ISO 24613-4:2021 Управление языковыми ресурсами. Структура лексической разметки (LMF). Часть 4. Сериализация TEI



© 2025. Все права защищены.