Технологии, представленные в «Озере данных, часть 4: Технические требования к приложениям искусственного интеллекта», включают: (1) Исследование технологии конфиденциальности вычислений для создания отслеживаемого механизма безопасности данных для удовлетворения потребностей в безопасности данных. Исследование основано на технологии федеративного обучения для решения проблемы коллизии данных в сценариях, когда данные не покидают домен, и предлагает методы комплексной интеграции данных и инкубации ценных моделей. Основываясь на надежном аппаратном обеспечении исполнения и других технологиях шифрования, мы создаем безопасную и надежную среду для инкубации моделей после того, как данные выходят из домена, делая данные доступными и невидимыми, обеспечивая конфиденциальность, безопасность и соответствие данным. (2) Технология интеллектуального иерархического хранения учитывает иерархические характеристики «горячих» и «холодных» данных. С одной стороны, она требует возможности хранения большой емкости и недорогих данных, а с другой стороны, требует возможностей быстрого извлечения данных во время обучения. . Исследуйте технологию хранения данных Blue-ray и магнито-опто-электрическую интегрированную интеллектуальную иерархическую технологию хранения данных для хранения больших объемов данных на недорогих носителях Blue-ray и предварительной загрузки обучающих данных в магнитные или диэлектрические носители с высокой пропускной способностью. Кроме того, иерархическое хранилище также учитывает механизм высокой надежности RAID, возможности автоматической репликации объектов и службы шифрования конфиденциальных данных для повышения надежности библиотеки ресурсов и обеспечения безопасности хранения данных. (3) Технология распределенного обучения и вывода решает проблемы, связанные с моделями с чрезвычайно большими параметрами и большими объемами данных для ресурсов и продолжительности обучения, исследует механизм среза обучающих данных и интегрирует ускорение тысяч графических процессоров посредством параллелизма данных, параллелизма моделей, гибридного параллелизма и т. д. Режим параллельных вычислений карты обеспечивает крупномасштабное распределенное обучение и обеспечивает возможность линейного расширения 0,9+. В то же время, основываясь на изменениях требований к задачам, мы автоматически корректируем распределение ресурсов, изучаем эластичную и масштабируемую архитектуру рассуждений и улучшаем возможности эластичного сервиса алгоритмического рассуждения, разрабатывая инструменты сервиса рассуждения, которые совместимы с несколькими средами глубокого обучения и адаптируются к ним; достигается разнообразие отечественных вычислительных мощностей. Единое планирование разнородных вычислительных ресурсов.
T/AI 126.4-2024 История
2024T/AI 126.4-2024 Озеро данных, часть 4. Технологические требования для приложений искусственного интеллекта