Росстандарт утвердил терминологические нормативы для участников рынка больших данных. Это первый подобный стандарт в России.
ГОСТ «Информационные технологии. Большие данные. Обзор и словарь» соответствует международному стандарту Information technology – Big data – Overview and vocabulary. Его разработали в Национальном центре цифровой экономики МГУ и Институте развития информационного общества в рамках бюджетной программы государственной поддержки центра компетенций «Национальной технологической инициативы» (НТИ) по технологиям хранения и анализа больших данных МГУ.
Как говорится в описании стандарта, термины, которые установлены в нем, обязательны для применения во всех видах документации и литературы по данной научно-технической отрасли.
В ГОСТе приводятся переводы англоязычных терминов, относящихся к большим данным и расшифровка их значений. Так, «аналитика данных» (data analytics) – это «составное понятие, охватывающее получение, сбор, проверку и обработку данных, включая их количественную оценку, визуализацию и интерпретацию». В свою очередь, «вариативность данных» (data variability) – это «изменения в скорости передачи, формате или структуре, семантике или качестве массива данных».
Кроме того, в стандарте содержатся ключевые характеристики больших данных, в том числе их объем, скорость обработки, разнообразие и вариативность, с объяснением значения каждой.
«Принятие первого национального стандарта задает вектор совместных действий власти, бизнеса, научно-образовательного сообщества по развитию экономики данных в России. Мы ставим перед собой задачу сократить отставание в стандартизации больших данных», – говорит председатель совета директоров Института развития информационного общества Юрий Хохлов. По его словам, после введения терминологического стандарта к нему добавятся и остальные.
Первый международный стандарт в сфере big data «Большие данные – Требования на основе облачных вычислений и их возможности» был утвержден Международным союзом электросвязи в 2015 году. Спустя три года Международная организация по стандартизации (ISO) утвердила стандарты эталонной архитектуры больших данных, сценариев использования big data, а также направления дальнейшей стандартизации больших данных. В 2020 году были опубликованы стандарты безопасности при использовании персональных данных в big data. В настоящее время ведется работа над серией стандартов о качестве больших данных для аналитики и машинного обучения.
По словам Хохлова, предстоит принять еще восемь национальных стандартов в сфере больших данных, касающихся эталонной архитектуры, безопасности, методов анализа, сценариев использования и прочего. Он отмечает, что часть из них уже разработана и прошла общественное обсуждение, а другая часть будет разрабатываться одновременно с международными стандартами.
В конце 2019 года Boston Consulting Group оценивала объем российского рынка больших данных в 45 млрд рублей с темпом прироста 12 % в течение последних пяти лет. По информации Ассоциации больших данных, объем рынка больших данных в России составляет 10–30 млрд рублей. К 2024 году ожидается его рост до 300 млрд рублей.
Как отмечает председатель технического комитета «Кибер-физические системы» при Росстандарте Никита Уткин, терминологический стандарт позволит участникам рынка больших данных общаться на одном языке при составлении закупочной документации, техзаданий и техдокументации. Кроме того, этот стандарт нужен для разработки регуляторных документов.
Директор Института исследований интернета Карен Казарян считает действия Росстандарта логичными. Однако, по его словам, для бизнеса этот стандарт ничего не меняет, скорее, он нужен как словарь для чиновников, которые не совсем представляют, что такое big data.
Как сообщалось ранее, чиновники в рамках мер по поддержке IT-отрасли начали готовить нормативную базу для создания репозитария государственной big data и правила доступа к нему разработчиков в сфере искусственного интеллекта. Ассоциация больших данных, в которую входят крупные банки, IT-компании и операторы связи до этого назвала передачу государственных данных предпринимателям как одну из задач в развитии рынка больших данных к 2024 году.
pvsur
А где сам ГОСТ и как в нем разъясняется сам термин "большие данные" ?
pewpew
Гугл подсказывает, например этот документ.