GB/T 38673-2020 信息技术 大数据 大数据系统基本要求.pdf

GB/T 38673-2020 信息技术 大数据 大数据系统基本要求.pdf
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:10.7 M
标准类别:电力标准
资源ID:219603
下载资源

标准规范下载简介

GB/T 38673-2020 信息技术 大数据 大数据系统基本要求.pdf

ICS35.240 L.67

logyBigdataBasicrequirements

CJJ/T 117-2017 建设电子文件与电子档案管理规范(完整正版、清晰无水印).pdfGB/T 386732020

本标准按照GB/T1.1一2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:中国电子技术标准化研究院、华为技术有限公司、北京大学、中国人民大学、中兴 通讯股份有限公司、浪潮电子信息产业股份有限公司、阿里云计算有限公司、天津南大通用数据技术有 限公司、北京百分点信息科技有限公司、复旦大学、南京大学、东南大学、北京和仲宁信息技术有限公司、 北京启迪区块链科技发展有限公司。 本标准主要起草人:梅宏、孙文龙、杜小勇、吴东亚、董建、张群、尹卓、许洁、李冰、李、高琨、朱松 赵江、张展新、梁佳男、赵俊峰、符海芳、卫凤林、孙嘉阳、赵菁华、陈晋川、刘海军、孙伟、姜育刚、周志华、 张敏灵,

本标准按照GB/T1.1一2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:中国电子技术标准化研究院、华为技术有限公司、北京大学、中国人民大学、中兴 通讯股份有限公司、浪潮电子信息产业股份有限公司、阿里云计算有限公司、天津南大通用数据技术有 限公司、北京百分点信息科技有限公司、复旦大学、南京大学、东南大学、北京和仲宁信息技术有限公司 北京启迪区块链科技发展有限公司。 本标准主要起草人:梅宏、孙文龙、杜小勇、吴东亚、董建、张群、尹卓、许洁、李冰、李、高琨、朱松 赵江、张展新、梁佳男、赵俊峰、符海芳、卫凤林、孙嘉阳、赵菁华、陈晋川、刘海军、孙伟、姜育刚、周志华 张敏录

本标准规定了大数据系统的功能要求和非功能要求。 本标准适用于各类大数据系统要求的设计、选型、验收和检测

信息技术大数据 大数据系统基本要求

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T352952017信息技术大数据术语 GB/T35589一2017信息技术大数据技术参考模型

下列缩略语适用于本文件。

列缩略语适用于本文件。

GB/T 386732020

GB/T35589一2017定义了大数据参考架构GB/T 18451.1-2022 风力发电机组 设计要求.pdf,如图1所示。大数据参考模型是一个通用的大数 概念模型,它表示了通用的、与技术无关的大数据系统的逻辑功能构件及构件之间的互操作接口 开发各种具体类型大数据应用系统架构的通用技术参考框架。

本标准参考大数据参考架构逻辑功能构件划分,将大数据系统划分为数据收集、数据预处理、数 、数据处理、数据分析、数据访问、数据可视化、资源管理、系统管理9个模块。大数据系统框架 所示。

数据收集模块要求如下: a)应提供数据导人功能,支持结构化数据、非结构化数据和半结构化数据导人; b)应支持离线数据导人和实时数据导; C 应支持全量数据导人和增量数据导人; d)应提供自动定时导人数据功能; e 宜提供开放的数据导人API; f) 宜提供图形界面实现数据导入功能

数据预处理模块要求如下: a)应提供数据抽取功能,支持对结构化数据、非结构化数据和半结构化数据进行抽取 b)应提供数据清洗功能,支持对不一致数据、无效数据、缺失数据和重复数据的处理; c)应提供结构化数据的列转换、行转换和表转换功能; d) 应提供数据加载功能,支持将经过清洗和转换的数据加载到数据分析模块; e)宜提供清洗前后的数据比对功能; f 宜支持非结构化数据的数据转换功能。

数据存储模块要求如下: a)应提供数据存储功能,支持结构化数据、非结构化数据和半结构化数据存储。 b)应提供与关系型数据库、其他文件系统之间交换数据或文件的功能。 c)支持分布式文件存储,实现以下功能:

1)应支持文件系统基本操作,包括上传、下载、读写、复制、移动、删除、重命名、权限修改 2) 应提供数据块多副本存储、恢复功能; 3) 宜支持文件快速检索功能,支持数据资源的统一检索、编目、增加和删除操作; 4) 宜支持数据压缩存储功能。 d)支持分布式列式数据存储,实现以下功能: 1)应支持以键值形式存储数据的功能; 2)宜支持基于表、列族和列的用户权限管理功能,权限管理操作包括读、写、创建等。 e 支持分布式结构化数据存储,实现以下功能: 1)宜支持结构化数据的分布式存储,保证数据存储的可扩展性和一致性; 2): 宜提供API实现数据的各类查询操作; 3) 宜支持多表关联。 f)支持分布式图数据存储,实现以下功能: 1)宜支持由节点及边组成的数据模型; 2)宜支持图查询,支持单节点、多节点多层关系的扩线查询; 3)宜支持图遍历GBT 7759.1-2015 硫化橡胶或热塑性橡胶 压缩永久变形的测定 第1部分:在常温及高温条件下,支持最短路径、最优路径遍历查询; 4)宜支持图分析

©版权声明
相关文章