您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息
免费发信息
三六零分类信息网 > 荆门分类信息网,免费分类信息发布

详解数据服务共享发布

2019/9/20 6:16:40发布156次查看

转载本文需注明出处:微信公众号eaworld,违者必究。
引言:
随着云计算、大数据、物联网等技术兴起,数据朝着多样性、高体量、高速度方向发展,如何将海量数据安全、稳定、高效地数据共享出去成为各企业关注的重点。本次微课堂通过普元在数据服务共享平台研发过程中的实践,和大家分享数据服务共享发布的相关经验。
目录:
1.数据服务共享发布核心场景
2.数据服务共享发布技术架构
3.数据服务共享发布关键设计
4.数据服务共享发布安全考虑
5.结束语
1.数据服务共享发布核心场景
按功能划分核心场景
核心场景主要包括四个环节:资源目录生成、数据服务发布、数据服务消费、数据服务监控。
资源目录生成:提供数据资源目录与服务资源目录两种视图,数据资源目录通过自动化采集方式生成,对各种数据源(数据库、文件、大数据)的元数据信息进行展示;通过数据服务发布快速生成服务资源目录。
数据服务发布:基于数据资源目录可将共享区数据快速发布成实时服务(restful)和批量服务(file)。
数据服务消费:定义了从服务浏览、申请、审批、数据使用的详细流程,消费方通过订阅或者拉取的方式使用数据。
数据服务监控:对数据服务全生命周期管理与监控,对故障进行实时告警。
按角色进行功能场景划分
围绕核心场景定义了四类角色:数据管理员、数据开发人员、数据消费方、运维人员。
数据管理员:负责数据资源目录、服务目录的维护,参与数据服务的审批及授权。
数据开发人员:负责数据资源服务化前的转换、脱敏、核检,负责实时和批量服务的开发。
数据消费方:数据资源的使用方,通过资源目录查找相应的数据服务,向数据管理员提交数据服务申请使用数据。
运维人员:负责数据整体共享交换过程中数据资源的监控、统计分析及故障处理。
围绕核心场景,我们总结了四个典型应用场景:
场景一:让用数据的所有人知道可以提供什么样的数据
通过资源目录提供技术元数据、业务元数据、服务元数据视图,使资源更容易发现,提供分区、分节点的体系化资源目录管理,保护数据安全,快速查找数据。通过自动化采集与解析手段获取元数据信息,建立技术、业务、服务元数据的注册输入,标明数据方位。
场景二:提供接口、文件、数据库三种服务类型对外进行共享
基于数据服务目录以接口、文件、数据库三种提供给数据使用方,数据消费方可通过申请的方式主动拉取数据,也可通过订阅的方式自动获取所需数据。
场景三:自助式数据问题追踪
消费方申请数据时通过血缘分析及级影响分析能够及时发现资源在使用过程中的质量问题 ,确认是否是自己想要的数据,验证开发正确性。
场景四 :从全局了解企业数据服务应用情况
通过数据服务监控自动形成数据监控链路,提供数据服务共享的全貌地图,帮助企业了解数据共享交换的全貌及系统间数据关系,从全局了解企业的数据服务应用情况。
2.数据服务共享发布技术架构
支撑流水线式的数据服务共享发布核心架构
上图核心架构中定义了数据从数据源开始经过数据准备(清洗、转换、质量核检)后进入共享区,对共享区数据进行服务化后提供给消费方使用的处理流程及机制,支撑流水线式的数据服务共享发布。
根据数据生命周期的不同环节,架构设计上定义了三个数据区域(数据源、数据前置区、数据共享区),可根据实际情况对三个区域进行自定义或取舍。
功能架构
在功能架构上主要包括四大支撑引擎+四大功能模块。
四大支撑引擎:
实时服务引擎:实时服务发布及访问功能,以restful方式提供;
批量服务引擎:批量服务发布及访问功能,以file方式提供;
调度引擎:提供对批量服务的调度功能;
日志引擎:采集日志进行指标分析。
四大功能模块:
资源目录:数据消费方和数据开发人员使用视图;
数据服务发布:实现对实时服务和批量服务的发布管理;
数据使用及安全:定义数据申请使用流程及数据安全管理;
数据服务监控:对数据服务生命周期进行全链路监控。
开发采用的技术栈
在数据服务共享平台开发的中涉及到的技术栈分为五个层次:
资源层:对主流关系型数据库(oracle、sqlserver、mysql),大数据(hbase、hive)、文件等多种数据源进行技术元数据的自动采集和业务元数据的管理。
访问层:基于jdbc、)查看。适用于政府、金融、保险等有数据交换、共享及使用的场景的各行业领域。
问4:数据共享安全管控中如何对非结构化的数据资源进行安全控制,如影像地图等,如何进行按地理区域来控制访问的权限及安全
答:数据共享安全管控中对影像地图类非结构化的数据资源很难从内容上去做控制,可以配置地理区域标识与服务的对应关系、地理区域ip与服务对关系,从服务访问的角度来控制。
问5:即使用了https,数据是不是还有被修改的可能,目前能做到数据不被修改吗
答:https中将服务器端公钥证书同客户端绑定,由客户端在交互过程中去验证证书的合法性,可以避免中间人攻击,防止抓包和篡改,需要客户端有验证的逻辑。
问6:在数据中台和业务中台是否也需要这个前期如何规划
答:数据服务共享发布可以做为数据中台和业务中台的一部分,关注将已有数据资产发布成数据服务。前期可从数据标准、数据质量、数据治理的角度去规划。
问7:数据服务共享,核心是数据质量可靠,请问数据质量核检能否保证数据质量,有无办法对数据质量的真实性、完整性、时效性进行有效的管控。行业及普元是否有相关的解决办法
答:普元有专门的数据质量产品,在金融、政企行业有关的解决方案。
问8:请问如何对数据服务从计量的角度进行监控,满足监控数据共享程度的热度、使用的频率和按数据的访问流量计价等
答:可以借助于sparkstreaming、flink等流式处理框架对数据服务的交易日志进行相关指标的计算。
问9:为什么数据服务共享中,是否有报表共享服务
答:可以将报表以接口服务或者文件的方式提供给数据使用方。
问10:场景三中的血缘分析及级影响分析,能否具体举例说明下
答:血缘分析是基于当前资源向上追溯分析影响,影响分析基于当前资源分析对下游产生哪些资源产生影响。比如:当表某个字段发生变更时,可以通过血缘分析与影响分析查看对上游和下游所牵扯到的哪些系统有影响。
问11:密钥怎么管理
答:秘钥需要考虑从整个生命周期进行管理,进行定期备份与存储,建议从网上查看下相关资料。
问12:请问,数据标准这块怎么理解,具体包括哪些内容
答:普元有自己的数据标准产品,数据标准包括基础标准和分析类标准,基础标准包括数据内容格式、数据类型及数据含义;分析类标准含有指标的计算口径、纬度和定义等。
推荐阅读
kubernetes中pod间共享内存方案
自服务数据共享与服务架构详解
区块链的业务价值是通过数据共享降低信任成本
关于作者:不凡,普元软件产品部架构师,十余年it从业经验,致力于数据服务共享、数据集成、服务治理、数据治理相关产品的架构与研发,具备较为领先的产品研发思路和丰富的实施落地经验,带领和参与了普元dsp、di、esb、metacube产品的研发,同时参与政府、保险、电力、公安、通信等多个领域数据项目的前期咨询及实施工作。
关于eaworld:微服务,devops,数据治理,移动架构原创技术分享。长按二维码关注!
9月6日(本周五)下午14:30,普元前端工程师夏夏将为大家带来《devops平台之看板设计》,敬请期待。关注本公众号回复“yg+微信号”,参与课程有机会赢取相关书籍哦~
在看点这里

荆门分类信息网,免费分类信息发布

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录