本文从数据空间的发展历程和定义出发,对汽车领域数据空间的特征、应用、流通模式、功能架构等方面进行研究,为汽车领域数据空间建设提供支撑。摘要:
自2019年党中央将数据列入生产要素开始,国务院、工信部、交通部等多部委连续发布了多项政策促进数据要素的流通和价值释放。但目前由于缺乏有效的流通机制和数据流通基础设施,汽车、交通及路侧数据流通仍存在数据质量、数据安全、数据合规、主权认定、价值评估等方面的问题,主体间数据流通缺乏互信基础和标准化流程,数据应用和价值还未完全释放。数据空间作为一类服务与主体间数据可信交换的数据基础设施,能有效赋能车联网数据流通,本文从数据空间的发展历程和定义出发,对汽车领域数据空间的特征、应用、流通模式、功能架构等方面进行研究,为汽车领域数据空间建设提供支撑。
关键词:汽车数据空间,数据可信流通,数据要素
01、引言
随着汽车产业进入以智能网联汽车为标志的下半场竞争,车辆通过车载感知设备和电气化,能产生包括自车状态数据、环境感知数据、事件类数据等大量数据,同时,随着车路云一体化的建设进程,路侧的智能化改造使得路侧能收集如信号灯态、道路事件、车辆轨迹、道路目标物等数据,海量的数据蕴含有大量价值亟待开发,产业各方也对数据流通和价值挖掘提出了多种需求和设想。
但同时,由于数据具有可复制、非排他、可加工等特性,一方面数据持有方担心数据泄露、数据过度挖掘、使用无法控制等问题,导致自身利益受损,不愿对外供应数据,另一方面,数据的需求方或使用方也担心数据质量、数据可信度、数据交易保障、数据合规等问题,在购买或使用数据时也存在顾虑,迫切需要建立一套可信有效的数据流通机制和流通基础设施,支撑不同主体间数据可信流通。
02、数据空间发展历程
(1)欧洲率先启动数据空间
为了对抗美国互联网巨头的数字霸权,欧洲先后出台《通用数据保护条例》(GDPR)、《欧洲数据战略》等多项政策,一方面遏制欧盟外互联网巨头数字权力,另一方面试图打造一个统一的欧洲数据联合体,力图在数字经济的世界竞争中占据一席之地。
在此背景下,国际数据空间(International Data Space,简称为IDS)的概念应运而生。IDS以建立欧洲统一、可信的数据流通空间为目标,通过标准化连接器(connector)的设计,内嵌机器可读的使用协议,描述数据使用者各类权限和义务,保障数据主权;通过提供标准化参考架构(IDS-RAM),为所有意愿建立数据空间的企业提供架构参考,保障企业间数据顺畅流通[1]。在IDS的架构下,欧盟27国共同提出欧洲云计划GAIA-X,试图通过制定通用云标准、参考云架构并提出互操作性要求等,创建具有竞争力的数据基础设施,捍卫欧盟数字主权。而在汽车工业领域,为了实现汽车供应链数据顺畅流通,同时满足未来欧洲碳足迹追踪和监管的要求,德国主要车企及供应链企业联合研究机构、软件供应商等,共同发起成立Catena-X联盟,联盟设有管理委员会,负责成员管理、标准编制、应用审核等功能,联盟内有统一的数据连接器EDC,车企及供应链可以通过Catena-X实现如碳足迹追踪、供应链追溯、制造及服务(MaaS)等应用,是目前规模最大运营最成功的数据空间之一[2]。
(2)日本互联产业开放框架
2019年日本工业价值链协会发布《互联产业开放框架》(CIOF),标志着日本工业数据空间布局正式开始。类似于IDS架构,CIOF也提供了一套统一的数据连接器,通过制式化的数据合同明确双方权利,并内嵌到连接器中,同时连接器可以直接与机器控制软件(如3D打印机),能实现设计数据不可见的情况下,完成工业产品的制造。
(3)我国探索工业可信数据空间
2021年12月,《可信工业数据空间架构1.0》正式发布,在国内首次提出可信工业数据空间的概念内涵和系统架构。可信工业数据空间基于工业数据“可用不可见、可控可计量”的原则,将参与方划分为数据提供方、数据使用方、存证方、中间服务方和IT基础设施提供方等5类,并分析了各方的核心需求和实现,如表1所示[3]。
表1 可信工业数据空间各方功能供需矩阵
03、数据空间的特征
(1)数据空间的组织模式
按照国际数据空间协会(IDSA)的定义,数据空间是一个用于支持安全数据交换和协作的概念和技术框架,旨在促进企业间的互操作性和数据共享。在具体落地形态上,数据空间可分为集中式和分布式两种模式。
分布式数据空间以弱中心化的模式进行组织,数据空间仅提供数据流通的通用组件或中间件(即数据连接器),数据仍储存在各主体内部,主体间可以通过连接器点对点传输数据,也可以在连接器的基础上开发各类应用,形成数据应用生态。空间层面提供包括身份管理、元数据清单、应用审核、存证、标准制定等辅助服务,确保主体间数据的互联互通和互操作性。这类模式下数据的主权能得到充分保障,数据流通较为灵活,但除链接器外的各类应用定制化程度较高,容易出现重复开发和资源浪费的情况。分布式数据空间组织模式如下图所示。
图1 分布式数据空间(以Catena-X为例)
集中式数据空间在形态上拥有一个集中式的数据交换平台,数据通过平台统一的接口进行上传或下载,实现数据流通功能。在数据上传或下载中,可以根据数据保密的需求决定是否需要加入数据控制器组件。在这类模式下,数据的主权保障相对较弱,但交换流程高效,同时中心化的平台可以统一开发部分行业共性应用或大数据类应用,能更有效的利用数据资源。集中式数据空间组织模式如下图所示。
图2 集中式数据空间(以汽车供应链管理为例)
(2)数据空间与数据交易所的关系
“数据二十条”明确提出构建规范高效的数据交易场所,并规划了从国家到地方和行业的数据交易架构。从定义来看,数据交易所是一个市场或平台,允许数据提供者将其数据或服务提供给有需求的数据消费者进行交易。数据交易所的主要目标是促进数据的买卖和交易,它提供了一个市场机制,使数据提供者能够以某种方式出售其数据,并使数据消费者能够购买所需的数据。从实践来看,交易所主要提供数据产品登记、数据交易存证等服务,主要涉及货币交易,但不参与实际数据流通过程。
对比来说,数据空间和数据交易所的区别主要有如下几点:
定义和目标:数据空间是一个跨主体的数据流通基础设施,旨在实现安全和可信任的数据交换和共享。数据交易所是一个中心式的交易平台,旨在实现数据变现、数据确权及数据入表等目标。
功能和服务:数据空间提供了一系列能力和服务,如数据集成、数据安全、数据标准化和数据访问控制等。它致力于解决数据的安全性、一致性和互操作性等问题,以便组织能够安全共享和利用数据。数据交易所则聚焦于数据交易的撮合、数据主权认证、数据产品估值等服务。
数据类型和使用方式:数据空间着重于各种类型和格式的数据的共享和协作,它涵盖了企业内部和跨企业的数据交换。数据交易所更侧重于特定类型或领域的数据交易,例如金融数据、市场数据或人口数据等。数据交易所的数据交易通常是按照一定的商业模型进行的,以满足数据提供者和数据消费者的需求。
综合来看,数据空间和数据交易所的界面如下图所示。
图3 数据空间与数据交易所的界面
数据空间内的服务平台作为数据空间的总出口,当需要与其他数据空间或企业交易数据(服务)的时候,可以通过数据交易所进行,在此场景下,数据交易所不涉及数据空间里的具体数据和应用内容,仅在交易过程中的定权、交易存证、撮合等服务。对于企业来说,一方面可以在数据空间中与其他企业交换数据,另一方面也可以将数据或者数据服务在交易所内打包卖出,产生货币收入,二者是共存、互补的关系。
04、汽车数据空间应用及架构
(1)汽车领域数据空间应用
在车路云一体化的背景下,数据空间的应用可以分为三大类应用,即汽车制造、智能网联汽车数据服务和智慧交通。
①汽车制造类应用
汽车制造类应用主要是在工业领域的数据空间背景下部署,服务于工业制造的各个环节,通过数据在企业间流通提升工业制造和研发的效率,降低成本,进一步支撑如供应链管控、碳排放追踪、智能制造等工业应用。典型应用包括供应链管理、协同研发、协同制造等。
②智能网联汽车数据服务应用
在车路云一体化的趋势下,车辆和路侧能获取到大量的高价值数据,这些数据被储存于路侧运营主体、车企、车主等不同的主体间,而通过智能网联汽车数据空间,将车辆感知及状态数据、路侧感知及事件数据以及互联网数据在主体间进行流通,从而催生如车辆UBI保险、车路协同事件提醒、协同自动驾驶训练等应用,提升车辆驾驶体验和安全性。
③智慧交通类应用
智慧交通是以路侧及车辆感知数据为主的各类服务于交通管理、交通治理的应用,通过建立城市级交通数据空间,对路侧感知数据的深度处理和定制化分析,再融合部分车辆数据,形成数据服务或者分析报告,提供给交通主管部门和服务机构,实现如信号灯优化、交通规划、事故存证辅助等应用。
(2)数据流通模式分析
汽车数据空间的流通模式可分为线上流通和中介流通两个大类,线上流通即通过平台或中间件实现平台与平台的对接,中介流通则是通过数据交易所等中介机构实现数据或数据产品的流通。如下图所示。
图4 汽车数据空间流通路径
①直接流通
线上流通途径是通过数据连接器进行数据流通的模式,主体间通过建设统一的数据流通协议和产品,形成云与云之间的可信可控连接,并在可信的环境中开展各类应用APP的部署和开发。
②中介流通
对于包装好的数据产品或服务,可通过已有的数据交易所进行中介交易,从而实现数据价值的变现。从目前数据交易所的交易流程来看,数据需要经过确权登记、交易存证、履约监督等几个环节,具体数据则不通过平台进行流转。
(3)应用与流通模式匹配
为了进一步研究应用实现路径,规划数据空间的功能架构,在三类应用的基础上,按照应用场景对数据保密性和时效性的需求不同,对应用进行进一步分类。
⊙ 保密性:指数据的保密需求程度,涉及商业机密、个人隐私的数据保密要求高,反之如信号灯数据、交通量数据则可进行一定范围的公开。此项指标将决定在数据流通过程中需要的保密手段。
⊙ 及时性:指流通过程的时延需求,时性高的应用需要数据能尽快传输至需方,数据价值会随着时延快速降低;反之部分应用对于时效性并不敏感,需要的是数据加工或分析后产生的价值。此项指标将决定数据适宜用何种形式传输。
依据这两个维度,对各应用进行分类,将形成4个象限,如下图所示。
图5 汽车数据空间应用分类图
各象限适宜的数据空间形态如下:
第一象限:具有数据保密要求不高或可开放,数据可以直接开放或仅进行简单的身份认证,无需数据控制技术,同时时效性要求较高,数据从产生到流通的时延从100ms到几分钟不等,对数据处理和传输的要求较高。对于这一类应用,宜建立车-路-云以及云-云之间的高效对接接口,实现数据标准化高速传输。
第二象限:数据保密性要求和第一象限相似,但数据及时性要求相对较低,如交通规划、场景集泛化等这类应用还需要对数据进行深度挖掘处理才能产生价值。对于这一类应用,一方面可通过建立中心式的数据空间,汇聚各方数据(如电池护照登记平台),另一方面通过数据交易所交易加工后的数据产品。
第三象限:此象限的应用涉及一些如个人隐私、企业秘密、公共安全等相关的信息,不适于进行公开或半公开的方式传输,如驾驶数据、车辆和路侧摄像头采集的图像数据、零部件制造数据等,但实时性要求相对较低。对于这类应用,需要在传输过程中加入有效的数据安全和加密手段,并且要有一定的数据控制手段,如数据连接器、数据胶囊等,保障数据流通。
第四象限:此象限对于数据保密性和时效性均有很高要求,如实时的制造控制数据、设计图纸、物流和仓储数据等,需要在保密的基础上,兼顾数据的高效传输。对于这类应用,建议采用集中式的跨域协作平台,或者深入设备层的点对点传输通道实现数据流通。
(4)汽车数据空间参考架构
基于上述分析,归纳汽车数据空间3层架构,如下图所示。三层分别为底层数据层、中间平台层和顶层应用层,其中数据空间主要集中在中间平台层的建设。
底层数据层:负责数据的生产、治理和包装,大部分是在主体内部进行,不涉及到主体间的数据交换。
中间平台层:包括通用性服务、线上流通服务和交易所中介服务(可选)等模块。通用服务包括成员编号、数据目录、身份认证、检索搜索等功能,是数据空间的基础性功能,能保证空间内数据和成员的秩序;线上流通服务包括通用连接器、钱包服务、应用认证、标准字典等服务,保障成员能顺利使用数据空间交换数据;数据交易所作为可选项,用于提供数据交易变现路径,包括确权、估价、存证等基本功能,同时交易所作为中介也会提供如隐私计算等服务。
顶层应用层:包括在数据空间的基础上开展的各类应用,具体见上文。
图6 汽车领域数据空间功能架构
05、结论
随着汽车智能化和网联化不断渗透,车、路、云所收集和持有的数据体量迅速提升,数据流通的需求和模式也不断发展。汽车领域数据空间作为汽车行业数据流通的重要基础设施,在数据要素价值挖掘方面有很大的应用空间。本文首先对国内外数据空间的发展历程进行了回顾,随后对数据空间集中式和分布式的组织模式进行归纳,同时给出了数据空间与现有交易所模式的界面关系。在此基础上,进一步归纳出数据空间3大类主要应用和2种主要流通模式,并给出了相应的匹配关系,最后整理出汽车数据空间的技术参考架构,可为产业构建数据空间提供参考。
参考文献:
[1] International Data Spaces Association. IDSA Rule Book[R], 2023.
[2] Catena-X. Catena-X Operating Model Whitepaper[R],2022.
[3] 工业互联网产业联盟, 中国信息通信研究院. 可信工业数据空间系统架构1.0[R], 2022.
作者 | 龙翔宇,于胜波,杨云鹿
来源:技术与标准研究所