华侨网 科技教育 圆桌|场内交易日趋规范但所占比例不高,数据流通市场期待破局

圆桌|场内交易日趋规范但所占比例不高,数据流通市场期待破局

“创·见未来”蚂蚁集团数字科技开发者大会4月26日在杭州举行。

·“我们之前所有对于个人数据的操作都是平台导向型,我可能在这个平台有一套身份,在别的平台有另外一套身份。但我们是不是能够以平台为中心,转向以用户为中心?”

·“我们现在的可视化技术,两百年前就发明了,第一张饼图是19世纪做出来的,人和数据的交互能力两百年都没有什么进步,直到ChatGPT出来之后才有了进步,人类第一次有了用自然语言和数据对话的能力。”

“创·见未来”蚂蚁集团数字科技开发者大会4月26日在杭州举行。

“个人数据账户可能是未来几年很新或者很有前景的小方向。”“场内交易的比例并不是特别高,期待国家发改委、国家数据局年底可能会给一个大层面的指导办法。”“数据要素市场的发展,可能把更多还没有被拿到通用人工智能发展过程中的数据,通过某种方式重新引入到这个市场。”

4月26日,浙江杭州,在“创·见未来”蚂蚁集团数字科技开发者大会数据要素分论坛上,多位相关领域的嘉宾就当前热门的议题分享观点、展开讨论。随着数字化转型进程加快,来自顶层的政策设计、数据交易所的具体实践和数据要素市场建设对人工智能热潮的影响,成为关注焦点。

数据资产管理未来几年或有大动作

中国信通院云计算与大数据研究所大数据与区块链部副主任闫树回顾,人类对于数据的操作能力有三次大飞跃。

1970年关系型数据库的诞生,改变了数据分散于信息系统、难以操作的情况,技术人员开始拥有查找、分析数据的能力。这是数据作为一种要素开始显现价值的最初阶段;到了90年代以后,数据仓库方面的技术取得了不断进展,数据在生产中的意义进一步涌现,可以对数据进行多维度的分析;到了2000年以后,数据的大规模集中使高维度分析成为可能,为数据进行统一的存储计算和海量数据治理提供了基础。

“一开始数据来源于一个个业务系统,一个个纵向的烟囱,后来数据从业务系统中慢慢抽象出来,有了分析应用、数据仓库、数据湖、数据治理等,对于各种各样存储形式进行治理,业务系统就变成‘手’,慢慢地有了智慧决策的‘脑’,就是从业务系统到数据系统的诞生。但我们发现这样依然不满足,手和脑之间总还是需要融合,业务系统和数据系统需要打通。”闫树说,“慢慢的,我们发现盯住数据的不光是企业内部,现在各种政府监管、市场客户、外部数据源等都对数据有一些需求,这也是数据成为生产要素的第三个阶段。”由此,数据作为生产要素经历了价值释放。

对于中国的数据要素相关政策,闫树则回顾道:最开始是在2014年“大数据”这个词被写入政府工作报告,当时国家更多地把数据作为一种新的信息技术。到了2016年3月,支持大数据战略被写入“十三五”规划,把大数据的维度和作用扩大了。2017年,十九大报告提出推动大数据与实体经济融合,那几年的政策重点是数实融合。2019年之后,“数据要素”这个词逐步替代“大数据”。后来,“十四五”规划强调要建立制度,在数据要素层面得到了更固化的认可。最重磅的还是2022年底的“数据二十条”(即《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》)。

闫树表示,“数据二十条”最重要的一个要点是数据要有充分的供给和合规的流通。他重点强调了数据资产的管理,“可能是未来几年非常大的一个动作。”

个人数据方面,国内的讨论还属于刚刚开始的阶段。“个人数据账户可能是未来几年很新或者很有前景的小方向。”闫树说,“我们之前所有对于个人数据的操作都是平台导向型,我可能在这个平台有一套身份,在别的平台有另外一套身份。但我们是不是能够以平台为中心,转向以用户为中心?这可能是观念上的区别,就是我的数据我做主,我把自己的数据定义清楚后放到这个平台、放到那个平台,不同的平台调用我个人的数据,这样的话我们会把之前《数据安全法》里面的数据可携带权等一些概念真正落到实处。”此外,数据信托也是一种新兴的个人数据治理架构,未来很可能也是一个很大的政策趋势。

闫树谈到,数据要素流通有三种形式:开放、共享、交易,而交易可能是市场化的核心环节。就目前数据流通市场的现状而言,场内交易越来越规范,但相比场外交易所占比例并不高。通过政策给数据交易所更多权责,摆脱“我为什么要走进交易所增加我成本”的困惑,可能是今年数据领域非常大的一个变化。

北数所的应用实践

基于闫树的分享,北京国际大数据交易所(以下简称“北数所”)技术产品部负责人王海洋也指出,场内交易的比例并不是特别高,“期待国家发改委、国家数据局年底可能会给一个大层面的指导办法。”

以北数所为例,王海洋分享了数据交易所如何推动数据要素流通工作。他表示,北数所两三年以来探索的新型数字交易范式,可以大致分为四个创新点:第一是交易模式,从农贸市场的交易模式转化成现代的交易所模式;第二是技术,做了很多隐私计算的应用,“北京市的定位也是隐私计算等数据流通相关加密技术的试验田、靶场”;第三是规则保障;第四,北数所想成为一个平台、中间撮合方和基础设施。

以建设国家级的数据交易所为目标,王海洋分享了该机构的未来技术应用架构。

北数所从三个方向提供服务。第一个是数营:数据控制方,“面对数据的控制方,也就是数据应用方,我们做了一些社会数据专区的建设。”王海洋说,“什么是社会数据专区?我们一开始拿公共数据、北京市政务数据做了很多工作,比如我刚才说的隐私计算,后来我们逐步建立社会数据专区,包括交通、气象、能源等。”

第二个是数享:数据需求方。“我们会做一些数据交易所本来要做的工作,数据交易的撮合服务,还有一些基础类服务,以及定制化的数据服务。”

第三个是数治:政府管理方。“我们其实也落实了很多政府的监管需求,包括一些交易规则制定和数据资产登记服务。”

王海洋认为,数据价值流通领域非常重要的是合规。如果致力于把技术实际落地,有数据需求方买单,要克服很多合规的问题,“就像隐私计算、区块链为什么这么火?为什么交易所现在比较热门?因为它们本质上是从技术和身份上给数据交易做一些合规的保障。”

AI与数据民主化

在圆桌讨论环节,最近大火的ChatGPT成为一个话题。

大模型对数据有非常大的依赖,高质量的数据决定了大模型的天花板。“数据要素市场的发展,可能把更多还没有被拿到通用人工智能发展过程中的数据,通过某种方式重新引入到这个市场,为人工智能技术的发展提供一个最基础的保障。”蚂蚁集团数字科技事业群技术部副总经理林雨铭表示。

上海脉策数据科技有限公司CEO汤舸从两个角度进行了分享。第一个是开源和闭源的关系。“我们知道现在的大模型,其实OpenAI是闭源的,但是LaMDA(谷歌的大语言模型)它们都是开源的。但数据市场是闭源的,所以闭源和开源的东西结合在一起,是闭源冲击开源,还是开源冲击闭源?这是一个很有趣的话题。”汤舸判断,未来可能需要有更多的大模型,更私有化地部署在更多闭源的数据要素市场上。未来的数据持有方可能都会发展自己的通用型大模型技术,能力可能没有OpenAI那么强,但是自己够用了。

第二个角度是关于数据民主化的话题,就是人有没有办法解读数据的问题。“这个问题特别重要,因为以前人类没有办法解读数据,所以我们会依赖像Gartner这样的咨询机构、《经济学人》这样的杂志、专家。”汤舸表示,“实际上专业人士和技术人士是横跨在普通人与数据之间一道非常强的壁垒,这个壁垒使得人和数据的接触受到了很多影响。我们现在的可视化技术,像画图表、地图可视化技术,两百年前就发明了,第一张饼图是19世纪做出来的,我们根本没有什么进步,人和数据的交互能力两百年都没有什么进步,直到ChatGPT出来之后才有了进步,人类第一次有了用自然语言和数据对话的能力。”

所以,接下来人工智能的发展、通用人工智能的发展,对人类怎么更好地解读数据会产生更强的作用。汤舸举例说,现在上国家统计局网站查数据,可能体验并不好,但在未来,可以在网站上问任何问题,“它就像国家统计局局长一样回答你”。类似这样的应用会改变人类和数据的对话方式。

免责声明:本文仅代表作者个人观点,与华侨网无关联。其原创性及文中陈诉内容未经本网证实,对本文内容、文字的完整、真实性,以及时效性本网部作任何承诺,请读者自行核实相关内容。如发现稿件侵权,或作者无意愿在华侨网发布文章,请版权拥有者通知华侨网处理。

聚变能源公司“能量奇点”Pre-A轮融资近4亿,米哈游继续追加投资

二次感染新冠会增加“长新冠”的风险吗?听听科学怎么说


联系我们

联系我们

514-3979969

邮箱: cpress@chinesepress.com

工作时间:周一至周五 10:00-16:00,节假日休息
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部