数据、数字化和数字经济 | |
Date of publication:2022-10-13 Reading times:48 字体:【大 中 小】 | |
传统的数据,主要是指数字和字符串。表格是传统数据最为普遍的一种展示形式,包含许多行和许多列。不同学科对行和列的称呼是不一样的。在计量经济学中,行被称为“观测值”,列被称为“变量”;在机器学习中,行被称为“示例”,列被称为“特征”。 随着社会的不断发展,数据形式越来越多样化。图片、声音、视频均可被视为数据,作用跟数字和字符串类似。无论是数字、字符串,还是图片、声音、视频,它们全都以0和1两个数字的形式存储于电脑里面,该过程就是“数字化”过程。 迄今为止,数字经济的概念并不清晰。目前广泛使用的一个概念,来自《数字经济及其核心产业统计分类(2021)》,原文如下:“数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态”。上述概念是为统计实践服务的,并不严谨,我认为数字经济仍然处在工业经济的大范畴之中。 对数字经济这样的新生事物,不宜把概念定义得太死板,松松垮垮些,反而更好。我建议,把数字经济定义为:“数字经济是以数据资源为关键要素的一种新经济形态”。其中的数据资源,是与“数字化”所相应的新型数据资源,即我们通常所说的“大数据”。很多人对大数据的理解聚焦于“大”这个字,意指观测值非常多、变量个数非常多。我认为,对大数据更为合适的理解在于“动态”两个字,观测值是动态的、变量个数是动态的。大数据不能由传统调查来获取,而是需要借助动态采集工具,例如爬虫技术、手机类通讯工具等等。当然,大数据所包含的数据形式更为丰富,图片、声音、视频全部都是数据的范畴。在数字经济时代,数据的处理方式也要不断进展。传统的计量经济学,尤其是通过巧妙假设探求因果关系的内容,用于分析大数据是非常不合适的,机器学习、深度学习才是与大数据相对应的数据处理方式。背后的道理很简单,大数据是真实世界的自然反应,为什么我们还要使用扭曲后的数据来验证某种理论?社会要发展,时代要进步,多年后回头来看当今的社科研究,将会发现,很多所谓因果关系的实证研究都是学术垃圾。在数字经济新时代,我真心希望大家能够尽快转变观念,学习和掌握真正的数据处理技术,为社会发展真正贡献力量,而不是局限于八股规则下的论文发表。 转发自:“E校挺好” |
|
Previous:智库视点|发达国家战略性新兴产业发展经验与启示 | |
Next:数字经济发展方兴未艾 |