您现在的位置:首页 > 行业资讯 > 行业动态 > 详细信息  
高书生:文化大数据建设 开启不一般的新基建
2020/11/30    来源:经济日报-中国经济网

2019年科技部等六部门印发的《关于促进文化和科技深度融合的指导意见》中提出,加快国家文化大数据体系建设。据经济日报-中国经济网记者了解,截止到发稿时,已有10余个省份相继出台了推进国家文化大数据体系建设的方案或实施意见。11月19日,国家文化大数据8个区域中心首次公开亮相并正式授牌成立,至此,国家文化大数据体系建设正在全国稳步有序推进。

日前,在“文化大数据产业论坛”上,中宣部文改办一级巡视员、副主任高书生表示,文化大数据建设是宣传文化战线的新基建,是为了适应新时代文化建设的新要求,顺应文化和科技深度融合的新趋势,加强宣传文化事业发展的信息化基础的重大举措。“文化大数据建设,开启了不一般的新基建。”

文化大数据的五个关键词

高书生用五个关键词梳理了文化大数据体系架构:供给端、生产端、需求端、云端以及有线电视网络。四个端通过有线电视网络连接到一起。

供给端主要有三个库:第一个是中国文化遗产标本库;第二个是中华民族文化基因库;第三个是中华文化素材库。高书生指出,供给端是文化大数据与其他大数据最大的不同。

中国文化遗产标本库,主要是依托现有的工作基础,把这些年来国家开展多次文化资源普查取得的数据,导入国家文化大数据体系底层关联集成系统,对普查数据作标准化、结构化处理,不需要再投入数据采集资金。中华民族文化基因库,主要是对革命博物馆纪念馆以及国家一级博物馆收藏的珍贵文物进行高精度数据采集,导入国家文化大数据体系底层关联集成系统,完成标注、关联,提取中华文化的元素、符号和标识,形成中华民族文化基因库。中华文化素材库的来源是多元化的,其中一个途径就是通过对中国文化遗产标本库和中华民族文化基因库积累的数据进行解构,形成中华文化素材库。此外,目前许多文化机构建成了各类数据库,但都是数据“孤岛”,如果把数据导入国家文化大数据体系底层关联集成系统,就可以通过有线电视网络实现全国联网,在全国范围内展示、开发和变现。

生产端包括三个方面的内容:第一个数据采集和清洗,第二个是数据标注关联,第三个是数据解构和重构。这三项统称为数字化文化生产线。

需求端就是利用新技术、新装备,打造场景化、沉浸式、互动性的文化体验场景:第一个是文化体验园,规模比较大,主要是在旅游景区和旅游度假村。第二个是文化体验馆,主要面向中小学校和商场。第三个是文化体验厅,主要面向社区,包括城市社区和农村社区,还有就是新华书店等。

“我想提醒的是,文化体验园不等于现在的主题公园,最大的区别是文化体验园的内容不断的更新,天天更新、时时更新,有一个庞大的生产体系在里面”。高书生说。

云端主要是依托有线电视网络来架构,叫国家文化专网。国家文化专网包括三个层次:第一个是省域中心,任务是把本省内的供给端、生产端、需求端连到一起,实现数据、产品的确权、交易和结算、支付。第二个是区域中心,目前已授牌8个,其中6个是行政大区类的区域中心,还有2个是专业化中心,他们的任务就是把省域中心连到一起,达到承上启下,上连接全国中心,下连接省域中心。最后一个就是全国中心,区域中心的基础之上形成全国中心——国家文化大数据体系的中枢。

文化大数据建设遵循一般原则

第一坚持物理分散、逻辑集中。现在大量的数据实际上是分散在各个文化机构,包括公共文化机构和文化生产机构,像电视台、出版社、演出公司、设计公司等等。如何把他们集中起来?高书生表示,文化大数据建设也遵循国家大数据建设的一般原则,坚持物理分散、逻辑集中。“如果把数据集中到一起,既不现实也不必要,遵循物理分散的原则,各个文化机构自建或租赁数据中心,但必须逻辑集中,执行国家文化大数据体系的一系列标准,当前最重要的是导入国家文化大数据体系的底层关联集成系统。”

标准是什么呢?高书生提出了标准三个最核心的点:第一标识每个数据,第二实现数据之间的关联,第三数据能够解析。“这是逻辑集中里最主要的,也是文化大数据底层关联集成系统最核心的。”

此外,文化大数据建设与国家大数据建设一致,合理布局数据中心,构建区域级数据中心集群和智能计算中心。“要建设全国一体化数据中心,千万不要做成数据孤岛。”

文化大数据建设的不一般

有相同也有不同,在高书生看来,文化大数据与其他大数据相比,也有自己的特点。“文化大数据体系是一个开放的体系,不是一个封闭体系。”

首先,需求不是来自于需求侧,而是来自于供给侧。“比如中华传统纹样、文物藏品图像、红色经典影像、珍贵历史影像、中华经典古籍、古代服饰图解、传统农具图鉴等等都是供给端的。”高书生进一步阐释。“理解大数据首先从供给端开始。”文化大数据体系不只是消费互联网,更是生产互联网,也就是产业互联网。消费对应的是生产,而产业互联网除了有生产端,还有供给端、需求端。

其次,国家文化专网在文化生产上是闭环,但闭环不等于封闭,而是为了数据安全。高书生指出,标本库和基因库都是国家所有,是具有公益属性的专业数据库。“公益属性就是国家出资建设,是国家行为,如果说有版权也是公权,而非私权。”

第三是生产线守正不守旧。文化大数据来源于国家的公共文化机构和文化生产机构。“在内容上我们用的是守正,数据来源要保真。创作要严谨,互动有序、内容要把关。同时我们坚持创新。”高书生说。

第四是生产闭环消费开环,“在生产过程中,为了保证数据的安全必然是闭环,但是消费必须是开环的。”

关联数据是核心资产

如何理解国家文化大数据体系这些数据的关系呢?高书生提出了六个点。

一是在国家文化大数据体系中,数据是核心要素,而且是生产要素。

二是经过关联后的数据是核心资产。“文化大数据当中最有价值的是关联数据,也就是数据之间的关系,数据和实物之间的做了关联以后的数据,这是核心资产。”

三是数据关联是核心生产力。生产端生产线要做的就是把数据关联到一起,这是核心生产力。

四是数据的变现是核心驱动力,如果没有变现数据都是死数据。

五是数据安全是核心竞争力。如果没有数据安全,这个体系就没有价值。

六是生产端、生产线、生产网是这个体系核心环节。