一本让我深刻思考的著作——《大数据时代》读后感
发布:2016-04-05  编审:培训天地  浏览量:  

一本让我深刻思考的著作

——《大数据时代》读后感

肖琳子 经济研究所助理研究员

作为社科院的一名研究人员,我们对经济社会发展趋势的了解和把握是日常工作的重要内容。然而,当我们还在研究工业化、城镇化、信息化、农业现代化时,世界竟然已经走向数据化,迈入了大数据时代。《大数据时代》是国外大数据研究的先河之作,它的作者是被誉为“大数据商业应用”第一人的英国学者维克托·迈尔·舍恩伯格,舍恩伯格拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。认真阅读《大数据时代》后,觉得这是一部引起生活、工作与思维的重大变革的著作,是一本能够让我深刻思考的著作。下面,我来谈谈本书带给我的几点启示。 湖南省社会科学院

一、大数据的起源和特点

“大数据”这一概念起源于美国,通常用来描述数据的三维特征:第一维指信息的数据体量日益庞大;第二维指信息的种类繁多;第三维指数据变为可用信息,并且可以分析速度越来越快。大数据应用中有一个耳熟能详的经典案例:啤酒和尿布。早在1969年,全球零售业的巨头沃尔玛公司在对消费者购物行为进行分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是推出了将啤酒和尿布捆绑销售的促销手段。

随着大数据时代的到来,数据不再是一组组冷冰冰的数字,而是具有了新的活力和新的特点。数据将如能源、材料一样,成为战略性资源。2012年3月,奥巴马政府在白宫网站发布了《大数据研究和发展倡议》,将其视为“未来的新石油”,提出通过大数据加速在科学、工程领域的创新步伐,强化美国国土安全,转变教育和学习模式。如何利用数据资源发掘知识、提升效益、促进创新,使其服务于国家治理、企业决策乃至个人生活服务,是大数据时代的重要战略课题。 本文来自湖南省社会科学院

大数据将逐渐成为现代社会基础设施的一部分,就像公路、铁路、港口、水电和通信网络一样不可或缺。而与这些物理化的基础设施不同的是,数据不会因为人们的使用而折旧和贬值。大数据成为一种商业资本,这在商业界已经成为共识。比如,微软必应搜索通过集成以往的飞机票价画出未来票价走势;谷歌利用用户搜索记录判断出美国流感疫情的现状,而且比疾控中心快一两周;对冲基金通过剖析社交网络推特的数据信息预测股市的表现;亚马逊和网络影视光盘租赁公司根据用户在其网站上的类似查询进行产品推荐,同样的技术也可以运用到疾病诊断、推荐治疗措施,甚至是识别潜在犯罪分子上。事实上,大数据掀起的风暴已经席卷各个拥有海量数据的行业。其中一个有趣的案例被津津乐道:微软公司通过大数据分析处理,对新一届奥斯卡金像奖作出“预言”,结果除“最佳导演”外,其余13项大奖全部命中。 湖南省社会科学院

 

维克托·迈尔-舍恩伯格在接受记者采访时表示,大数据的核心是预测,其对人类行为以及社会问题的预测为人们津津乐道,而预测系统之所以能够成功,关键在于它们是建立在海量数据基础之上的。在不久的将来,现今许多单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代,因为它为人类生活创造了前所未有的可量化的维度。大数据已经成为新发明和新服务的源泉,而更多的改变正蓄势待发。

大数据的关键不在于数据大,而在于挖掘数据的意义。《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。我国是新兴数据资源大国,数据资源的挖掘与开发利用能力将深刻影响未来的发展。因此,学者们呼吁大数据应早日提升为国家战略,并表示,目前能够驾驭大数据技术的人才远不及社会需求,面对大数据,需要多学科交叉、各领域协作才能实现其价值。 copyright hnass.cn

三、大数据给社会科学研究带来新的挑战

大数据或将引发人类的思维模式和发展模式发生变化。在这个浪潮下,大数据无疑将为社会科学研究开启新的研究范式,提供新的研究视野,也带来了巨大的挑战。传统的经验性社会研究使用的是随机抽样的属性数据。这种现状受制于社会科学的实证研究方法,也受制于采集关系数据的巨大成本和不可操作性。但在今日大数据时代,社会化媒体使得基于社会网络的关系数据唾手可得。

科研资料总量的快速增加给社会科学学者带来了巨大挑战。当前人文社会科学研究者在自身研究领域都面临大量文献资料处理的问题。这些文献资料的数量已经大大超越了传统阅读能力所能处理的范畴,因而人文社会科学学者也将不得不借助计算机来处理完成相关文献资料,即“百万图书的挑战(MillionBooksChallenge)”问题。随着跨学科研究趋势的日益增强,传统社会科学领域引入了大量的计算机处理模式和分析方法,各类依托计算机存储媒介数字学术资源的开发,基于复杂运算和分析的计算机模拟与实证,基于事实与证据的商业预测与案件证据推理等研究议题广泛兴起,从根本上改变了人文知识的获取、标注、比较、取样、阐释与表现方式。资料的数字化改变了传统人文社会科学的资料类型,数字资源的采集、加工和处理对研究成果的获得作用日益显著。对资料的汇集、保存和综合利用更加依赖计算机的辅助,社会科学也越来越需要依赖计算机对研究过程的支撑。传统社会科学学者对计算机技术和分析技巧的缺失甚至可能影响社会科学研究的最终实现,进而将计算机分析处理能力延伸为社会科学研究者科研素养的重要组成部分。 湖南省社会科学院

 

综合已有的研究,社会科学的大数据研究具有如下基本特征:

一是所涉及资料均大大超过一般的阅读、分析和理解所能处理的范畴,是以往“不可研究”或“难以研究”的,大数据分析方法的出现提供了社会科学研究新的研究空间,提供了新的研究可能。

二是一般引入计算分析方法,其结论并非观察、思索、领悟等传统方法获得,而是通过大量数据的汇集而“自动涌现”,其理论的获得不同于传统社会科学研究。

三是构建了可持续完善和丰富的数据集和分析工具,其可用性、共享性、重用性、协作性大大增强,提供了社会科学研究者大规模协作的可能。

四是具有跨学科特征。研究需要汇集专业领域技能、数据管理技能、数据分析技能和项目协作技能,因而这类项目往往由跨度较大的不同学科的专业学者共同完成。 www.hnass.cn

五是决定研究质量的主要是数据集的质量、数量和利用方式,而研究假设相对容易。在某种程度上,数据科学家将成为人文社会科学大数据研究中的主角。

五、大数据时代的风险

大数据不仅仅带来商业和社会正能量,同时也带来了一系列重大社会问题,网络安全和个人隐私成为大数据时代人们极为关心的个人和社会问题。个人隐私,不同的人可能有不同的理解,每个人都有自己的容忍限度。一些人不愿意让别人知道自己的任何信息,希望自己的隐私孤立于社会或公众的注意之外,免受打扰,不想被公开或不受大众控制,而另一些人却希望自己生活的每一个细节都展示给世界。在一个相互联系的网络社会,完全自由的那个人是不存在的。政府在大数据时代面对新技术的出现,需要制定更为明确和严格的法规条例,规定每个公民必须服从一套简单的规则,这些规则必须被强制执行。每个人必须受到社会规范和制度控制,且公民要树立隐私保护意识。大数据和相关技术在定义隐私、保护隐私和侵犯隐私方面都扮演着重要角色。 本文来自湖南省社会科学院

大数据是一种资源,也是一种工具,虽然它能够引起我们生活、工作、思维的重大变革,但它依然存在一定的局限。正如作者所说:“大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。”

文章来源:《培训工作简报》2015年第1期

湖湘智库公共号 关闭