2016年11月22日,在北京举办的主题为“社交大数据的掘金之路”的SAIF金融E沙龙活动上,亚马逊前首席科学家,大数据、移动社交技术和消费者行为专家安德雷斯•韦思岸(Andreas Weigend)携新书《大数据和我们》,与阿里数据经济研究中心秘书长潘永花展开对话,分享了社交大数据对于个人、商业和社会所带来的影响,并深入探讨了如何更好地从后隐私经济中获益。
“让人创造的大数据服务于人”
亚马逊前首席科学家,大数据、移动社交技术和消费者行为专家安德雷斯•韦思岸分享了自己对于数据价值的看法,他指出数据的价值取决于它对决策带来的影响,“不用数据做任何决策,这个数据就是零。”
韦思岸所著的《大数据和我们》一书阐述了个人和公司可以如何基于数据来做出决策。“比如,百合网就是根据信用积分来匹配婚恋对象的;也许到了2020年,政府会根据个人信用来创建工作岗位,应聘者会因为个人信用积分而只看到部分招工信息,信用积分会逐渐引起个人的关注。”
安德雷斯•韦思岸介绍道,《大数据和我们》一书总结了围绕数据的几大权利,如访问自己创造的数据的权利、挖掘数据的权利等。“一个组织机构可以从我们个人身上挖掘数据,打造出信息产品,这有助于公司、个人做出更好的决策。”
同时,所有人都可以控制数据挖掘。当数据被了解和分析之后,个人能从中得到什么好处?“比如当你的音乐习惯被了解之后,会获得更有针对性的相关歌曲推荐。”安德雷斯•韦思岸举例道。他也指出,个人对挖掘过程也拥有知情权,因为这涉及到数据的安全和隐私问题。此外,数据还有被修正的权利、被掌控的权利、实验的权利以及被导入导出,更换挖掘对象的权利。
书中还探讨了人际关系数据的价值体现。这涉及对客户的目标人群进行定义,并通过社交图谱完善对他们的了解。“比如Facebook去年收购了一个可以查询社交图谱数据的专利,某个朋友的信用积分也许就会影响到你本人的信用卡额度。”安德雷斯•韦思岸解释道。
如何对浩瀚的数据去伪存真?提及这个问题,安德雷斯•韦思岸指出,点评类网站用户点评的真实性有待考量,而这就涉及到数据素养的问题,即怎样和数据打交道,正确识别、使用数据。
“亚马逊为什么邀请我这个物理学家来做首席科学家?因为数据科学不是计算机科学,而是更加精准的实验,这是我们擅长的地方。”他表示,数据并不完美,只有拥有数据素养,才可能对数据是否值得信任做出判断。此外,创造的数据永远都会存在,并不会因为删除而消失,而这也是涉及到数据素养的一个方面。
《大数据和我们》一书还指出未来大数据在教育、健康领域引起的革命,它将平衡医疗领域资源稀缺的问题。该书同时还提到了大数据可能带来的负面后果,比如遗传基因缺陷的数据可能会给患者银行贷款带来障碍。然而,“数据是有关人的数据,是人创造的数据,而且是为人服务的数据。”安德雷斯•韦思岸最后总结道,希望大家对“怎样更好地使用大数据,使其发挥更大的价值”有更深入的思考。
透析阿里巴巴的大数据生态
阿里数据经济研究中心秘书长潘永花在主旨演讲中,重点介绍了阿里巴巴在大数据实践方面的情况。
今年,谷歌AlphaGo的国际象棋人机大战引发了社会对于智能机器的大讨论,但作为数据研究者,潘永花更看到了其背后隐含的技术意义。“AlphaGo的背后实际上是云计算加上大数据。”她指出,阿里巴巴的快速成长也正是基于互联网平台所延伸出的“云+大数据”的技术。
潘永花介绍,阿里巴巴遵循从业务数据化到数据业务化的理念,即从IT时代业务中积累的以查询、报表为主要功能的数据,过渡到以数据为驱动业务的核心要素的DT(Data Technology)时代。“我们认为,未来智慧商业的基础就是有数据、有算法、有产品。”她指出,数据的来源既有“云”也有“端”, 但产品要实现后端数据和前端消费者,或者产品用户的互动,才能真正实现支撑商业的目标。
阿里巴巴如何实践业务数据化和数据业务化?潘永花介绍说,业务数据化主要围绕电商业务,“提高电商运营的效率,提高决策能力、降低运营成本,优化消费者体验等这些是围绕业务数据化展开。”她以今年“双十一”为例指出,为消费者提供全面的个性化服务正是基于业务数据化实现的。
而要实践数据业务化,首先就要具备强大的数据能力。潘永花坦言,阿里巴巴的数据是有局限的,是通过越来越多的外部数据加上自身的数据能力进行对外输出,首先输出到生态,包括商家及合作伙伴;其次输出到社会,服务不同的行业,如金融、交通、教育等。她表示,目前数据仍以电商生态为主,但是随着接触的生态越来越多,包括微博、高德、UC浏览器、搜索、视频等数据也逐渐进入阿里生态中,阿里巴巴将打造一个立体的数据平台和生态。
“阿里巴巴的大数据生态体系分为存、通、用、生态。”潘永花介绍,在存、通、用的过程中,阿里摸索出了数据标准化问题,数据安全管理问题,从而形成了较为完整的、能够保障整体大数据应用顺畅运行的生态。事实上,从今年“双十一”天猫1207亿人民币的销售额,便能看到其背后大数据生态运行的成效。在电商作为核心业务的基础上,阿里大数据应用还包括物流、营销,乃至金融、医疗、气象环保等。
在互联网金融浪潮席卷中国的当下,阿里巴巴也推出了名为“蚂蚁小贷”互联网金融产品,该产品基于相关运营数据、消费者评价数据的综合评估数据模型而成,“我们称之为‘310’,即3分申请,1秒审批,0人工干预,风控的坏账率可以降到1%左右。”
潘永花表示,这是大数据带来的明显价值,也是数据业务化的核心表现。此外,阿里巴巴的个人征信系统芝麻信用、物流平台菜鸟物流以及与杭州市政府联合启动的“城市大脑”项目,都是该公司数据业务化的实践。
大数据怎样参与美国大选?
伴随着喧闹的美国大选的尘埃落定,美国社会开始反思这场选举背后所隐藏的一系列问题,其中,对于社交数据的利用便是其中之一。为此,在活动的讨论环节,安德雷斯•韦思岸和潘永花针对社交数据、数据安全等问题展开了精彩的对话。
“在这次大选中,美国两党都很好地使用了大数据。”安德雷斯•韦思岸肯定了两党在使用数据上的效果,并同时举例指出,从表面上看,通过搜集各类投票人的数据,针对不同偏好进行游说等行为侵犯了个人隐私权,但事实上,这些大部分来自于社交网络的数据早已被广泛利用和传播。
潘永花则表示,数据是阿里巴巴的生命,数据安全也是阿里巴巴的工作重点之一,公司通过规章制度、组织结构、技术管控三方面来保护消费者隐私。她强调,随着我国《网络安全法》的颁布,中国在个人信息和隐私保护方面也正在逐渐完善。
尽管有不断完善的法律来保障公民隐私安全,然而,这些从社交网络搜集来的个人隐私数据对于商业而言是否真的有可利用的价值?针对观众的这一提问,潘永花认为,社交媒体应用的场景就是营销领域,从阿里巴巴的数据业务化的成功应用可以看出,这些数据的主要用途为营销和风控,“营销是最适合的场景。”
对此,安德雷斯·韦思岸补充说,如何定义营销非常关键。“单纯的广告不能引发消费者兴趣,但通过推荐,让别人基于你的推荐来做决定,这样的营销就更容易成功。”他强调,基于这些数据能够进行怎样的利用,才是未来社交数据的革命。