六禾创投总裁王烨:大数据和未来

转载2016-11-22

上周“2016年大数据行业应用高峰论坛”在卓美亚喜马拉雅酒店举行,在本次高峰论坛上,六禾创投总裁王烨分享了关于大数据和我们的未来的一些看法,本篇文章转自--鸵鸟电台,作者:daoerji。

AlphaGo赢了李世石之后,也将人工智能、机器学习这些业内知识做了一个全民的普及。以我个人的观点,AlphaGo赢李世石这件事,证明了机器是个非常好的学生,有很强的记忆能力、学习能力,而且它很勤奋,会不停的去学。据说AlphaG有3500万个棋谱在里面不断的学习。李世石在开局的时候并没有按照常规去走,定式上面没有这一招。但是AlphaGo根据自己的学习,走出了大家没有想到的应对的招数。其实在五盘棋里面不断的看到,它不仅仅只是一个勤奋的学生,自我学习真的让大数据、人工智能、机器学习给大家展开了一个新的畅想的空间。如果它不光能够超越你,还能够帮助你想到解决方案,那么这个世界,会变得更加有意思。

我们看到的一个现象,当数据量大到一定程度的时候,它已经发生了一个从量变到质变的过程。这个质变可能会对人类社会的进步,发生很大的推动。聊过AlphaGo,比较简单的无人驾驶大家也都耳熟能详。前一段时间谷歌无人汽车发生一起交通事故,但是算下来还是有一些偶然的因素,无人驾驶也是对数据不断的学习,基于数据来做一个决策。举一个癌症的应用,斯坦福大学在2011年做的研究。他们拿了活体的样本,就是癌症、肺癌活体的样本,希望了解活体的样本和“能否很好的来预测病人的发病情况”。他给这个机器只给了三个数据:

1.活体样本,我样本给到你了。

2.我给这个活体样本打了通用的指标描述。

3.这个病人,有这个活体样本的病人,最后生存的时间有多少。

希望这个机器来学习,因为对他们来说,他们也不知道怎么样很好的判断这件事情。最后的结果是什么呢?

最后的结果是机器最后给了11个指标,它给出了11个标值。有这11个标记的病人,往往会导致癌症的发病。有意思的是这11个里面,有8个是人类已经了解,但还有3个是我们未知的。所以“大数据”量大到一定程度的时候,当它发生质变的时候,我们经常会发现我知道结果,但是我不知道原因。以前所谓的“因果”关系,当数据量积累到一定程度之后,人类的大脑开始无法处理相关信息,你往往就只知道结果没法知道原因,但是可能结果对于我们来说更重要。人类可能第一次意识到,我们的大脑是不够来应对这个世界的复杂。

药物不良反应,在用药过程当中其实有很大的问题,每一种药在上市前需要做“药物不良反应”的测试。但是比较糟糕的是,一个病人可能同时用几种药。那么到底什么不良反应,是由于某种药来引出的?你想想一下,你可以用老鼠试验,可以用人体来试验。但是你很难让一个人同时服三种药,让他来临床测试。这个时候海外科学家思考这个问题,我希望在搜索引擎上发现有不同的病人,输入不同的症状,同时输入不同药物,用这样的手段,实现跳过原因,直接去看最终的结果。其实这样的一个结果也发现,应用搜索引擎的时候,他们很快的能够让很大范围内,几千种药的范围内缩短到几十种药、几种药。同时两三种药被病人输入“我服用了这几种药品,出现了负面影响”。当这样的事情发生,当我们的人脑意识到自己没法有效的做一个理性判断的时候,很多决策其实真的会发生本质的变化,超过我们自己想像的变化。

我们为什么对大数据这么感兴趣呢?这么觉得激动人心呢?我们年轻的小伙伴写“技术改变生活”,其实技术很多时候推动了商业,商业推动了社会的变革。如果你回想一下过去500年的变化,15世纪的印刷术真的是极大程度上推动了整个文明的发展。因为没有印刷术之前,我们对于很多技术的了解是有限的。宗教上,比如:基督教要感谢15世纪的印刷术让《圣经》广泛的传播。这是15世纪印刷术,直接影响了文艺复兴。18世纪工业革命,大家感同身受了。当年的鸦片战争,其实从某种程度上来说,我们是这次工业革命的直接受害者。工业革命、印刷术都让社会产生了很多的改变,有一些工作就永久性的消失了,有些工作就完全的开始了,劳动力得到了释放,社会财富得到了进步。21世纪信息时代,对我们来说,应该是从90年代后期开始,到我们发现可以跟世界连接的时候,其实也是让我们人类社会进入了一个新的领域。

我们同时观察到的是,如果你回到17世纪、18世纪之前,其实生活的方式变化不是很大。巴非特说过,他说:“我们要非常感恩,因为如果你回到摩根时代有一个马桶已经很期待了。”那个时候美国整个地下卫生系统刚刚建立起来,我们的故宫到很晚的时代还是用马车把生活污水污物拉出故宫的。或者回过头去看20年的变化,也是非常巨大。我们进入了一个不断加快的革新速度的时代。

大数据对我们意味着什么呢?

实际上大家在思考一个问题,当数据太多了之后,多元以后对我们形成一个挑战。AlphaGo为什么能够战胜人类?因为它用了很多电脑,基于云的电脑来做。当然,这么多电脑来对付我一个人,这个事情是很难类比。如果用一千美金作为一个标准,这一千美金是一个普通电脑。一千美金它能够计算代表的计算能力在什么样的状态当中?这里有摩尔定律,指数级的增长,就像当年在国际象棋格子上放米似的,放到20格你就会发现,一个国家的米都要被拿掉了。我们现在出在这样的状态,可能我们一台普通计算机对应的大脑计算能力只相当与老鼠跟一般的昆虫动物之间。但是如果你相信这个指数级增长的话,可能在2040年左右,基本上就能够达到一个普通人。再往前,乐观的话,到2060年的时候所有人类大脑计算能力就比不过一台计算机的能力。我们现在一台iPhone可能能把图书馆的东西装进去。

这样的事情如果发生,意味着什么?我们的机器就太智能了。如果生产了这么一台有计算能力的机器,那它一定应该帮我们做一些什么事。

我在美国看过一个视频,过去的十年全世界科学家花了200亿欧元建了一系列的远程的、世界最大的、集群式的太空望远镜来观测宇宙,是在智利。为什么要在智利?这个建筑群是有建筑的高度第二高度就是这里,因为要非常干燥的地方,灰尘非常少,能够让他们没有任何人工的电磁波的干扰情况下观察星球。这位科学家住的地方就像一个绿洲,是一个封闭式的环境,有植物、游泳池,有各种植物的生长,他们就生活在里面。但是出来之后你就会发现,完全像是沙漠一样,非常炎热、非常干燥,没有任何少量细菌生活的。所以我也在想,人类已经花了很多时间探索地球,人类开始探索虚拟的世界。下一步,我们真的是要走到地球以外去了。因为我们的好奇心一定会让我们朝着这个方面发展,如果这件事情都发生,在所有人的有生之年能够看到很精彩的世界的变化,这个变化可能会比工业革命,可能会比印刷术给人类带来更大的变革。

原来数据“隐私”肯定是一个问题。大数据核心价值就是所有的数据都不想删,因为我不知道这个数据对我有没有用,或者这个数据跟别的数据碰在一起的时候有没有用。这就对我们的隐私提起了很大的挑战。机器变的很强大以后,怎么样控制?这其实也是所有人需要思考的。经过AlphaGo这件事情,可能所有的人都意识到,不管人类喜不喜欢,大数据时代已经来临。虽然我们有些担心,但是有更多的各领域专家能够因为数据的产生,在更广泛的、广阔的平台上进行创新、创业。所以我们也非常希望,能够利用这样的一个平台,把技术专家、创业者、孵化器合作在一起,让我们一起来探索今后20年,可能是人类历史上最精彩、最灿烂二三十年的一个数据的变化。

更多创业相关的干货内容,请进行关注我们疯狂BP创业干货专题。