Pages - Menu

2019-06-10

聊聊人工智能和个人选择

熟悉我的人都知道,我是不相信人工智能在现阶段有任何可能取代人类,也从来不相信机缘巧合和命运。有人觉得我太过偏执,甚至有人觉得我不可理喻,既然你点开了,那今天不妨我们就这个话题来探讨一下。

既然既定在先是讨论观点,那全文以口语化语言为主、以达意为目的,没事喜欢咬文嚼字、讲政治正确的,也别来挑刺,挑了我也不改。:)

隐约记得国平老师上课时候表达过这样一种意思,当你想要去忽悠人的时候,一定记得取一个高大上的名字,否则就你那low到爆炸的词语,是不足以吸引他人投资的——毕竟你在这儿空口胡说,人家可是从口袋里掏真金白银啊。

细想,国平老师也算是年过半百,身经世事。说出这种话,自然也不会是信口胡说,可这理究竟对不对呢?细想下来,就计算机、互联网行业而言,还真不假。无论各位看客关心或不关心时事,你都会或多或少的听说互联网+、人工智能、大数据这些科技高频词汇,而这些词乍一听宛如新生的初日,但那一个不是对原有事物的升华呢。

先说说“互联网+”,我没记错的话,“互联网+”应该是马化腾在全国两会上的提案中的一个词,旨在让现在社会中的万物皆可接入网络(即IoE,Internet of Everything),通过统一的终端经由不同的APP进行管理。各种管理类APP可以说是数不胜数,多到你我听说又要装一个APP的时候一个头两个大,甚者摆出“我手机空间不够”为借口拒绝。但凡对行业有认知的人,都应该明白,“互联网+”的重头从来不在前面的互联网,互联网不知道都有了多少年了,关键在于那一个+,互联网只是一个集成和展示的平台,后面一个简单的+里包含了太多太多的可能,各行各业,各种不同的标准规范,各种外界的、内在的、政策的、人为的阻力等等,你以为这些积累已久的矛盾,是互联网说解决就能解决的?互联网+,你没事还想通过互联网给自己的银行账户++(自增操作,意味着余额不断增加)呢,你猜你研发出这样的软件,银行愿意部署不?

另一个热门话题是人工智能,人工智能听上去好大好大,真是,机器都具有人的智慧了,人类文明要灭绝了!天呢,鬼才信。对行业有了解的人都知道,最早的人工智能在上个世纪就开始了,但受限于那个落后的时代,机器硬件的发展还没有现在的水平,理论也还没发展到机器学习的程度。可以和那个年代的人工智能划等号的是另一个词,叫做“专家系统”。不知道这个词大家听说过没有,这词也很高大上,但实际也很简单,它旨在用机器模拟人推理的过程。专家系统的表示术语里面用的是知识库+推理机,用的就是离散数学里面那一套数理逻辑(析取、合取、命题逻辑、谓词逻辑等等)。当年这玩意还是瞄准了医学方向,做这个做的最好的Stanford的MYCIN系统,它旨在协助医生根据血液情况判断使用抗生素。

当然,虽然专家系统看上去很美好,但理论基石奠定,随着应用人们发现它在特定领域的表现很好,但是并不能推广展开到全领域,而专家系统的理论也趋于完善,一些既定的缺点难以克服。于是,第一次人工智能的遇冷就这么来了。

之后也有各种改进,各种优化模型被提出,但这些终究不是轰动性的,真正第二轮让大家疯狂的就是现在这轮,随着机器学习的提出,特别是机器学习研究过程中神经网络及其各种改建的提出,直接塑造了这股全民人工智能热。

所谓机器学习,字面意思理解就是让机器和人一样,具有自我学习的能力。这词用来帮助理解其实是很形象和生动的,但是如果简单的说机器现在具有了和人一样的思维能力,其实又是荒唐的。机器学习用到最多的数学工具可能就是我们常听到的那三个——概率、矩阵运算(严格来讲是张量的运算)、和梯度下降。

概率,凭啥概率放在第一位呢?随便找本机器学习的书,你可以看一下现在出版的那些算法,用到统计学方法和概率知识的你标记一下,你就知道为啥概率处在第一位上了。从某种程度上讲,机器学习和统计学有很大交集,机器学习里面很多东西都是基于概率判断的。相信今天来我这凑热闹的你肯定经历了高等教育的洗礼,你一定知道概率这个东西它就是理论值,它是无法准确测得的。但是根据大数定律,随着样本数量的增多,频率朝着概率方向逐渐收敛。那么好嘛,机器学习是基于概率的,概率只能由频率刻画,那么保证频率越概率的近似相等就非常重要,怎么保证呢?无论你去翻看哪本概率书,甭管你看到的是切比雪夫大数定理、伯努利大数定理还是辛钦大数定律,那一串数学公式中,lim下面的条件都是一样的,那就是n->∞(n趋近于无穷大),说句人话就是能力范围内让样本集尽量大。

很好嘛,大数据就这么来了。同样的,当样本数足够多(就是前面说的趋近于无穷)一个样本对整体的影响是可以忽略不计的。所以嘛,大数据里面潜藏着大的价值,但单样本价值低嘛。调查中国石油大学全体学生中喜欢吃甜粽子还是咸粽子的人多,单单少调查你一个也没多大关系。

真要让你一个人去调查整个石大,想必小学期开始了你都未必能采集完端午的学生数据(假定大家都没忘自己端午吃了啥馅的粽子)。那就分工合作嘛,怎么划分工作到每个人呢?怎么保证一个人出事不会对整个计划造成影响呢?最后结果怎么合起来呢?一系列让人头大的问题交织在一起,于是Hadoop框架横空出世,什么MapReduce、心跳机制也都随着一起来了嘛。

其次是矩阵(张量)运算,任何一个事物都不能用一个数字或者一个特征简简单单的就概括了吧。真要能这么搞,这象怕是被抽的,连一副风干骨架都没法保存了(抽象过头了)。多个特征那就是多个维度啊,那我们简单点,用n维向量存一下不行吗?你会发现,这世界还真就那么奇妙,有些东西它还真不是简简单单的原子量,他们之间可能有一些奇妙的关系。这很麻烦,得维持关系啊。你就得用到笛卡尔积,你就得从向量扩展到矩阵,然后再继续扩展……而这玩意抽象出来,就是所谓的张量(Tensor),没点线性代数(高等代数)的东西,我们这些三维空间都无法想象完整,全凭空间向量计算的所谓理科生,在解决这些问题上还得加把劲。说句题外话,Google有一个著名的框架,旨在让张量自由流动,据传名就叫TensorFlow,也不知道你听过没。

梯度下降我就不说了,没啥好说的,如此优秀的你一定能在第一时间记起你高数老师上课时候反复强调的那句“沿梯度的方向函数增长最快”,至于后面那句“梯度的模为方向导数的最大值”忘了就忘了吧。毕竟计算这事,越快越好对吧。但你也不能一下子计算过头了,往前迈一步,开心的发现你想要的蛋糕恰好就在你两脚连线的中点处,前后迈步也不是办法,步子小点才能get到,为了控制步伐,不妨在加入一个学习率alpha控制一下……

前面的东西或多或少的都涉及到了基础课和计算机专业的一部分,如果你不想看也没关系,下面我们纯粹的谈谈为什么我觉得人工智能取代不了人,以及由这事引发的关于人生和个人抉择方面的思考。

人工智能发展到现在,快速发展的原因细算下来,还应该是Google和Stanford共同搞出的现在的神经网络实现,特别是深度神经网络DNN和卷积神经网络CNN。这是整个技术界的一大进步,你猜猜现在现在整个前沿在干什么?调参和微调。换句话说,现在机器学习提出的算法完全可以针对特定的领域,事关成败的两大因素,一个是数据清洗,就是尽可能在训练前给机器正确的数据,另一个是设定正确的参数,保证不至于出现欠拟合(高度抽象,不足以体现一类的特性)和过拟合(抽象做的不好,针对具体数据刻画模型,不具备普适性)现象,从而拓展机器学习应用的领域,然后,然后你肯定懂了啊。而另一个主要的方向是进行优化,也就是针对大的框架进行修修补补,看看哪个地方能够进行优化。问题是现在的框架越来越趋于完善,优化越来越趋近于修修补补,新的计算方法或者问题解决思路很难提出,换句话说,现在应用层面虽然大行其道,但是理论方面相对停滞不前。人工智能主要依赖于互联网行业的带动,国内各行各业压榨自己给互联网输血是国家战略,是政府力推的事情。但问题是,现在的人工智能就像是对数函数的函数图像,固然增大投入会有所输出,但是投入同等比例的投入输出甚小甚者趋近于0,这种情况下又有谁能保证政府或者国家能一直补贴一个烧钱但没东西产出的行业哩?

有人看到这里可能会问,如果真的像你说的这样,那所谓人工智能只是一个称号而已,现阶段更好的描述应该是“人工智障”,那为什么媒体还把人工智能描述的那么厉害,那么恐怖?这问题说简单简单,说难也难。神经网络本质是在模拟人类神经元的工作原理,一堆参数输入,通过BP网络不断进行优化调整,或许刚开始你设置参数的时候是随便取的值,但至少每一个值都是有意义的(起码你规定了它最初的意义)。若干人工神经元连接形成了大的神经网络,一个大的神经网络注定是有若干隐藏层的,随着网络越来越大,参数逐渐趋于最优,你会惊喜的发现网络工作的非常好,但是反过来再去细看模型的时候,你自己都一脸雾水,这个参数是啥,用来干什么?这个隐层到底在干什么?这就是所谓神经网络的黑盒特性,你能直观的感受到它的能力,但却不知道数据在这里面纠结发生了什么,虽然这个网络是你亲手创立的。

有人可能会反过来问,这是模仿生物学的神经元和神经系统,那生物的神经系统中这些工作原理不也就是神经网络的工作原理吗?你真聪明,说的太正确了。问题是,现在互联网不过只是寒冬,你若真去生物界仔细看看,你会发现,那里还是冰河世纪呢。

最后,说说个人选择。为什么我这么执念于要谈谈个人选择呢。神经网络是一个建立在概率上的东西,可惜,你的人生并不能建立在概率上。你没有机会让你的样本集趋近于无穷,很多情况下,你有且只有一次做选择的机会,不能再多了。概率的意义是群体的最优而不是个体的最优。以你今年的高考名次有90%的概率被北京大学录取,然后你填写志愿的时候写上了北京大学。不巧的是,由于今年大部分尖子生都扎堆北大,北大的录取名次恰好是你的名次-1。从概率学的角度来讲,你有很大概率被北京大学录取,而站在你个体的角度,你没有被北大录取。看到了吗,对于个体,概率是不存在的,落实到一个人身上,只会有两种最简单的情况,要么是1,要么是0,不会有小数的。坚信概率的你,从清华大学落榜到中国石油大学,不知道心里是啥滋味。

我现在的想法就是这样,也许不对,欢迎指正。接受讨论和辩论,不接受无端指责,我很不讲道理的。:)

No comments:

Post a Comment