最新 评论

解码人工智慧

赖国芳

上世纪80年代末,我在新加坡国大电机系里修硕士,研究模式识别(pattern recognition)。当时,这个领域最常被引用的模范数据叫着“鸢尾花卉数据集”(iris dataset)。它包含150组数据,属于鸢尾属下的三个亚属,每亚属各有50个样本。每组数据有四个特征或变量(features),分别是花萼和花瓣的长度和宽度。这个领域的入门挑战是:从这150个样本,随机抽取一个当成“未知”,用余下的149个做数码分析,尝试识别未知的亚属,而且必须达到98%左右的准确度。

指导教授派下作业时,我心里想:好神奇呀!电脑是如何从这150×4个变量中“学习”的?原来,这是统计学里多变量分析的一个案例,从三个亚属四个变量的平均值、方差(variance)和交叉协方差(co-variance), 计算出未知样本属于各个亚属的概率。70年代起,计算机发展迅速,这样的计算可在短时间内完成。然而,从这个理论发展出来的影像识别等技术(如人脸或语音识别),所需计算资源成几何级数增加,要到几年前,方才发展出可在商业领域上应用,价格相宜的硬件能力。所以,我们可以说,这几年来人工智慧领域的发展,大多归功于计算能力的大幅度提升,而不是爱因斯坦式的智慧飞跃。30年前,硬件需3天计算,今天只用半秒。所以,深蓝在90年代打败了世界西洋棋冠军,直到最近,阿法狗才能击退人类的围棋九段高手,因为围棋比西洋棋复杂得多。严格来说,电脑没有变得更聪明,只是变快了。阿法狗所采用的数量分析,若在30年前的硬件上运行,每一步恐怕都得计算几天呢。

李世石连输阿法狗3局后,颓丧地向世人道歉,仿佛背负了人类战败机器的罪孽。这是有点荒谬的。今天,世界上跑得最快的马拉松选手,赢得了小小的普腾灵鹿车吗?今天没有一家媒体会去报导人车竞跑,人跑输灵鹿车,也不必涕零忏悔。阿法狗的研究团队说:它只是一个会下围棋的复杂计算程序,其浩瀚的计算能力可涵盖人类思考极限外的可能布局,因此可以“学习”“创新”的棋步,然离开全方位全能思想的人工智慧还非常遥远。从远古开始,人类面对未知,比如雷电、疾病、生死,都喜将未知“拟人化”成鬼魅神佛,因为这更容易理解。把人工智慧转化成人类未来的可怕对手,是好莱坞吸引你进入电影院的好桥段。替自家产品或研究计划冠上“人工智慧”的华盖,在今天的氛围下更方便圈钱吸金 — 这就更不用说了。

当然,计算能力的大幅度飞跃,将使电脑可以逐步取代一些重复、繁复,且无需创意的职业。另外,以前依靠地域限制,以“牵线”为主的行业(如各类经纪和特许经销商),因为电脑平台的速配能力,也将受到严重威胁。机动车出现,人力车便消失了。在线叫车程序出现,枯候某处的传统计程车行业,便失去竞争能力。时代的巨轮,是由不得你来逆转的。那么,你能做什么呢?

现代管理学之父彼得·德鲁克 (Peter Drucker),在很多年前已经说过:一家企业只有两个基本职能 — 创新和营销。创新需要打破旧有思维、经验、偏见的束缚;营销则是掌握自身品牌的人格特质,以精准有效率的方式,将讯息传递给特定会众,从而达到播种和收割的目标。在大数据和人工智慧时代,人们使用媒体及进行交易的方式大幅度改变,旧堡垒崩溃,新希望兴起。这已不再是一个寻租取巧的时代。脱颖而出的,将是成功结合商业、科技和文学养分的团队。与其抱残守旧,感叹旧媒体和门市的败落,不如改变思维,抓紧大洗牌的机遇。

[2018年6月5日刊于中国报]