商汤科技徐立:未来最吃香的职业可能是编剧 | 嘉宾观点

首页 · 2020-09-14



前几年人人都在讨论的人工智能,现在几乎无人在谈了。今天,人工智能已经深入到越来越多的行业,改变了我们的生活方式,而我们可能还浑然不知。今天的人工智能到底是如何融入我们生活的?是什么让人工智能有了今天的发展的?


在嘉宾派上海站,商汤科技联合创始人兼CEO徐立,详细讲解了人工智能的发展,他认为人工智能的发展离不开包容试错,以及长尾应用的发展。无论你身处什么行业,都要时刻关注人工智能发展。我相信,这篇文章,也一定能对你有所启发。


以下,enjoy~


商汤科技联合创始人兼CEO徐立在嘉宾派授课




你不再谈人工智能,它却偷偷融入了生活


很多年前,大家都在谈人工智能,但是现在大家都不谈了。很多人就说,人工智能是不是过了一个周期了?事实上,正是因为大家不谈了,它才能够进入到各行各业。


这怎么解释呢?


以前,我们会用科技来定义时代。比如,电气时代、蒸汽时代、信息时代等等。其实,我们现在还是处在这些时代,我们还在用电,但是我们不会说我们处在电气时代。


因为,现在和电相关的每件事情都非常正常,包括电怎么改善我们所在的行业,改善每个人的生活。大家都觉得这是很正常的事情,每个人的认知都拉齐了,所以就不再讨论了。


很多年前,大家经常谈论人工智能,因为大家不知道它是怎么影响行业的。


现在,很多行业不再去谈论这个词了,因为人们渐渐认识到,这个所谓的“人工智能”到底是怎么影响行业的。在这个时间点上,大家的认知都拉齐了,都觉得人工智能就应该这样做,人工智能不是一个新鲜事了。


前两天,我听了张文宏医生的演讲。很有意思,他讲了怎么样用大数据来辅助决策,他说现在的人工智能在这波疫情里面起的作用还是有限,但是他给了很多未来的方向。


有一次,我用滴滴打车的时候,堵在中环上。滴滴司机说,你看前面的红绿灯,堵车就是因为这个红绿灯,这里的红绿灯每次都是这样,每次单个灯停很长时间,原因是什么?因为每天早上直行的人会非常地多。但是,早上直行的人多了,这件事情你可以统计出来。


滴滴司机认为,私家车每天早上的路线是一定的,跟滴滴不一样,你只要统计私家车的牌照,统计这里有多少私家车,你就可以通过这个来筛选控制红绿灯。


你看,滴滴司机都能对人工智能给出这样的意见。


整体上,我们正处在人工智能认知提升的阶段。


现在,我们不太能单独听到去聊人工智能这个词,因为大家都不觉得这是一个人工智能。


滴滴司机在提人工智能,但他觉得这是个很正常的交通灯的管理。


张文宏医生在决策的时候说的是人工智能,但他认为这是个大数据,他不认为这背后需要有一个专属的人工智能技术来辅助它。


怕什么真理无穷,进一寸有一寸的欢喜


胡适说过一句话,“怕什么真理无穷,进一寸有一寸的欢喜。”


在很多情况下,你往前走一步不一定对。过去的科学家给出的很多定义都是错的,但是每一步,即使是错了,也都是有发展的。


几百年前,托勒密提出地心说,他认为地球是中心。现在我们知道这是错误的。



但是,托勒密为了解释在地心说的基础上,所有天体是如何运动的,提出了“飞轮”的理论。这个理论解释得非常好,至今还是很多圆、椭圆轨道理论的核心基础。


即便,我的认知理解都是错的,甚至我的数学假设也是错的,但不妨碍它真的能够推动发展。


人工智能也是一个道理。其实,人工智能这个词,很早之前就在学术期刊上提出来了。


但是,人工智能一直不被当成一门独立的学科,为什么呢?


因为人工智能包含的这些内容,无论是语音,还是我们做的感知决策、NLP自然语言,每个行业都有各自行业的专家,自然语言的专家、视觉的专家,还有语音里面的专家互相都觉得自己在体系里是很强的,所有人都不愿意被统整。


就像春秋战国时期,各个国家书不同文,车不同轨,我讲我的,你讲你的,互相不买账。


并且,在2010年之前,人工智能讲的是人工指导的智能,为什么这么说?因为数据量特别的少。当时最大的人脸库是3000张人脸,你在3000张人脸跑出100%的准确率,能用到世界各个地方的应用上吗?很难,你背后牵涉到很大的假设。


所以,就算当时有最好的假设模型,也只能在人的认知下推动,所以叫人工指导的智能。


2010年以后,人工智能用大量的数据,结合隐马尔可夫模型深度学习,于是,在语音上取得了巨大突破。



2013年,确实是有一个高峰起来了,但是它其实是个前奏,对吧?当质疑的声音越来越多的时候,人工智能在视觉里面取得了很大突破,但仍然面临很多质疑。


2015年,行业里很多应用在推人脸识别和手机解锁。


那时候,人们天天炒人工智能识别率准不准确,双胞胎能不能互相解锁?睡觉的时候能不能刷支付宝?各种各样的讨论,对准确率有非常大的质疑。


很多东西不可能做到100%的准确,在任何的状态下都不可能。


但是,在这种情况下,一样有很多应用获得了巨大的突破。比如说, 今天商汤赋能了4.5亿台手机的人脸解锁,几乎中国所有的手机品牌的人脸解锁都由我们来提供,每天的日均人脸解锁的解锁次数是300亿次,大家已经默认了人脸能代替密码。现在酒店的大堂,包括很多需要认证的地方,商汤总共有20多万台设备在线来服务于大家,每天酒店的入住人次是3亿人次。


诸如此类的应用还有非常多,就是在大家质疑它的准确率,质疑它的发展规律的时候,它已经潜移默化地发展起来了。


你现在用人脸做手机密码的时候,不会再去想它是不是不准,大家都已经习惯了,对吧?



其实,很多真假问题都是伪命题,在很多情况下,它不是解决有没有人的问题,它解决的是在这个人的身上通行效率的问题。


比如地铁。地铁边上其实有个安检员的,但是大家认为地铁一定要解决防伪问题,为什么呢?难道一个人端了个3D的假头走过去,坐在那里的保安还看不出来吗?


这个是不需要解决的。但是,现在所有地铁都需要你完成这样一个标准。


甚至,现在的支付体系,小店里面,营业员坐在那里,你拿一个3D的假头在那里去识别,营业员难道看不出来这个头的真假吗?但是,现在所有支付标准都有鉴别真假的要求。


我觉得这个探讨很好,正是在这样的需求之下,很多的行业应用都有了大的发展,其实刷脸坐地铁已经成为一个很普遍的事了。


刷脸坐地铁和手机解锁有一个很大的区别。手机解锁是在手机里面存了你的人脸,比对的时候是一对一的比,也就是说他只要判断这两个人是不是同一个人就行了。


刷脸坐地铁要在这城市里面搜到你是谁,并且把钱扣掉,这个难度是指数级的。


但是,现在我们已经在河南郑州、西安、哈尔滨上线了口罩识别,戴口罩也可以刷脸坐地铁。


我们统计了很多数据,非常有意思。


在西安,刷脸坐地铁的人数已经超过用交通卡坐地铁的人数了。更有趣的是,我们发现刷脸的老年人很多。这是为什么呢?


因为很多老年人是不会刷二维码过闸的,他不会点开App刷码,所以,他们以前都是用卡的。


刷脸的好处是你一旦登记完,刷一下脸就过去了。而且,老年人还是免票的。所以,老年人在路上逛累了,就坐个地铁回家了。



只要你设计好,人工智能是能真正提升行业效率,改变行业属性的。这里面除了技术问题,还有一个很重要的点就是包容和试错。


中国现在人工智能的发展,和我们的包容还是有很大关系的。


我想这是中国和西方的区别,西方经过了欧几里得这种数学体系的推理,整体上是演绎法,所有东西都是演绎的推理,每一步都是往前推。所以,在一些东西不确定的情况下,一定要先有规则才能往前跑,否则证明不出来。


中国用的是什么呢?用的是归纳的逻辑。就是先去观察现象,最后再去找规律。所以,这里面很多灰度尝试是有错的,但就是因为包容和试错,它才有价值,你每次试错都能有东西沉淀下来,这是我看到的非常大的区别。


能做这么多工作,还是不能取代一个保安?


这里,我想讲的是长尾的应用,什么叫长尾应用?指的是一些细小的应用。


首先,我们日常当中用的次数特别多的应用叫头部应用。


其实,这是一个分布,分布的纵轴,就是它出现的频率,越往后的频率肯定越低,长尾应用在数学里面,叫长尾效应。


长尾有什么好处呢?这些细节在很多数学问题里面可以不考虑,因为它小,很多东西我只考虑那些头部的,其他都忽略掉了。


但是,真正的人工智能落地,就是要解决这些问题。


现在的人工智能,有一个非常强大的功能,叫做自我学习,我们讲的许多模型,现在都可以用“算法工厂”的形式实现。不再是聚焦在一类物体上,而是关注各式各样的细节。



很多人都在提商业价值,你光做一个人脸,永远没有商业价值。


比如,用人工智能做小区保安的替换。替换保安,就能省下保安的人工成本。


小区保安的工作是什么呢?来个车,开个车门,来一个人,问一下是谁,登记。


这些东西人工智能全都做出来了,都能自动了,还给你做了一个自动的AB门。这样,甚至能保证没有人在的时候,不会同时进两个人。


后来却发现,还是省不了保安。为什么?


因为保安是一个“人”,除了做管理出入人员登记这些事情,他还做其他事情。他可以搞绿植,你的绿植如果不多,他每天可以帮你浇一次水,还可以帮你收快递。他可以帮你做很多零碎的事情。


最后,你会发现,即使人工智能把保安大部分的事情都做了,唯独他每天早上给花浇水那一件事情做不了。这个保安还是不能省下来,不然你的花就死了。


再比如,在工业制造领域,做检测的时候,如果检测划痕我都可以用人工智能做了,但是我检测划痕后,刷漆是人干的。你说,检测划痕是自动化了,那个人就等着机器检测完去刷个漆。但是,这个人还是没能省下来。

所以,整体上要从“人”的维度展开,要去解决这些长尾行业的应用。


从这块来说,人工智能做的主要在两个维度上。


第一个维度,现在形成的算法工厂能做非常多细小的行业应用。


第二个维度,人工智能可以做的深层内容会越来越多。


今天,抖音上面20%的内容都是机器生成的,那试想一下,未来它还能做很多好玩的事情。


比如,现在有一些人在抖音上跳舞很火,很多人做漫改。其实这些用机器来做非常稳定。比如,这些动作的处理、分析,可以把一段视频进行整体改动。


这里有一个算法,叫“语义”,它可以把猫眼睛变大,耳朵做一些变化,改动头的大小。原来人工智能生成的这个算法没有语义的维度,现在你可以和它说,我想要这只猫变成什么样就变成什么样,真正可以用人的语言来控制。


试想一下,未来最吃香的可能就是编剧了。编剧写完剧本之后,电脑可以帮你演戏。你把每一帧定义好,它就能够帮你连起来。还有拍好的视频,原来只能单帧PS,现在能够整体PS一个视频,形成电影级别的效果。


所以,现在的人工智能处在一个新阶段。它能够深入到行业里,主要有三个原因。


第一,从政策角度来说,能容错。很多东西可以先行先试,可以先归纳,最后才能够形成一套统一的。我不管说伦理观还是治理观,都是有一个发展的角度来看。


第二,算法的工厂使得长尾的应用能够更多地变化。


第三,在行业里面的一个场景和应用,它使得有更多的人能够参与协同。人工智能不再是一个少数人才能够去接触和使用的状态。


这个背后最大的一个道理在于,大家对人工智能的认知产生了变化。


嘉宾大学创办人吴婷与徐立在测试AI产品

上下滑动查看嘉宾派1~6季校友全名单




© THE END


相关推荐