艾瑞咨询张云:人工智能看上去很美,可是怎么赚钱呢?

界面新闻
佚名
今年五月,谷歌人工智能程序“AlphaGo”战胜世界围棋冠军柯洁,引发了世界范围内人们对人工智能的探讨。同时,国内的“天网”监控系统凭借着精准的人脸识别技术相继抓获了多名逃犯,引起了网络...

今年五月,谷歌人工智能程序“AlphaGo”战胜世界围棋冠军柯洁,引发了世界范围内人们对人工智能的探讨。同时,国内的“天网”监控系统凭借着精准的人脸识别技术相继抓获了多名逃犯,引起了网络热议。人们忽然发现,以前看似陌生而遥远的“人工智能”、“深度学习”等概念已经在不经意间实现了应用化和产业化,出现在我们身边。

人工智能产业的市场规模究竟有多大?人工智能项目究竟如何实现商业落地?面对人工智能,投资人究竟应该储备哪些知识?艾瑞咨询分析师张云给出了他的阶段性分析成果。

本篇实录系根据健一会(ID:jianyihui2011)沙龙第196位主讲人张云在健一会“人工智能的商业化变现”专题沙龙上的精彩分享整理而成。原标题为《人工智能的商业落地》,现标题为健一君所加。

大家好,我是艾瑞的张云,我今天讲的主题是《人工智能商业落地》。人工智能现在虽然很火,但其实巨头对AI在很多领域的商业落地也处于探索阶段,下面和大家分享一下我们的阶段性研究成果。

人工智能发展史上有过三次热潮,最近的这次和以往两次不同的是,前两次热潮主要蔓延于学界和政界,而此次热潮则很大程度上是由谷歌AlphaGo所引发,逐渐激起来自工业界、投资界、政府、媒体、大众对人工智能的兴趣,大家都在希望它能给各行各业带来巨大改变。

还有个不同是,前两次人工智能热潮中的科学家相对集中在麻省理工、斯坦福等世界级学术殿堂里,此番热潮里的科学家们会相对分散到全球各地不同实验室、高校乃至产业界中,这也使得可能没有一个科学家能真正完全了解人工智能所有细分领域的发展进度与研究水平。

产业规模难以估算,投资人得不到答案

国家在2017年7月公布的新一代人工智能发展规划中将战略目标分为两个维度,一个是人工智能核心产业规模,一个是相关产业规模。

比如说在安防领域,人脸识别算法和技术属于核心产业,当这些算法与技术落地时,要加上摄像头、传输线路、存储等基础硬件设施,后者都属于相关产业规模。又比如在无人驾驶领域,自动驾驶的感知与决策算法属于核心产业,整车生产制造则属于相关产业。

投资人在选择投资标的的时候通常都会问创始人,人工智能这个产业现阶段的市场规模有多大?有些市场相对来说有比较清晰的逻辑,但整体而言AI市场规模的推算有诸多不确定性,为什么?有三点原因。

首先是收费模式。

人工智能的很多产品或服务具有开放性的特点,前所未有,有些甚至还在研发中,要给它们确定一种定价模式,是按一次性授权收费,还是按年或按API调用次数收费?另外还有乙方竞争的问题,人工智能在落地应用的时候,现阶段未必能够形成很高的技术、产品壁垒,这就会导致一个问题:在出现多家供应商竞争时,如何保持价格优势?如果提供的是免费服务,又该如何计算其市场空间?

第二个是供应量集中度的问题。

人工智能这个产业的业务比较新,很多领域集中度低,难以由个别推整体。虽然存在一些知名公司目前在AI企业服务领域非常领先,但一些地方性的企业因为资源渠道优势,取得的营收也会非常客观,却因为分散难以统计。

另外,如果目前接受AI技术服务的需求方之后自行组建队伍进行相关应用的开发,那么之前由技术供应商主导的市场空间该如何估算?

第三个是推算逻辑。不同领域的推算逻辑千差万别,比如说在安防领域,人工智能技术落地的方式之一是帮助警察做影像中的人脸比对,它起的是一种辅助效果,辅助公安人员去判断,而在工业领域,未来假如说人工智能应用于质检等环节,所起的作用可能将会是代替,很多质检工作就完全被机器取代了。如何区分不同领域的推算逻辑以及其商业落地的困难程度,并结合这种程度做市场规模推断,这中间困难重重。

应用场景比较明确,技术受限仍需发展

智能语音领域,知名厂商在近场识别听写方面,对外宣称的准确率均在97%以上,但是必须是在比较安静的环境下,而且说的是普通话;若是远场识别,技术仍在快速迭代中。

识别之后要做对话,目前对话交互只能满足限定任务,比如说在特定的客服场景、金融领域或是服装领域。如果要进行开放式聊天,比如以朋友的身份与人类谈心,人工智能可能还处于人工智障的阶段。

语音在企业服务的落地,一个是医生语音录入病例,另一个是诸如法院庭审之类的闭门会议记录。但其实在更多的场景,在开放性的会议活动上安排的还是人工速记,因为人工速记虽然会遗漏一些信息,但人类会识别哪些话需要记录,哪些话属于噪音,不需要记录,现阶段的机器分析不出来这个区别。

人工智能在To C端的商业应用场景相对比较明确,一个是智能车载,另一个是智能家居。我们在开车的时候不方便用手机去完成导航等其他操作,在这种场景下,通过语音进行交互就会比较好。智能家居里现在智能音箱比较火,但目前市场空间不见得很大。

机器视觉进步显著,落地安防越来越强

2015年,微软的卷积神经网络以3.57%的错误率获得ImageNet大规模视觉识别挑战赛第一名,而人眼的错误率为5.1%,所以有人说机器视觉现在超越了人眼识别。

其实,比赛表现好,不代表实战真能做的好。比赛里所用的图片都是公开和标准化的,并且可能已经做好了标注,但在安防等实际场景里,角度、光照、脸型、脸上是否戴口罩等因素都会影响人脸识别的实际效果,网速、带宽也会影响识别的准确率。

比赛本身的数据集也往往相对有限,所以比赛的意义更多地是向公众展示新算法,让大家看到相关领域的技术进步。

计算机识别比较有市场化的落地场景是安防。其实真正跟AI相关的主要是两个功能,一个是动态视频人脸对比,另一个是视频结构化。

动态视频可以做到,在高速公路检查站、机场、火车站检票口等处对海量人群进行人脸抓拍识别,并将其与警方所提供的黑名单库进行比对,把比对结果实时推送给警方,如果与黑名单中的人物匹配,警方就会实时出警进行逮捕。

公安部门的摄像头监控的大量视频信息都属于非结构化信息,警方若是想抓某个人,需要花大量时间把相关视频拷出来,或者分给几十个人去分析,而计算机视觉技术则可将其结构化,机器可以自动把视频里的敏感信息截取出来,它可能是某个特定场景、特定人物或是特定事件,这样警察就从之前的大海捞针变成瓮中捉鳖,判断更为精准和快速。

3D视觉技术仍处于研发阶段

视觉在工业场景的应用有两个维度,一个和3D视觉有关,一个是将深度学习用于产品质检。

3D视觉在国内是有一些技术相对成熟的国外企业在提供相关服务,不过该技术本身还不太成熟,国外企业很难大规模落地。首先,国外企业售价较高,国内企业的产品服务将会存在价格优势。第二,一旦出现技术问题,国外往往通过电子邮件进行沟通,国内的企业客户不太能接受这种解决方式。

计算机视觉在医疗领域中的优缺点

大家都觉得医疗领域可被技术改造的空间很大,这主要有三点原因。

首先,中国的医疗资源不平衡,北京有很多三甲医院,其他二三线城市没有;其次,医生工作强度大,一天要看很多片子,接待很多病人;第三,由于工作强度大,导致医生误诊误判的现象出现。

当然,计算机视觉在医疗领域也存在技术瓶颈。医生在看病时,不是单一的考量,他会通过望闻问切,和病人交流,最后对症下药,而机器只能通过医疗影像这个方式做辅助,仪器很难完全参照医生的判断逻辑做决策。

计算机视觉在医疗影像诊断领域落地时还存在别的限制。

一个是数据量少,数据很难获取。一家三甲医院的某个典型疾病,每年可能也就几十个病例。

另一个是标注成本高。我们做安防、汽车等场景的标注,普通人通过简单培训就能上岗,而医疗样本的标注可能需要请三甲医院医生进行标注。

自动驾驶看上去很美,想要变现不容易

今年有很多自动驾驶公司获得天使轮融资,不过当下的投资人对这些厂商的商业变现能力开始有要求了,不会再像之前那样给他们较长的周期去研发。

全球14家汽车巨头里有13家、14家科技巨头里有12家都已经涉足自动驾驶领域,英特尔曾经推算过,到2050年,自动驾驶产业有7万亿美元的市场空间,这个数字不仅仅包括汽车本身,还包括自动驾驶相关服务及其给人类带来的因时间节约所产生的市场价值。

一些创业公司都在说,2020年自动驾驶就会落地并量产。我问过很多学术界的专家,他们都认为现在看来要想在2020年实现这个目标是比较困难的,甚至有的教授坦言,目前的这套技术路径,并不是能达到自动驾驶的技术路径。美国交通部门近期公布了一个自动驾驶汽车指导方针,他们认为,将在2025年之后实现全面自动的安全功能以及高速公路的自动驾驶。

To B服务关键要做好落地工程建设

对场景的理解,是人工智能产业升级的关键。尽管有很多很高级的模型,但它必须要理解业务场景,能清晰地定义问题,才能做好算法,才能有效地求解。现在的问题是,大多数厂商对于场景的理解不是很深刻。

问答环节

面对人工智能项目,投资人往往需要对技术的价值做出准确判断。如何能够做到在储备相关技术知识的同时,不陷入具体的技术细节?

张云:还是需要花费一些时间的,最好有兴趣去看一些专业书籍。南京大学周志华教授的《机器学习》、伯克利人工智能专家斯图尔特·拉塞尔的《人工智能:一种现代化方法》都涉及对AI相关技术的梳理,能够帮助大家对人工智能、机器学习等形成一个相对全面的认知。

人工智能目前在教育领域有哪些应用吗?

张云:目前在教育信息化方面,包括自动批卷、个性化课程推荐等有一些探索落地。今年出现了一些在教育领域应用人工智能的公司。教育这个场景非常好,因为它离钱特别近,而且目前教育资源不平衡的问题很突出,优质资源集中在少数的地区或者是一些学校,人工智能的应用可能会打破这样的局面。

目前研究算法和技术的公司,他们的甲方或者下沉渠道公司,如果想往上游走,技术壁垒大不大?他们会不会自己做算法?

张云:确实有些下沉渠道的公司开始自己组建团队,研究算法。但这些公司往往有多条业务线,在算法上投入的精力相对有限。

有些开发算法的公司也在研究专用芯片,他们跟上游芯片厂商有无冲突?

张云:对于这个问题,我引用一下邢波老师的观点。目前在深度学习方面,不同场景、不同习惯领域用的是不同的算法。针对不同场景、不同习惯领域开发针对性的芯片,市场空间其实相对有限,而且这些算法本身也处于快速迭代中。

您如何看待人工智能在棋牌竞技里的应用?

张云:今年 “AlphaGo”和“冷扑大师”(一款根据德州扑克规则设计,能够进行自我学习的程序)都引起了大家的热议。“AlphaGo”的技术很难直接实现商业落地,谷歌将这项技术用于节省其能源中心的成本,相关技术让能源中心的消耗降低了40%,但是它在其他场景落地还是比较困难的。而“冷扑大师”并没太涉及如今最火的技术,基于博弈论和人工智能的结合。相比较来说,“AlphaGo”面对的是完备信息,大家都可以看到整个棋盘和布局,但是打德州扑克的时候我们并不知道每个人手里有哪些牌,它是一个不完备信息下的落地,它跟我们的实际业务会有一些类似的地方。但无论是“AlphaGo”还是“冷扑大师”,面对我们实际业务场景的金融产品风控或者商务谈判时,还是难以直接应对,因为它们没有相关领域的知识体系。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论