国内产业链初步成型,上中下游各司其职。经过近年的快速发展,国内人工智能 产业逐步分化出了上中下游,其中上游提供基础能力;中游将基础能力转化成AI 技术;下游则将AI 技术具体运用到特定行业,形成生产力。由于下游应用行 业非常多,限于篇幅,本篇将重点分析行业的中上游,后续文章将对行业下游 进行深入分析。
国内市场规模超千亿元,政策规划空间达万亿元。由于中游是核心技术环节,我 们根据中游的技术分类对市场空间进行估算,其中智能语音将保持40%左右的稳 定中高速增长、计算机视觉将连续超过100%爆发增长、自然语言处理将以20%的 增速稳步发展、其他类的潜在空间也十分巨大。综合来看,国内人工智能市场 空间规模到2020 年将超千亿元,而根据国务院的新一代人工智能规划,到2030 年国内人工智能的核心产业规模将达到万亿元,相关产业规模将达10 万亿元。
上游AI 芯片公司国内较为弱小,数据资源公司值得培育。国内AI 芯片公司集中 在设计环节,而IC 设计行业国内较为弱小,2017 年在全球市场占比仅有11%, 且偏低端,未来将面临较大挑战,但在当前中美贸易战背景下,部分龙头公司 如海思、寒武纪、紫光展锐依然值得跟踪。数据资源公司当前处于发展初期, 作为行业服务提供商其成长的确定性和现金流表现均十分优秀,未来值得长期 培育,典型公司如海天瑞声的业务拓展迅速,财务报表稳健。
中游技术平台公司将成为产业链中的核心玩家。中游技术平台作为连接上下游的 核心环节,在产业链中具备核心价值。其中智能语音和计算机视觉的技术相对 成熟,应用前景确定性高,同时国内这两个领域的公司发展较快,头部公司已 经脱颖而出。科大讯飞在智能语音市场占比达44%,商汤科技在视觉类公司中市 场占比达30%。
不同领域企业特点不同,经营策略有所区别。AI 芯片公司建议聚焦龙头,资产类 业务需根据财务状况谨慎处理;数据资源公司建议提前布局,全方位经营,包 括资产类以及存款类业务;技术平台公司建议针对头部企业中短期拓展存款类 业务,未来可考虑进行资产类业务的投放。
人工智能,英文缩写为 AI(Artificial Intelligence),指的是由人类发明设 计的智能系统,能够模仿人类的思考方式,实现人脑的部分功能,替代人脑解 决特定问题。
1.1 人工智能当前处于第三次大发展期,赋能产业升级
人工智能的概念最早在 20 世纪 50 年代提出,1956 年的达特茅斯暑期会 议上正式提出了人工智能的概念。期间经历了三次发展浪潮,当前处于第三次 大发展期。
第一次浪潮发生在 1956~1976 年,主导理论是逻辑主义,主要成果是完成 了一些定理证明以及逻辑程序语言 prolog。
第二次浪潮发生在,1976~2006 年,主导理论是连接主义,主要成果是神 经网络理论的提出以及应用。但是在实践中发现可以解决一些简单单一问题, 对于复杂问题的处理效果不尽理想。
第三次浪潮发生在 2006~现在,可以称之为基于互联网大数据的深度学 习,将大数据、神经元网络和数学统计的方法结合在一起。第三次浪潮的理论 基础和第二次浪潮类似,主要的差别在于基于神经网络的深度学习算法取得了 巨大的成功。这里的主要推动因素包括了硬件的进步、卷积神经网络模型优 化、参数训练技巧的发展等。
前两次浪潮解决了人工智能的一些基础理论问题,第三次浪潮的发展已经 使得人工智能技术的发展程度(识别率、准确率等)可以实际解决很多传统需 要人类大脑才能解决的问题,具备了很强的实用性,获得生产力。
1.2 人工智能根据从底层到应用的技术逻辑可以分成基础层、 技术层、应用层
人工智能根据从底层到应用的技术逻辑可以分成基础层、技术层、应用 层。基础层从硬件和理论层面,为人工智能的实现提供了根本保障,主要包括AI芯片和深度学习算法。AI 芯片的发展进步,提供了越来越强的计算能力; 深度学习算法的建立,提供了AI解决问题的计算方法。
技术层是基于基础层的支撑,设计出的解决某一类过去需要人脑解决问题 的通用方法,具体包括智能语音、计算机视觉、自然语言处理以及其他类这四 大人脑功能的处理方法。这些方法基于深度学习算法,根据具体的数据以及处 理场景,形成了专门的成套技术处理方法和最佳实践。通过技术层的实现,我 们可以将基础层提供的算力以及计算方法运用到具体领域,去真实对应到大脑 的某一类功能以及实践能力。
应用层是基于技术层的能力,去解决具体现实生活中的问题。比如利用计 算机视觉技术,实现金融、安防等多个领域的人脸识别;利用智能语音技术, 实现智能音箱、录音笔等的语音识别;利用自然语言处理技术,用于智能客服 的问答。在实际的应用中,技术层和应用层的关系是相互交叉的,某个领域的 应用可能用到多个维度的技术层的能力,比如金融行业的应用对于智能语音、计算机视觉、自然语言处理技术都会有需求;同样某个技术层的能力也可以广 泛应用到多个不同的应用领域,比如计算机视觉技术可以广泛应用到金融、安 防、医疗、交通、教育等多个维度。
1.3 数据、算法、算力、领域专业能力是人工智能效果的关键
当前的人工智能应用的核心,是基于神经网络的深度学习,该方法的特点 是需要根据特定应用目的,利用大量且优质的数据,对学习网络进行反复训 练,通过传播算法,不断自动变换各层以及各节点的参数,以最终得到符合实 际应用要求的训练结果。
深度学习的训练特点,决定了数据、算法、算力、领域专业能力是人工智能效果的关键:
▶数据:深度学习算法的核心在于通过优质的数据去训练,是否取得任务相 关的足量优质数据集是人工智能技术取得成功的关键。科大讯飞在智能语 音领域的重要优势,是有足够优秀的方言训练数据,因此其语音识别产品 能够较好应对各种方言的情况,形成护城河。
▶ 算法:虽然深度学习的核心框架相对固定,但是为了使得学习模型在特定 应用场景取得较好效果,往往需要做很多的算法优化和工程优化,以使得 模型最终在具体场景取得更好的效果,比如更快的计算效率,更准确的分 类概率等。每年的人工智能顶级会议IJCAI 、AAAI 等均由大量论文,针 对很多具体应用场景,对深度学习算法从各个角度进行改进和优化。因此 对特定领域,具备强大的算法能力,是产品和企业成功的关键技术保障。
▶ 算力:由于现在需要解决的具体问题越来越复杂,云端的人工智能算法对 硬件的计算能力需求近乎无止境。虽然当前芯片技术不断进步,云计算的 提供越来越完善,但是对于一些高难度高复杂度的人工智能工作,依然需 要非常大的算力才能训练出足够好的解决模型。这样强大的算力也非常昂 贵,很多小公司无力承担。
▶ 领域专业能力:最后,人工智能技术的落地应用,最终还是要和应用场景 结合起来,往往需要最终的实施公司,既理解行业痛点,又具备丰富的行 业实施经验以及渠道能力,方能更好地将技术和具体硬件以及流程结合, 取得好的实施效果。
1.4 人工智能发展中美“双雄并立”,成为国家战略
相比之前历次工业革命中的落后状态,中国在人工智能时代从技术到产业 的多方面已经进入了国际领先集团。国际范围来看,人工智能行业呈现美国相 对领先,中美“双雄并立”构成第一集团,英日法德等传统发达国家构成第二 集团的竞争局面。同时全球各国针对AI 领域的发展均出台政策大力支持,其 中又尤以中国和美国的支持力度较大,上升到国家战略层面。
中国的人工智能基础研究能力仅次于美国,处于第二集团
基础研究能力是衡量一个国家行业发展水平的重要标志,其中科研论文和人才是核心指标,综合这两个指标来看,中国的人工智能基础研究能力仅次于美国,处于第二集团。
中国AI 论文数量从2000 年开始快速攀升,根据清华大学的统计,我国(含 港澳台)的AI 论文数量,从1997 年的1000 余篇快速增长至2017 年的37000 多篇;占全球的比例也从4.26%增长至27.68%。
经过这些年的快速进步,我国的人工智能论文数量无论是累计值还是当期 值都处于国际领先地位,和美国共同构成了第一集团。英国、日本、德国、印 度、法国等国家的论文数量处于第二集团。
虽然中国的AI 论文数量已经处于世界领先地位,但是在核心科研人才方面 还有较大提升空间。清华大学的研究表明,美国的AI 领域杰出人才1数量遥遥 领先,是第二名英国的接近五倍。中国的AI 科研人才2数量也很多,但是杰出 人才占比很低,数量上和英国、德国、法国、意大利相近处于第二集团。
将科研论文和核心人才综合来看,不难看出中国的AI 基础研究能力仅次于 美国。
中美两国的人工智能产业化程度全球领先
人工智能行业的产业化程度可以从企业数量以及投融资额这两个维度进行 判断,而中美两国和其他国家相比,在这两个维度上的优势都非常明显。
近年中国人工智能企业数量快速涌现。信通院的数据表明,中国人工智能 企业的数量从 2012 年的 300 家迅速增长到 2017 年末的 1000 家左右。
横向来看,中国的人工智能企业数量在全球范围内仅次于美国,稳居第 二。信通院的数据显示,截止 2018 年 6 月,美国和中国的人工智能企业数量 分别为 2028、1011 家,分列一二名,随后排名第三的英国的企业数量仅有 392 家,排名第九的瑞典仅有 55 家,和中美差距较大。
近年随着人工智能应用范围越来越广,全球和中国的人工智能领域的投融 资规模都呈上涨趋势,其中来自中国的增长尤其迅速,占比也越来越高。据信 通院的统计,2017 年全球人工智能投融资总规模为395 亿美元,中国达到了277.1 亿美元,占全球融资总额的70%。2013 年到2018 年的第一季度全球AI 行业累计投融资数据中,中国占比60%,美国29%,合计占比接近90%。
人工智能成为中美国家战略,政策重心各有特点
近年来,随着人工智能技术的快速发展,全球展开了AI 军备竞赛,各主 要发达国家均出台了不少支持和引导 AI 行业发展的政策,其中又尤以中国和 美国的支持力度较大,上升到国家战略层面。
我国人工智能政策的一个突出特点是数量非常多,持续性强,并且充分涵 盖了中央和地方。科瑞唯安公司和清华大学公共管理学院的联合研究表明,我 国中央政府层面的人工智能政策逐年增加,近年发布量维持在 30 以上。而我 国省级政府的 AI 政策则数量更多,在 2015 年达到了峰值 276,近两年虽有所 回落也都保持在 50 以上。这些中央以及省级层面的政策相互呼应,从资金、 税收、项目等多个层面持续支持人工智能行业的发展。
从 2017 年开始,人工智能连续三年进入政府工作报告,而 2019 年的政府 工作报告不仅继续大力推进人工智能发展,更首次提出智能+的概念,充分体 现我国从顶层设计的角度,将人工智能视为国家战略中重要的基础设施,推动 其与产业的融合,加速经济结构升级。可以说我国对于人工智能的重视程度非 常高,已经上升到国家战略的层面。
虽然美国的 AI 实力全球领先,但美国政府的人工智能相关规划政策 2016~2017 年才开始逐步发布,如《国家人工智能研究和发展战备计划》、 《人工智能、自动化和经济》、《人工智能白皮书》等。近一年以来美国政府 的重视程度大为提高, 2019 年的财政预算要求是美国历史上第一个制定人工 智能和无自助、无人系统作为行政研发重点的预算。而2019 年 2 月,特朗普 总统签署的行政命令创建了一个名为《美国人工智能倡议(American AI Initiative)》的项目,集全国之力“优先考虑 AI 投资”,标志着人工智能也已 经成为美国的国家战略。
美国的这些政策总体来说聚焦于应对人工智能蓬勃发展的大趋势,着眼长 期对国家安全与社会稳定的影响与变革,保持美国对人工智能发展始终具有主 动性与预见性,对于重要的人工智能领域力图保持世界领先地位。
由于其他国家的人工智能综合实力相比美中两国有一定差距,因此其往往 是聚焦于其本身原有的和人工智能能够较好结合的优势行业,去发展自己在局 部领域的核心竞争力。如德国的优势在于利用人工智能和工业4.0 的结合,英 国致力于人工智能和硬件芯片的结合,而日本则试图利用人工智能打造新一代 机器人。
2.1 产业链上中下游各司其职,将技术转化成生产力
从宏观视角来看,人工智能产业链可以分为上中下游,其中上游提供的是 基础能力;中游将基础能力转化成具体的 AI 技术;下游则将AI 技术具体运用 到各行各业,形成生产力。下图代表的是人工智能产业链的全景示意。
上游提供基础计算能力、方法和数据
上游代表的是支撑人工智能行业发展的基础设施和方法,主要包括 AI 芯 片、数据以及 AI 算法。
▶ AI 芯片是支撑人工智能行业发展的基础硬件,提供适配于AI 算法的计算 能力,当前国内外都有不少公司专注于AI 芯片的设计,同时部分中游公 司也进行AI 芯片的设计以更好匹配自己公司的专用计算模型。
▶ 数据对于AI 技术在具体行业的应用有非常重要的作用,主要的数据掌握 在行业中下游公司中,但是数据的处理是一个较为专业化的工作,当前国 内外均出现少数公司专注于数据处理,为行业中下游提供数据资源服务。
▶ 当前的主流AI 算法一般基于深度学习技术,进行AI 算法研究的主力军一 般是各大院校以及科研机构,部分实力较强的中游企业也具备很强的原创 研究能力。
中游将基础计算能力和方法转化成四类AI 技术
▶ 中游代表的是基于现有的 AI 算法,在实际应用中能达到较好智能效果,具 备扩展性,在各行各业的应用前景广泛的基础性技术。当前的基础技术可以分 为智能语音、计算机视觉、自然语言处理以及其他类技术。
▶ 智能语音指的是利用计算机对语音信息进行分析处理,以模仿人类实现能 听、能说等语音能力的技术,语音识别和语音合成目前是其核心应用。智 能语音技术当前的发展已经比较成熟,在很多领域的应用已经接近人类的 水平,比如智能语音交互就在迅速成为主流的人机交互方式。
▶ 计算机视觉指的利用计算机对图像或视频信息进行处理分析,以模拟实现 人类通过眼睛观察和理解外界世界的技术,当前的主要应用包括了图像视 频的复原和增强、分割和识别、理解和自动匹配等。计算机视觉技术给机 器安上了智慧的眼睛,能替代很多原本需要人类才能完成的工作。随着近 年来计算机视觉技术在多个领域的应用取得突破,目前其已成为人工智能 最为炙手可热的技术分支。
▶ 自然语言处理指的是利用计算机对语言文字进行分析,以模拟实现人类对 于语言的理解和掌控的技术,当前的主要应用包括自然语言理解和自然语 言生成。自然语言处理是实现认知智能的关键技术,虽然当前依然面临较 大挑战,但其未来的进步和突破对人类社会的意义将十分深远。
▶其他类指的是基于人工智能算法对一些特定类问题进行方案设计,利用计 算机将其智能解决的技术,其从实际效果来看,针对相应问题实现了模拟 人类智能。这类技术相比前三类技术,其应用范围相对较窄,基础性较弱, 为了便于分类,我们将这些技术统称为其他类。典型的应用场景包括棋类 的AlphaGo,智能游戏选手AlphaStar,金融领域的反欺诈反洗钱、智能 投顾、自动交易等。
中游技术类企业具备很强的研发能力,占据了行业内软件类技术的高地, 并且在发展过程中也逐步建立了资金和数据的壁垒。同时中游人工智能技术是 链接产业上下游的关键,且具备较强基础性和横向扩展性,需要利用这些技术 的下游厂商很多。因此其中的竞争获胜者未来有可能成为人工智能行业的核心 公司,当前的领先公司非常具备长期跟踪的价值。
但是技术类的公司存在变现困难的问题。虽然一些基础技术比如人脸识别 的扩展速度很快,全国的机场都已铺开,但是短期内依靠技术输出获得的营收 和现金流收入依然较为有限,这些企业主要通过股权融资的方式获取资金,信 贷业务合作的难度较大。
下游综合利用各类AI 技术解决各自行业的应用问题
产业链下游指的是人工智能技术在各个行业中的实际应用,是技术和场景
结合并落地的环节。当前人工智能应用落地比较多的下游行业包括金融、安防、教育、医疗、自动驾驶、智慧城市、智能穿戴等,产业链的中下游企业均有参与。
对于中游企业而言,一般来说其会利用自己在具体某项AI 技术的优势, 承接自身技术优势占重要地位且市场空间较大的下游行业应用,亲自下场 参与竞争,以期尽快获得较好的市场份额。如科大讯飞就利用自己的语音 识别技术,在智能语音+教育领域自己承接了较多的下游具体订单。
下游企业指的是产业+人工智能的复合类企业。这类企业的特点是首先在 某个行业背景深厚,专业能力、项目实施与营销能力都十分优秀;其次是 具备技术创新的基因,能快速利用最新的人工智能技术,将其应用到自己 的行业产品或项目中,实现行业+人工智能的结合,进一步提升自己在行 业内的竞争力,打造更好的产品或者服务。
下游企业虽然技术上和中游企业相比有一定差距,但是由于其直接面向客 户,进行项目建设或者产品销售,能短时间内获得较大的销售收入以及现金 流,同时部分项目和研发需要前期投入,也有一定的资金需求,相对适合银行 进行信贷类业务。同时由于这些企业在特定领域内的积累和优势较大,其未来 的行业+人工智能模式也将具备较强竞争力,也具备长期合作价值。
2.1 人工智能在国内市场空间超千亿元,国际市场空间达数百 亿美元
当前的人工智能产业链中,中游是核心环节且掌握核心技术,因此我们将 人工智能市场根据智能语音、计算机视觉、自然语言处理等中游核心技术进行 划分,分别计算基于各项核心技术而发展出的市场的空间,来估算总体的人工 智能市场空间。
进行这样的估算后,我们可以知道未来三年在国内的市场空间有望达到千亿元量级,国际市场空间将达到数百亿美元。
智能语音在国内外均进入稳定中高速增长期
智能语音是人工智能技术中成熟度较高,较早开始产业化进程的技术,近 年形成了较为广泛的客户群体和应用领域,保持了较为稳定的中高速增长。中 商产业研究院预计到 2018 年,国际和国内的智能语音市场规模将分别达到 141.1 亿美元以及 159.7 亿元。由于国内的智能语音市场规模相比国际差距较 大,未来几年仍有望保持40%左右的中高速增长。
计算机视觉在国内将持续爆发式增长
计算机视觉技术从 2012 年开始取得了突破性的进步,权威的 ILSVRC 挑 战赛的错误率迅速降低,进而在很多领域的应用逐步跨过了识别率的门槛,使 其具备了很强的经济价值;同时随着国内平安中国建设的稳步推进,金融科技 的快速发展,计算机视觉技术的下游需求迅速扩大,两者的叠加造成了计算机 视觉这两年在国内迎来了爆发式增长,同时这样的趋势仍在延续。
中商产业研究院预计到 2020 年,国内计算机视觉市场空间将达到 755.5 亿元,连续四年保持 100%以上的增长速度。
国际市场空间方面 Forrester、Tractica 公司分别预测未来全球计算机视觉 市场空间将超过200 亿美元、260 亿美元。相比而言,国内企业在计算机视觉 领域的应用走在了国际前列。
自然语言处理将稳步发展,技术突破将是关键
自然语言处理技术(NLP)的理论下游空间十分广阔,但是当前的技术发 展离真正实用,即接近人类的语言理解能力还有较大距离。
信通院预测全球的自然语言处理市场规模预计将从2016 年的 76.3 亿美元 增长到 2021 年的 160.7 亿美元,复合年增长率 16.1%,国内 2017 年的自然 语言处理市场规模大约为 49.77 亿元,相对国际来说较为落后。
基于 NLP 技术得不到突破进步的保守预期下,我们预测到 2021 年,国内 的 NLP 市场大约保持 20%的中速增长。
其他类技术也具备很大市场空间
其他类技术中比较重要的包括智能投顾和反洗钱技术。智能投顾过去几年 呈现高速增长的趋势,据智研咨询、花旗银行预测,美国智能投顾规模到 2020 年将达到 2.2 万亿美元,复合增长率 82%;据 Statisa 预测,中国智能投 顾规模到 2022 年将达到 6651 亿美元,复合增长率 87%。若假设管理费率为 百分之一,那么国际国内的智能投顾市场空间分别达到百亿美元以及人民币的 量级。
反欺诈反洗钱类应用的市场空间也十分巨大。ReportLinker2019 年最新发 布的报告显示,2018 年全球反洗钱软件市场规模为 9.057 亿美元,预计 2027 年将达到 49.932 亿美元,复合增长率 21.1%。未来的反洗钱软件基本都将采 用人工智能技术,有望成为百亿美元的市场。
人工智能产业链上游的算法环节,主要以高校和科研机构为主,算法信息 一般都是及时公开的,因此在上游环节,银行的业务合作的主要对象是AI 芯 片以及数据资源公司。
当前上游 AI 芯片国内产业能力较为弱小,其中云端芯片面临国外的英伟 达、INTEL 等几大巨头的竞争,虽然具备挑战但风险较大;终端芯片由于要求 较低具备一定的国产化机会但市场空间有限,因此该领域总体能投放的信贷量 有限。
数据资源公司国内当前规模较小,但是数据资源服务好比人工智能行业的 铲子,未来的需求将十分巨大,这类公司的成长空间和现金流都将较好,其中 的优秀公司将具备很多银行业务合作的机会。
3.1 AI 芯片类公司面临国际竞争压力大,云端终端均面临挑战
当前国内的 AI 芯片类公司主要集中在芯片设计环节,而国内的芯片设计行 业和国际差距较大。IC insights 的数据表明,2017 年中国大陆的芯片设计产 业市场份额占全球比例只有 11%,而其中 5%还是海思(华为)、中兴、大唐的内部转移支付。
虽然 AI 芯片是一个新领域,国内厂商更具备弯道超车的可能,但由于国内 整体芯片设计能力较低,其和国际竞争对手挑战的竞争压力很大。AI 芯片和 传统芯片并不是完全割裂的关系,从原理上来说,传统的 CPU 和显卡都可以 进行 AI 运算, 只是在效率和性价比上会和 AI 芯片有差距。由于深度学习程序 的设计特点,决定了其需要的是大规模并行计算能力,这一点恰好是显卡的强 项,因此显卡龙头英伟达可以将其在传统芯片领域的设计经验,迅速复用到深 度学习的计算领域,成为 AI 芯片的领导者。我们可以看到,当前国际上 AI 芯 片的领先企业主要集中在国外,且一般具备十年以上的芯片设计经验。
AI 芯片分为云端和终端,云端芯片一般用于数据中心,通用性强市场空间 大,但是竞争也更为激烈。终端芯片一般用于各种智能硬件设施,需要适应特 定场景的特定需求,具备定制化的特点,因此每个特定市场的空间相对小,竞 争压力较小。国内坚持进行云端芯片设计的厂商很少,少数国家队企业如寒武 纪科技虽然技术在国内领先,想象空间很大,但其未来的不确定性依然很大; 国内进行终端芯片设计的厂商相对较多,部分企业如思必驰、云知声能够快速 获得一定的营收,但特定领域的市场有限,企业成长空间受限。
3.2 数据资源公司财务数据健康,未来成长空间可期
数据对于人工智能的效果有非常重要的作用,产业链中下游公司均可以通 过自身的项目和产品获得一定数据,但是由于对于数据的处理也需要更加专业 的技能,同时单个公司的数据总存在不够完善的地方,中小公司的业务数据相 对匮乏,因此专业的数据资源公司应运而生。这些公司通过数据资源定制服 务、数据库产品、数据资源相关的应用服务等方式为人工智能行业提供数据支 持,具体如下:
▶ 数据资源定制服务:根据客户对人工智能算法模型开发、训练、拓展及优 化等过程所需数据资源的个性化需求,为客户量体裁衣地提供定制化数据 资源的设计及开发服务,对客户提供的数据进行处理,最终形成符合客户需求的定制化数据资源,客户享有最终形成的定制化数据资源的知识产权。
▶ 数据库产品:根据对人工智能算法模型应用领域、行业发展趋势、市场需 求等的评估和研判,设计并开发多种数据库产品,开发完成后授权给客户 使用。数据库产品的知识产权属于数据资源公司。
▶ 数据资源相关的应用服务:直接为下游客户提供有效的数据资源相关的应 用服务,协助客户实现人工智能算法模型的识别率提升、语言种类拓展和 垂直应用领域拓展等,助力人工智能技术及应用的设计、开发和领域拓 展。
这三类服务均覆盖智能语音、计算机视觉、自然语言处理等人工智能的主 要技术领域。
数据资源类公司起步较晚,公司较少,国内主要有海天瑞声、慧听科技、 标贝科技,国外的领军企业是appen。但这些公司发展较快,财务指标也非常 健康 。海天瑞声近三年净利润均为正且增长六倍,经营性现金流的增长和净 利润基本同步;appen 近三年的营收和净利润也均有翻倍的增长。
从业务特点、行业发展的角度来看,我们认为数据资源类公司和创新药领 域的 CRO/CMO 公司有较多相似的地方,都属于朝阳行业中提供服务的公 司。未来其中的领先公司将能保持业务拓展和财务数据的稳步发展。
3.3 产业链上游公司选择标准以及判断
AI 芯片类公司具备技术要求高、投入大、风险大的特点,在发展初期需要 国家支持,因此对于这类公司,主要从其技术实力、股东资金背景、成功产品 的角度进行判断:
▶ 技术实力:主要看相应公司是否具备领先的科研队伍,拥有院士、千人计 划专家或者国际芯片大厂成功经验技术人员。
▶ 股东资金背景:主要看相应公司的重要股东是否有国家队或者 BAT 等顶 尖企业,历次融资情况是否充足,满足业务发展需求。
▶ 成功产品:主要看历史上是否真的产出过比较成功的芯片,较大规模运用 到实践中,如云端服务器、知名手机设备等。
我们根据以上标准,对国内主要的 AI 芯片企业进行了评价和划分,我们认 为,综合评价第四档的企业暂时不具备业务合作的必要,综合评价第三档及以 上的公司值得长期跟踪。
数据资源公司核心的竞争力包括人才技术、数据积累、客户资源:
人才技术:核心技术人员以及在数据资源领域的经验积累。
数据积累:在智能语音、计算机视觉、自然语言处理等各领域积累的重要数据。
客户资源:是否覆盖行业内核心客户,如 BAT、知名中游技术公司等。
当前国内专业的数据资源公司非常少,主要参与者有海天瑞声、慧听科 技、标贝科技,其中海天瑞声由于拟申报科创板,信息披露较为完善。从披露 的信息来看,海天瑞声在人才技术、数据积累、客户资源等方面的积累均处于 非常优秀的水平,是一家非常值得长期合作的企业。
慧听科技、标贝科技这两家企业的公开信息非常缺乏,若能获得相应数据,可以和海天瑞声的业务和财务进行对比,以确定这些公司的行业地位。
在整个人工智能产业链中,我们认为中游的技术平台类公司将有望成为产 业链中的核心环节,具备更大的不可替代性和护城河,长期而言有望持续输出 价值。其中智能语音类和计算机视觉类公司经历了几轮洗牌后,当前脱颖而出 的头部公司具备相对稳定的竞争格局,新入局的厂家想要挑战的难度较大。同 时这两类公司当前的技术成熟度较高,潜在应用场景又非常广泛,可拓展性很 强,具备长期合作的价值。
4.1 中游技术平台类公司是人工智能产业链的核心环节,在产 业链中地位相对有利
在人工智能产业链中,中游技术平台类公司的地位比较核心,主要是因为 其具备较强壁垒,同时向产业链上下游的扩张较为容易。
技术平台类公司具备较强壁垒,规模提升能带来马太效应。
技术平台类公司的壁垒体现在人才、资金、技术生态圈三个方面。
平台类公司需要非常强大的研发团队和科研基因,才能第一时间消化吸收 最新的科研论文成果,并应用到具体技术领域。我们可以看到,当前国内影响 力最大的几个技术平台类公司,其创始人团队基本都出身于顶级名校或者国内 顶级科研机构。
同时,中游平台建设也需要大量资金。一方面当前顶尖的AI 人才,需要很 高的薪酬才能吸引,IDG 的数据显示2017 年人工智能从业人员平均薪酬是大数 据等其他热门岗位的150%以上;另一方面,算力是决定技术应用效果的重要因 素,需要大量的资金自建或者租用计算资源;最后,建设长期生态,需要有功 能完善强大、用户友好易于推广的平台系统,前期也需要长期资金的投入,所 以具备资金壁垒。以科大讯飞为例,为进一步进行平台建设和研发,其2018 年增发的资金需求达到了56 亿元的量级。
生态圈指的是中游企业基于其领先的技术实力,搭建人工智能开放平台, 以云服务等方式提供人工智能领域的技术、产品和解决方案,为行业内的企业 和个人用户,提供高效优质服务。生态圈不仅可以通过各种服务获得相应收入, 更重要的是培育了企业和个人的使用习惯,增强了自身技术和解决方案的影响 力。同时生态圈平台可以利用云计算的特性,以非常低的成本迅速扩展自己的 服务对象;而用户和使用场景的迅速扩张,则进一步提升了用户的信任度和服 务的质量,形成正向循环。以科大讯飞为例,自2015 开始加大力度建设生态 平台后,其开发者数量近年增长迅速,接近百万量级。因此平台类企业还具备 技术生态圈的壁垒。
技术平台类公司具备较强上下游扩展能力
相比上下游公司来说,中游的技术平台类公司具备更强的上下游扩展能力。 绝大部分下游公司往往专注在某个细分领域,其规模和实力有限,进行专业的 技术研发并非其优势能力;即便是少数下游强势企业如海康威视,就算其能真 正自行发展人工智能技术,专注于安防领域的AI 研发,也很难技术输出到其 他关联度很小的领域。而技术平台类公司则可以借助自己的资金和技术优势,在一些规模较大,利润丰厚的领域直接获取下游的需求订单,这也是当前的平 台类公司一直在推行的“平台+赛道”的商业模式。
上游的AI 芯片类公司技术能力更多在半导体领域,当前也处于初创期,资 金需求很大,不具备中游扩展的能力。而技术平台类公司,为了获取更适合自 身公司算法技术的芯片,可以通过合作或者自研的方式,进行某些难度较低的 专用AI 芯片的开发。
4.2 计算机视觉和智能语音类公司竞争格局稳定,具备长期合 作价值
在四大类平台公司中,当前来看计算机视觉以及智能语音类公司最具备长 期合作价值。而自然语言处理的技术成熟度不够高,且国内的积累较国外差距 较大,竞争格局也不稳定;其他类平台也存在竞争格局不够清晰的问题,尚未 看到下游应用空间大且脱颖而出的企业。
计算机视觉和智能语音类公司技术相对成熟、国内企业实力较强
根据前文的分析,计算机视觉和智能语音类公司技术成熟,正处于行业下 游迅速应用的时期。同时相比国外,计算机视觉和智能语音也是国内企业的优 势领域。
根据信通院的数据统计,人工智能企业的应用领域分布中,国内企业在视 觉和语音方面的比例要大于国外,而自然语言处理的比例大幅低于国外。
竞争格局逐步稳固,头部企业脱颖而出
据前文数据,2016 年开始人工智能初创企业产生的速度已经大幅降低,而 计算机视觉和智能语音类平台公司的市场竞争格局逐步稳固,部分头部企业已 经脱颖而出,竞争优势明显。
据IDC 统计,2017 年中国计算机视觉市场份额中,商汤、旷世、依图、云 从四家公司已经占据了70%的市场份额;据前瞻产业研究院的统计,2018 年我 国智能语音市场份额中,科大讯飞占据了44%的市场份额。
同时,这些头部企业不仅当前占据了主要的市场,在2018 年他们依旧持续进行融资,用于研发和业务拓展,不断扩大自己的资金和技术优势。
4.3 技术平台类公司选择标准以及判断
技术平台类公司的判定标准,可以从业务领域和平台综合能力两方面来看。
业务领域方面,根据我们前文的分析,计算机视觉、智能语音类属于较好 领域,自然语言处理、其他类属于一般领域。
平台综合能力则要从下游客户质量、平台打造能力 、技术输出营收、创始 团队实力、公司研发投入、资本能力、激励机制等方面来判断,其中:
▶ 下游客户质量主要指的是购买公司输出技术的是否是行业内顶尖的, 对技术要求高的公司,比如BAT、海康威视等。客户行业地位以及技 术要求越高,越能证明公司的能力。
▶ 平台打造能力主要指的是公司现有平台的输出能力,主要包括技术平 台的标准化、效率、易用性、用户数量等。
▶ 技术输出营收,重点需要看的是由于技术输出带来的直接营收。比如 收取相应公司的技术服务费,云端AI 服务收入等。需要区别的是基于 工程项目类的营收,因为这种营收不同行业差别很大,技术附加值也 较难判断。
▶ 创始团队实力,重点看的是创始团队的技术背景,是否是人工智能领 域顶尖高校科班出身,或者具备行业内顶尖公司的成功经验,以及在 学术领域具备丰硕成果。
▶ 公司研发投入指的是具体用于AI 技术以及平台的实际投入,要和用于IT 项目的项目人员实施投入区分开来。
▶激励机制指的是能否给予核心人员足够激励,比如BAT 公司在这一方 面就明显弱了一些。
(报告来源:招商证券;分析师:方国栋)