澳门新葡亰app平台

    服务热线:  400-826- 0806                            

澳门新葡亰app平台

News

【原创研究】应用场景多个落地,语音、图像识别较为成熟

日期: 2017-12-19
浏览次数: 499

?注:??本文节选自澳门新葡亰平台网址大全近期即将出版的《人工智能行业报告及投资建议》特别报告,作者系澳门新葡亰平台网址大全金融研究院以及多个聚焦人工智能领域的投资团队。

【原创研究】应用场景多个落地,语音、图像识别较为成熟

?

【原创研究】应用场景多个落地,语音、图像识别较为成熟


基于大数据、优质算法模型及芯片奠定的良好基础,人工智能在图像处理、语音识别等多个应用场景实现了落地。


?图像识别:技术最为成熟的细分领域之一?

【原创研究】应用场景多个落地,语音、图像识别较为成熟

图像识别是计算机视觉技术最为成熟的细分领域之一,是指计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像识别的原理和人辨认图像的原理基本一致:人眼在看到某一特定图像后,把图像信息传输到大脑后进行储存,再把当前的信息与之前储存的记忆进行比较,实现图像识别。


简单来说,图像识别存在三个步骤:

第一,?理解一个物体,比如说人脸,首先要检测一些关键点,比如轮廓、眼睛、嘴巴;

第二,?人为设计一些特征来描述这些点的视觉属性;

第三,?采用一些分类器将这些特征作为输入进行分类和识别。


图像识别技术的应用领域极为广泛,包括无人驾驶汽车、VR、机器人、安防等各个新兴领域。目前主要应用集中于2B端。而iPhone X 推出的Face ID功能,将人脸识别技术推向2C端。



?语音识别:最早落地的人工智能技术?

【原创研究】应用场景多个落地,语音、图像识别较为成熟

语音识别指的是电脑自动将人类的语音内容转换为相应的文字,其原理为语音波经过前端语音信号处理模块、声学模型模块、字典模块、语言模块四个关键的模块处理后,经过解码得到最终的语音识别结果。自2011年开始深度学习的快速发展,传统方法中用于特征提取的GMM(Gaussian Mixture Model)模型逐渐被深度神经网络(DNN,Deep Neural Networks)模型所取代(图1),语音识别性能不断提高,词错误率明显下降。性能快速提升的语音识别技术也逐步走出实验室,应用于各个场景中,实现商业化落地,例如语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。2013年,谷歌的语音识别系统单词识别错误率还在23%左右,而到了2015年5月,谷歌在其举办的谷歌I/O年度开发者大会上宣布其语音识别系统的单词识别错误率已经降到了8%。 2016年9月, Microsoft基于深度学习的语音识别系统将错误率降到了6.3%(数据来源:《人工智能》,作者:李开复)。 2016年11月, 搜狗、百度、科大讯飞相继宣布其中文语音识别率达到了97%(图2)。


图1:语音识别发展历程

【原创研究】应用场景多个落地,语音、图像识别较为成熟

数据来源:思必驰上海交大联合实验室



图2:语音识别错误率近年来不断降低

【原创研究】应用场景多个落地,语音、图像识别较为成熟

数据来源:《人工智能》


国内外均已有多家巨头企业切入语音识别领域。根据国家工业信息安全发展研究中心统计数据显示,预计到2017年,全球智能语音产业规模将达112.4亿美元,CAGR为35.1%。智能语音市场,全球来看Nuance和Google占据了半壁江山;谷歌、苹果、微软等科技巨头合计所占份额超过 55%。而在中国市场,科大讯飞独占半壁江山,市场份额为 49.6%,与百度一起占据中国智能语音市场约 75%的份额。中国智能语音市场仍处于寡头垄断的阶段,未来可能将向垄断竞争过渡。



?应用场景:2B和2C端多个实现优化升级?

【原创研究】应用场景多个落地,语音、图像识别较为成熟

人工智能基础硬件及核心技术的不断优化提升,其应用场景也加速渗透于消费级和企业级的各类产品服务中。AI的加入使得企业的产品及服务的效率得到了提升、成本得到极大的控制。其应用场景可分为2B端和2C端两大类(表1)。


大部分公司的业务主要以B端解决方案和服务为主。一方面,B端业务注重与行业客户的互动合作,更有利于人工智能技术和产品的落地;另一方面,行业客户对于生产效率的提高有强烈的需求,而C端产品需求仍需挖掘。不过,大公司的C端产品布局依然是相对活跃的。


从国内三巨头BAT来看,各自的落地应用重点有所不同。百度的AI战略中,首要位置是用AI来提升目前百度已有业务,率先将AI能力应用到翻译、导航等产品当中,以提升这类产品的效率。其次,则是通过AI来培育出新的业务,例如智能云、智能驾驶等。对于阿里而言,电商本身即是落地AI的主要场景,例如智能语音客服店小蜜。在最近的云栖大会上,阿里又宣布推出一款支持中英文的智能会话客服机器人。此外阿里推出城市大脑,以及在制造业流水线上尝试“工业大脑”等,在B端进行尝试。而腾讯也紧随其后,推出了游戏AI、社交AI、内容AI等多方面落地场景。例如在围棋领域推出“绝艺”,上线智能语音助手App等,以及在医疗领域推出了一个医学影像实验室,早期用于识别食管癌。因此,不光AI的技术层面需要大力发展,寻找落地场景也是不可或缺的。


表1:人工智能技术应用于2B和2C的场景

【原创研究】应用场景多个落地,语音、图像识别较为成熟数据来源:网络整理


纵观基础层、技术层和应用层三个层面,各有其特点(图3)。多家巨头公司也纷纷进行了布局,而并非专注于其中的某一个层面。相对于基础层,应用层的投入较少,变现较快;虽然基础层投入要求较大,但从长期布局而言也是不可或缺的一层。


图3:各层级皆有突破口

【原创研究】应用场景多个落地,语音、图像识别较为成熟

数据来源:清科研究中心


News / 相关新闻 More
2018 - 10 - 11
2018年10月9日下午,杭州市金融办金融发展中心主任李宝军一行三人到访澳门新葡亰平台网址大全考察调研。我司管理合伙人兼金融研究院院长郭丰、合伙人程雁及金融研究院高级研究员张成、邬尔曼等相关人员参加座谈会。会上,郭总对李主任一行的到来表示热烈欢迎,并简单介绍了金融研究院的主要职能和重点研究方向,主要包括宏观经济形势研究以及细分行业研究。他表示金融研究院作为企业自身的研究机构更加侧重于为业务团队服务,围绕公司聚焦的五大行业开展梳理和研究工作,为公司投资决策提供研究支持和服务。 李主任充分肯定了我司在细分行业上的深入研究以及丰富的投资经验,并对金融发展中心的四个重点工作方向进行了简要介绍,主要包括杭州市经济情况追踪分析、全市金融人才引进、钱塘江金融港湾建设以及经济信息数据统计等。 随后,双方围绕当下杭州市的金融结构、金融风险、私募行业发展情况等方面进行了交流与沟通,并就优势互补、合作共赢...
2018 - 05 - 17
“快手带你看世界”、“抖音记录美好生活”这两句slogan对于大众来说都已经十分耳熟能详了。最近一段时间,上至中年,下至青少年,无一不热衷于抖音、快手的世界。抖音、快手即属于当前十分火热的短视频平台APP。短视频是一般指视频长度不超过15分钟,主要依托于移动智能终端实现快速拍摄和美化编辑,可在社交媒体平台上实时分享和无缝对接的一种新型视频形式。而时下最流行的音乐短视频软件的抖音,只有短短的15秒时间。在移动化、碎片化消费日益盛行的当下,低门槛低成本地分享生活信息的短视频迎合了当代用户崇尚的快餐文化、极简生活方式以及表现自我的人群特点,而成为最应景的影像娱乐产品。据《中国网络版权产业发展报告(2018)》显示,有66.3%的受访者表示曾在网上发布过自己拍摄的短视频。相比于文字、图片、长视频等传统形式,短视频具有表达能力更强、创作门槛低、互动和社交属性更强等多重特征,可以更加直观、立体地满足用...
                     Copyright ? 2016 - 2019 澳门新葡亰平台网址大全资产管理集团有限公司
犀牛云提供企业云服务
X
1

QQ设置

3

SKYPE 设置

4

阿里旺旺设置

等待加载动态数据...

等待加载动态数据...

5

电话号码管理

  • 400-826-0806
6

二维码管理

等待加载动态数据...

等待加载动态数据...

展开