您当前的位置: 首页 > 新闻 > 手机

语音识别是AI时代的窗口吗?不,计算机视觉与图像才是!

来源: 编辑:vbeiyou 时间:2017-08-23 07:58 人阅读
就在谷歌旗下的人工智能机器人AlphaGo两度战胜人类顶尖棋手之后, 人工智能在各个领域就彻底火了。但奇怪的是,进入2017年以来,苹果、谷歌、微软、亚马逊、小米等国内外巨头纷纷布局智能音箱。但现在来看,基于语音识别的智能音箱就真的是人工智能吗? 语音识别是AI时代的窗口吗?不,计算机视觉与图像才是!(图1) 这些智能音箱内部都集成了各家的智能语音助手,像苹果的Siri、微软的Cortana、谷歌的Google Assistant、亚马逊的Alexa等等。来帮助这些智能音箱实现,人机语音交互,音乐播放、消息阅读、事件提醒、查看交通等功能。 语音识别是AI时代的窗口吗?不,计算机视觉与图像才是!(图2) 当前,智能音箱都是基于内置语音识别实现功能,而语音识别系统都是基于数据云,通过云传输识别就会有延迟和连接问题。另外,目前语音识别系统还有一些不小的挑战。 第一,需要有高效的云传输架构,大量数据上下交互汇聚,对芯片和内存造成了不小的压力。 第二,语音识别系统对运行环境有较高要求,噪音较大的环境会对拾音系统形成压力,并且会降低语音识别的效率和准确率。 第三,便是语言的扩展问题,语音识别系统需要容纳世界上大约7000多种的语言,才能真正意义上实现智能语音交互。 目前来看,基于人工智能算法的语音识别系统是AI时代的突破口,但并不是人工智能全部。据外媒统计,在人工智能发展成熟的高的美国,其国内AI创业公司前三领域为:自然语言处理252家、机器学习应用242家、计算机视觉与图像190家。 语音识别是AI时代的窗口吗?不,计算机视觉与图像才是!(图3) 人工智能技术在深化普及过程中,深受影响的便是计算机视觉与图像行业。通过对计算机自然语言的发掘,使其深入自学习应用在计算机视觉图像上便有很多商用案例,像当前流行的人脸识别、人眼追踪、3D建模、全息图像显示等都是都是AI与视觉图像结合的应用。 在国内计算机视觉领域,超多维于2004年就在研发探索计算机视觉与图像技术,其在3D屏幕制造、3D摄像头制造、图形图像计算、模糊逻辑计算等领域都有完整的专利布局。在AI时代,超多维旗下公司ivvi科技便率先提出发展智能3D识别技术的策略,坚持“科技创新 • 中国创造”,专注与计算机视觉技术和设备的研发。未来将以人工智能、AR/VR、娱乐交互、智能平台几个方面来打造有趣、好用的智能3D体验。 语音识别是AI时代的窗口吗?不,计算机视觉与图像才是!(图4) 基于人工智能的智能3D技术,已经在IT和手机行业形成了创新潮流,像手机厂商苹果、三星、华为均计划在新机上配备3D人脸识别技术。另外,华为已经在研发AI芯片,ivvi科技也将在年底推出智能3D设备,一场行业内关于人工智能与智能3D视觉技术的军备竞赛即将打响。

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。邮箱:business@qudong.com

相关文章