语音识别是AI时代的窗口吗？不，计算机视觉与图像才是！

来源：编辑：vbeiyou 时间：2017-08-23 07:58人阅读

就在谷歌旗下的人工智能机器人AlphaGo两度战胜人类顶尖棋手之后，人工智能在各个领域就彻底火了。但奇怪的是，进入2017年以来，苹果、谷歌、微软、亚马逊、小米等国内外巨头纷纷布局智能音箱。但现在来看，基于语音识别的智能音箱就真的是人工智能吗？语音识别是AI时代的窗口吗？不，计算机视觉与图像才是！(图1)

这些智能音箱内部都集成了各家的智能语音助手，像苹果的Siri、微软的Cortana、谷歌的Google Assistant、亚马逊的Alexa等等。来帮助这些智能音箱实现，人机语音交互，音乐播放、消息阅读、事件提醒、查看交通等功能。语音识别是AI时代的窗口吗？不，计算机视觉与图像才是！(图2)

当前，智能音箱都是基于内置语音识别实现功能，而语音识别系统都是基于数据云，通过云传输识别就会有延迟和连接问题。另外，目前语音识别系统还有一些不小的挑战。第一，需要有高效的云传输架构，大量数据上下交互汇聚，对芯片和内存造成了不小的压力。第二，语音识别系统对运行环境有较高要求，噪音较大的环境会对拾音系统形成压力，并且会降低语音识别的效率和准确率。第三，便是语言的扩展问题，语音识别系统需要容纳世界上大约7000多种的语言，才能真正意义上实现智能语音交互。目前来看，基于人工智能算法的语音识别系统是AI时代的突破口，但并不是人工智能全部。据外媒统计，在人工智能发展成熟的高的美国，其国内AI创业公司前三领域为：自然语言处理252家、机器学习应用242家、计算机视觉与图像190家。语音识别是AI时代的窗口吗？不，计算机视觉与图像才是！(图3)

人工智能技术在深化普及过程中，深受影响的便是计算机视觉与图像行业。通过对计算机自然语言的发掘，使其深入自学习应用在计算机视觉图像上便有很多商用案例，像当前流行的人脸识别、人眼追踪、3D建模、全息图像显示等都是都是AI与视觉图像结合的应用。在国内计算机视觉领域，超多维于2004年就在研发探索计算机视觉与图像技术，其在3D屏幕制造、3D摄像头制造、图形图像计算、模糊逻辑计算等领域都有完整的专利布局。在AI时代，超多维旗下公司ivvi科技便率先提出发展智能3D识别技术的策略，坚持“科技创新 • 中国创造”，专注与计算机视觉技术和设备的研发。未来将以人工智能、AR/VR、娱乐交互、智能平台几个方面来打造有趣、好用的智能3D体验。语音识别是AI时代的窗口吗？不，计算机视觉与图像才是！(图4)