机器视觉

赛灵思reVISION击开视觉导向机器学习之门

2025China.cn   2017年03月22日

  人工智能的兴起让机器学习成为了时下最为火热的领域之一,围棋人机大战为更多人普及了智能的认识。大多数机器学习都是基于大规模网络支持背景下对于算法和信息的深度优化。现有人工智能机器学习的特点是高功耗支持下高速运算,但对于嵌入式系统方面的应用而言,鉴于能耗以及网络条件的不确定等因素的限制,机器学习的实现则需要跨越重重阻隔。2017年3月13日FPGA领域的领导企业赛灵思推出了强大工具reVISION——嵌入式视觉堆栈,实现视觉导向的机器学习应用让开发人员的生产力再次得到解放。

左起,Xilinx公司战略与市场营销部高级副总裁Steve Glaser,Xilinx 嵌入式视觉和SDSoC高级产品经理,Nick Ni
 

  为什么一定要是视觉?

  赛灵思之所以选择视觉作为机器学习应用,是因为在当今摄像头的广泛应用,让视频文件数量形成了爆炸式增长,机器完全可以通过视觉引导识别视频中的每一帧的内容并且进行学习和记录,如无人机,自动驾驶,和工业机器人等嵌入式等应用也是完全基于视觉引导,摄像头的使用相当于给机器装上了眼睛,据统计差不多80%最初的机器学习的应用都是以视觉系统为基础,而其余有20%的应用是关于控制系统和安全性应用。

 

  实现端到云的部署

  对于云端数据应用,赛灵思已经推出了可重配置加速堆栈,它可以满足目前云端数据分析处理的需要,而对于边缘端的应用赛灵思今天又推出了reVISION作为更全面的补充。

  红色的部分关于与工业领域的相关的应用,从左到右展示了从用户端到云端的各种场景的应用,虚线中的应用为赛灵思器件已经服务的领域,但无需栈辅助的应用。

 

  技术核心——融合

  赛灵思发布reVISION,最大特点就是融合。赛灵思战略与市场营销高级副总裁Steve Glaser在宣讲reVISION的最大特点的时候强调了它的融合能力,将视觉,机器学习,多种传感器融合以及链接控制,四大关键点打通,形成独一无二的开发环境。

  reVISION 堆栈把机器视觉,机器学习,传感器融合,以及链接,四者在赛灵思开发板上实现融合。

 

  传感器在应用中出现的融合趋势,也是为什么可重配置能力的系统能够胜出的原因,现在的应用已经不再是仅仅对环境或者化学机械方面的侦测,融合的趋势让机器学习的能力得到了进一步的扩展,仅在成像方面就出现了多种传感的融合。这又不得不提到ADAS,在这方面赛灵思reVISION对比mobileye 不仅能够提供视觉传感方面的处理,而且还能实现机器学习。

  仅在成像方面,就出现了多种传感的融合

 

  更高执行,更低时延

  与CPU,GPU和传统SOC相比,但是在效率和运行速度上都无法与reVISION想比尤其在低时延方面赛灵思的优势非常明显。以Nvidia的tegra 为例,基于谷歌网络(Googlenet)条件下运行,赛灵思reVISION与英伟达Tegra对比测试差别高达6倍的推理速度,42倍的帧率速度,并且小于1/5毫秒的时延。案例方面以自动驾驶为例,汽车在突然紧急制动时速是65英里,赛灵思的reVISION响应时间是2.5毫秒,Nvidia的解决方案的响应时间可以从49毫秒一直到320毫秒,取决于工程师是如何来部署tegra系统,这种响应时间的差异也体现在实际停车距离上,这个距离差是5英尺到33英尺不等,这期间的区别很有可能最后转化成结果,就是是否发生了撞车甚至撞到了行人。同时,低时延在工业方面也会涉及到生产安全的,医疗领域的远程诊断以及手术实施亦是离不开低时延的支持。

  那为什么赛灵思能够实现这样快速的响应速度呢?典型的嵌入式的GPU和典型的SoC,传感器的数据需要外部存储,在处理的步骤当中,也需要不断的去访问外部存储。但是如果是赛灵思的Zynq器件的话,就能够非常简化获得非常直接的数据流,直接的经过传感器,传感器的处理,机器学习,一直到控制。这就会对响应的时间造成很大的影响,除此以外,还会影响到可预见性,也就是用户所说的决定性,用户希望整个过程是可以预见的,可以确定的,并且响应速度要很快。所以赛灵思能够提供非常快速的决定性的响应,同类竞争产品的响应速度则要慢很多,而且大多是不可预见的。

  降低开发门槛

  赛灵思作为硬件芯片公司,也将各种库和算法进行了开发并集成到了reVIISION当中,简化了工程师80%的工作。在revision的开发环境里可以降低硬件知识门槛,让工程师能够快速上手。通过reVISION,能够使得用户在他们比较熟悉、比较喜欢的环境下来进行开发,说到的框架就是Caffe,还有习惯使用的库,还有其他的机器学习的一些元素,它可以大大简化开发过程,但是有些情况用户还是需要开发过程中开发自己库的功能,比如说计算机视觉方面来支持他的库,有些环节现在还缺失。另外,用户也需要一些小的知识来修改一些以C语言为基础的库来做计算机视觉,来实现对Zynq器件的编译。此外利用赛灵思器件的INT8优化也可以针对嵌入式视觉进行深度学习方面的优化开发,对比其他FPGA DSP 而言可以获得1.75倍的解决方案性能。

  工业领域的应用场景

  对于工业领域方面的视觉引导类应用开发,就不得不提到机器视觉以及柔性协作机器人。人机协作随工业4.0的兴起被逐渐得到重视,但还是未得到大规模普及,对于低时延的要求成为考量安全标准的重要因素,赛灵思reVISION显然不怕来自于时延方面的考量,而在实现制造产线的灵活性的制造方面,视觉引导的机器学习将发挥巨大作用,按需制造的柔性生产的多品类混流制造也是机器视觉和机器学习融合的开发方向,其他领域的工业应用如造价高达几百万的电力巡检机器人,高危地区的检测等等也都是基于视觉引导类的学习类应用,相信reVISION也会更多的在工业检测类应用项目中出现,为智能制造的创新开拓新路。

标签:赛灵思 视觉导向 嵌入式 reVISION 我要反馈 
什么是新一代机器人界面(HMI)?
ABB协作机器人,自动化从未如此简单
优傲机器人下载中心
即刻点击并下载ABB资料,好礼赢不停~
西克
专题报道