热点:

    专访INDEMIND:计算机视觉助力行业升级

      [  中关村在线 原创  ]   作者:李泽卿   |  责编:邓旭

        计算机视觉,虽然是一个不显山不露水的技术名词,但它却已被众多科研人员深入研究超过30年。从扫地机器人到智能驾驶,从无人机到智能安防,这些前沿科技的背后,都有着它的身影。

        近年,当计算机视觉这股风潮刮起时,国内涌现出了一批涉足其中的创业团队。INDEMIND算是其中之一。

        作为一家成立时间不足2年的创业公司,INDEMIND到目前为止已经成功发布了基于计算机视觉的真正混合现实头显MELLO与专为行业打造的双目惯性视觉模组。与不少在计算机视觉技术领域风风火火研究技术应用的公司不同,INDEMIND自成立之初就选择了以计算机视觉技术为根,致力技术研发,逐步解决其他行业痛点的道路。

        INDEMIND认为,摄像头将是未来最有价值的信息输入终端,绝大多数智能设备都将拥有视觉信息的采集能力和对环境的感知能力,计算机视觉技术将在其中扮演核心角色。

         在设备智能化进程中,INDEMIND将扮演何种身份?对于尚不明朗的混合现实行业,INDEMIND有何种见解?计算机视觉技术如何深入落地到其他行业之中?

         带着这些问题,我们采访了INDEMIND CTO 闫东坤博士。

    专访INDEMIND:计算机视觉助力行业升级

    软硬一体,提升计算机视觉技术基础设备水平

         在INDEMIND的办公室第一次见到了闫东坤博士,当我们抛出问题的那一刻,这个之前有些寡言的工程师,才算打开了话匣子。

         “现有的计算机视觉技术硬件、算法水平不足以实现我们预想的研发目标”

         一开始,闫博士便向我门分析了计算机视觉现状。在他们看来,计算机视觉技术在其他行业发挥作用之前,首先要解决的是计算机视觉自身的问题。而想要解决这一问题,硬件与算法缺一不可。

         “市场上有很多开源的算法与现成的硬件设备,我们略作修改就能用,但这样根本无法解决客户的实际问题,为此我们决定自主研发算法与硬件”

    专访INDEMIND:计算机视觉助力行业升级

         最终,INDEMIND深入研究并开发了一款双目视觉惯性模组,但自主研发的道路并非一帆风顺。

         “纯视觉的应用在很多复杂环境下,有很多问题,比如快速机动、明暗变换等场景都极易引起计算机视觉的失效”

         为了解决这个问题,INDEMIND采用了基于视觉+IMU的多传感器融合的方式,这种技术也带来了较高的研发难度,难点在于通过引入动力学方程,将视觉的测量量与IMU的测量量进行状态合并,构建系统方程和观测方程,进行误差估计。

         庆幸的是,INDEMIND依托技术人员在多传感器融合方面深厚的经验,通过与国际领先的专业视觉影像技术开发公司Omnivision合作,联合开发了双目摄像头及IMU传感器时间同步解决方案,控制时间同步精度至微秒级,极大提高了传感器间的时间同步精度,成功将视觉传感器的慢速运动高精度与IMU传感器的大量程和短时间高精度相结合,并且采用INDEMIND低成本传感器标定方式,对多传感器间的相对位置、误差、内外参进行了高精度补偿标定,保障了前端场景信息获取。

         在算法上,INDEMIND同样完全自主研发。INDEMIND的算法方案前端采用视觉+惯性等传感器获取前端信息,后端建立场景稠密、稀疏地图,实现了物体的语义识别及定位,整个软硬件方案实现了高精度Vi-SLAM、路径规划、智能避障、图像语义等功能,并且还可为机器人、智能摄像头等行业提供自主导航、三维感知、环境语义等感知功能,让设备拥有了对世界的感知和认知能力。

     混合现实,将是掀起下一代交互革命的钥匙

    “现在无论是VR、AR还是MR,行业尚不明朗,INDEMIND为何入局?”

         对这个略显尖锐的问题,闫博士表达了自己的认识与看法。

         在INDEMIND看来,MR设备作为穿戴计算中最复杂的一个分支,将是掀起下一代交互革命的一把钥匙, INDEMIND自研的高精度高帧率Vi-SLAM算法与视觉惯性模组在实现流畅精准交互体验的同时,结合基于深度学习的环境语义等算法,INDEMIND拥有了真正可以让虚拟与现实交融的技术。为此,INDEMIND打造并发布了国内首款采用自研inside-out定位的真正混合现实头显——MELLO。目前这款产品业已上线京东众筹。

    专访INDEMIND:计算机视觉助力行业升级

         基于计算机视觉技术打造的MELLO,融合了现实和虚拟双重世界,产生了新的可视化环境。在新的可视化环境里展现出了全新的显示及交互,这是MELLO最重要的技术之一。在行业应用中,这一特点更能贴合场景符合用户需求,在专业工具、虚拟仿真、职业培训等应用更具有潜力。

         另外一方面,基于行业对大空间方案的需求与方案普及难度的考虑,INDEMIND将大空间方案成本将至为“0”。

         关于这种“0”成本,闫博士也给了我们详尽的解释.

         “首先是硬件0成本,除了根据人数配套相应数量的MELLO,无需其他任何设备费用。其次是部署维护0成本,不只部署非常简单,也不再需要频繁的对设备进行校准和标定。”

          对比光学捕捉方案和激光串联方案,INDEMIND方案更具优势。做到了仅需要设备就可以支持大空间定位的程度,所以这一产品的应用空间是巨大的,这是目前市面上的VR,AR设备难以企及的。这也正是MELLO的独有优势。因此,INDEMIND有信心在B端商业市场获得青睐,静待C端消费市场的全面爆发。

    算法整合,助力多行业智能升级

         INDEMIND坚信计算机视觉技术将助力其他行业智能升级。为此,INDEMIND整合自家算法,打造了一系列解决方案。

          INDEMIND 自研的感知技术,研发了图像前端计算解决方案,搭载高性能计算单元及可见光摄像头等多种消费级传感器,算法与芯片深度整合,赋予摄像头空间感知能力,结合空间信息分析图像,提升安防、监控领域的只能识别能力,可广泛应用于辅助驾驶、新零售、智能安防、智能照明的领域。

    专访INDEMIND:计算机视觉助力行业升级

    “机器人是近来大热的风口,但真正的机器人必须具有环境感知能力”

          闫博士向我们着重介绍了INDEMIND的环境感知解决方案。该方案可为机器人提供高精度导航定位以及图像语义识别,满足机器人自主导航的同时,提供更多维度的认知能力,可广泛应用于清洁、教育、接待等行业机器人

          以扫地机举例,搭载INDEMIND环境感知方案的扫地机不仅能够理解前方是否存在障碍物,还可理解障碍物是桌子还是沙发,并还可理解房屋空间布局,智能规划最优清扫路径。

         在谈及INDEMIND未来规划时,闫博士告诉我们,计算机视觉的应用潜力十分巨大,随着研究的深入,计算机视觉将衍生出更多全新的应用与更多的图像处理技术,这需要INDEMIND与众多行业伙伴共同探索。而对于INDEMIND的未来规划,闫博士也早已做好了准备。

         “继续深耕计算机视觉技术研发,致力于为行业带来更多应用创新,探索更多可能的应用场景与解决方案,力争上游”

        “通过计算机视觉技术助力更多行业的智能化升级,带动全产业升级”

          在INDEMIND的办公室中,不知不觉已经和闫博士聊了一个多小时,在这段时间中,闫博的话语中流落了太多的对行业的思考与对技术的探索,我想,无论计算机视觉技术未来发展如何,闫博士带领团队将与INDEMIND一起走在探索创新的路上。

    本文属于原创文章,如若转载,请注明来源:专访INDEMIND:计算机视觉助力行业升级http://geek.zol.com.cn/697/6970263.html

    geek.zol.com.cn true http://geek.zol.com.cn/697/6970263.html report 5389 计算机视觉,虽然是一个不显山不露水的技术名词,但它却已被众多科研人员深入研究超过30年。从扫地机器人到智能驾驶,从无人机到智能安防,这些前沿科技的背后,都有着它的身影。近年,当计算机视觉这股风潮刮起时,国内涌现出了一批涉足其中的创业团队。INDEMIND算是其...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    • 第1页:专访INDEMIND CTO闫东坤
    • 猜你喜欢
    • 最新
    • 相关
    推荐经销商
    投诉欺诈商家: 400-688-1999
    • 北京
    • 上海
    • 航拍仪(无人机)
    • 新品上市
    推荐问答
    提问
    • 论坛精选
    • 最热回答
    0

    下载ZOL APP
    秒看最新热品