肇观电子冯歆鹏:五大技术让机器人看懂世界,AI视觉芯片实现颠覆式创新丨GACS 2023
我平常随身也带着芯片,放在一个小盒子里,给大家展示一下;做芯片就是有这个好处,产品非常小,可以随身携带。
我们花了很多力气在做这个产品,来解决客户的问题。举例来讲,很多很严苛的客户,要求我们把眼睛要做到世界第一;在没有我们的时候,是有一家海外的巨头来提供类似的模组。有了我们之后,我们被客户要求替代掉海外巨头,被要求在很多的技术点上要磨到世界第一。
举一个很简单的例子,像这样的模组,它的连接是USB3.0的连接,大家可能有些人比较熟悉,就是一根线,拖出来插到电脑上充电也好,数据传输也好,都可以用。从技术角度而言,USB协议其实不是一个特别稳定可靠的协议。大家如果关注这一点,在工业这种场景下,不稳定可靠是致命的,如果通过USB连接,把这个数据稳定传出来,我们的客户要求我们10万小时的连接不能中断一次,这就要求非常高了。所以为了达到这样的目标,就是海外巨头都做不到这一点,因为它有一些天生的不足导致的问题。
为了达到这个10万小时一次连接都不断,我们被迫要去在芯片级、在所有的底层驱动都重新写一遍,在跟它连接的另外一端的软件也要重新写一遍,所以全部的硬件软件都要重新做,所以才能做到10万小时不断连接的场景,这只是客户的诸多非常细的要求之一。
在这个过程中,我们能够提供给客户稳定的、可靠的、智能的、3D的深度的相机,适用于各种极限场景,比如说我们有冷库机器人的客户,它的机器人常年在零下18度搬海鲜的客户,它的眼睛就需要在零下18度每次都能正常启动,完成它的任务,然后再关机。但是比如海外巨头的产品在零下18度开机都开不出来,我们被要求在如此低温下能正常工作。我们也被要求在非常高温下要能正常工作,所以这里面有非常多的客户需求。
肇观也应一类客户要求,在OCR的领域做了很多事情。不谦虚地讲,在自然光照条件下各种复杂文本的采集分析方面,我们在这个领域,在全球范围内做得算是比较领先。
举例子来讲,比如弯曲的各种文字、不同的背景下,我们文字的采集、文字识别和处理做得比较领先。比如说,右下角这是一个日本的报纸,日文报纸有竖排、横排混在一起,我们就被客户要求把它完全正确处理出来,而且把顺序排好,要能够语义能够理解出来。所以在OCR领域,我们做了很多事情,现在已经支持十几种不同国家的语言了,在这个领域算法做得比较领先。
这是我们OCR的具体例子,我们的识别准确率,我们支持中文、英文、日文、韩文、阿拉伯语、西班牙语、葡萄牙语、法文、德文、荷兰语等各国语言,我们支持各国语言的OCR,我们在这方面做得算是世界领先之一,我们不仅做逐字的识别,在表格的识别,还在各种时尚杂志、绘本等复杂页面里面,能把该提取的东西提取出来,不该提取的不提取,在这里面我们做了非常多的事情。
微信扫码关注该文公众号作者