网络营销

您所在位置:首页 > 网络营销 > 正文

Google 带来了一种手语识别算法,让你明白别人究竟在比划啥

文章作者:www.dlhot.com发布时间:2020-02-19浏览次数:1849

我喜欢昨天分享它

对于大多数人来说,通过说话来沟通是理所当然的。但世界上仍有一小群人。由于先天或后天的原因,他们不能做我们理所当然的事。对于一些有听力和语言障碍的人来说,手语就在他们之间。沟通方式。

问题是虽然手语解决了他们彼此沟通的方式,但对于大多数习惯说话的人来说,手语和外语之间可能没有本质区别。如何将手语轻松转换为口语已成为近年来的一个新的研究课题,Google AI Lab带来的新算法可能成为解决这一问题的新方法。

这项新技术采用了一些巧妙而有效的方法,随着机器学习变得更加高效,手机的使用实现了高精度的手和手指跟踪,带来了许多新的可能性。

▲图像描述。图片来自:xxx

“今天最先进的方法依赖于强大的桌面环境,我们的方法可以实现对手机的实时跟踪,甚至可以扩展到多手,”谷歌研究人员在官方博客中写道。强大的手部跟踪算法是具有挑战性的计算机视觉任务,因为手部经常被运动遮挡并且缺乏高对比度模式。

不仅如此,手的动作通常是快速而微妙的。这不是计算机擅长的实时跟踪。即使使用多摄像头和深度传感器的SignAll,跟踪每个动作仍然是一项艰巨的任务。

在这种情况下,研究人员只能最小化计算机需要过滤的数据量,以提高其响应速度和跟踪精度。

首先,他们放弃了追踪整只手的大小和位置。相反,他们只让系统找到手掌。这不仅是手中最独特可靠的部分,而且也接近矩形,这意味着系统不必处理很多复杂的图案。

当首先识别手掌部分时,单独识别和分析伸出的手指部分,并且单独的算法将其分配给21个坐标,粗略地描绘指关节和指尖,包括手指部分已经延伸多远。并且系统还可以根据手掌的大小和角度进行猜测。

为了完成手指识别的部分,研究人员必须手动将大约21块手掌放在图片下方。与往常一样,每个强大的机器学习系统都要求研究人员在开始时提供数据。

一旦确定了手势,就可以很容易地将这些手势与当前已知的手语含义相关联,从简单的字母和数字到具有特定名词含义的手势。最后,响应性和准确的手势识别算法诞生了,可以在智能手机而不是桌面上运行。

这种算法的出现也可以改善那些现有的识别系统,但是在AI真正理解手语之前还有很长的路要走,因为它是一种手势,面部表情和其他细节。丰富多彩的沟通方式。但现在我们正朝着更好,更好的方向前进。

最后,谷歌研究人员写道:“我们希望向更广泛的研究和开发社区提供这种手势意识,并期望创造性案例的出现,以刺激新的应用和新的研究方法。”

非常健康

收集报告投诉

对于大多数人来说,通过说话来沟通是理所当然的。但世界上仍有一小群人。由于先天或后天的原因,他们不能做我们理所当然的事。对于一些有听力和语言障碍的人来说,手语就在他们之间。沟通方式。

问题是虽然手语解决了他们彼此沟通的方式,但对于大多数习惯说话的人来说,手语和外语之间可能没有本质区别。如何将手语轻松转换为口语已成为近年来的一个新的研究课题,Google AI Lab带来的新算法可能成为解决这一问题的新方法。

这项新技术采用了一些巧妙而有效的方法,随着机器学习变得更加高效,手机的使用实现了高精度的手和手指跟踪,带来了许多新的可能性。

▲图像描述。图片来自:xxx

“今天最先进的方法依赖于强大的桌面环境,我们的方法可以实现对手机的实时跟踪,甚至可以扩展到多手,”谷歌研究人员在官方博客中写道。强大的手部跟踪算法是具有挑战性的计算机视觉任务,因为手部经常被运动遮挡并且缺乏高对比度模式。

不仅如此,手的动作通常是快速而微妙的。这不是计算机擅长的实时跟踪。即使使用多摄像头和深度传感器的SignAll,跟踪每个动作仍然是一项艰巨的任务。

在这种情况下,研究人员只能最小化计算机需要过滤的数据量,以提高其响应速度和跟踪精度。

首先,他们放弃了追踪整只手的大小和位置。相反,他们只让系统找到手掌。这不仅是手中最独特可靠的部分,而且也接近矩形,这意味着系统不必处理很多复杂的图案。

当首先识别手掌部分时,单独识别和分析伸出的手指部分,并且单独的算法将其分配给21个坐标,粗略地描绘指关节和指尖,包括手指部分已经延伸多远。并且系统还可以根据手掌的大小和角度进行猜测。

为了完成手指识别的一部分,研究人员必须手动将大约21个手掌放在图片下方。与往常一样,每个强大的机器学习系统都要求研究人员在开始时提供数据。

一旦确定了手势,就可以很容易地将这些手势与当前已知的手语含义相关联,从简单的字母和数字到具有特定名词含义的手势。最后,响应性和准确的手势识别算法诞生了,可以在智能手机而不是桌面上运行。

这种算法的出现也可以改善那些现有的识别系统,但是在AI真正理解手语之前还有很长的路要走,因为它是一种手势,面部表情和其他细节。丰富多彩的沟通方式。但现在我们正朝着更好,更好的方向前进。

最后,谷歌研究人员写道:“我们希望向更广泛的研究和开发社区提供这种手势意识,并期望创造性案例的出现,以刺激新的应用和新的研究方法。”

非常健康