现如今,一提及到人工智能,或许很多人都会在第一时间想到AlphaGo,没错,它确实在某些方面已经强大到足够去战胜人类,超越人类,但是正如我们所说,人工智能目前还不够智能,因为它与人类还是有差距的,至少它们永远无法独立的完成一部书的写作,无法欣赏人类可以欣赏的美。
你想错了,以上这些它们都做到了。
我必须告诉你,人工智能破解了一个被人们广泛使用的工具:验证码,用于区分人类和机器人的工具。
验证码是烦人的谜题,可能会要求你填写扭曲的图片中的文本,或者点击图片中所有的汽车。根据最近在科学杂志上发表的一篇研究,一种新型的 AI 能够以高达 66.6 %的准确率决某些类型的验证码。作为对比,人类的准确率为 87%,而机器只要能够达到 1 % 的准确率,则被认为已经破解验证码。
验证码(CAPTCHA),全称全自动区分计算机和人类的图灵测试,发明于 20 世纪 90 年代后期,最初用于防止欺诈和垃圾邮件机器人。基本的想法是创建一个人类容易破解,而计算机很难破解的难题。
计算机很擅长计算,阅读纯文字也不难,在动态和静态图片中识别物体的能力也越来越强,但当这些图像稍微扭曲时,电脑就陷入了死循环。原因在于,我们可以训练计算机识别所有字体中的“M”,但这些 M 却可以以无数种方式进行扭曲,计算机不具备概括能力。
从一小部分例子中学习和概括的能力是我们的大脑与计算机的差异之一,这种能力使我们能够轻松地解决验证码。正如科学杂志上介绍的那样,扎克伯格和贝佐斯资助的人工智能公司 Vicarious 的研究人员开发了概率机器视觉算法,该算法能够理解并通过验证码测试,因为它可以从一些小例子中进行概括。
其他研究人员已经训练了深度学习算法来破解验证码,但是这些算法通常需要数百万个标记的案例来训练算法,而且只能解决一种特定的样式。而 Vicarious 的人工智能可以破解各种文本的验证码风格,并且效率更高。
借鉴了 “实验神经科学数据” 的见解,Vicarious 的研究人员提出了一种称为递归皮层网络的概率算法,该算法将验证码作为一个基于文字训练图像的形状和外观的集合(例如字母表面的平滑性)。
其他神经网络能够识别那些由人工标记过数百万次的单词和字母的训练样本。而递归皮层网络更接近真实的人类大脑对视觉线索的反应。 RCN 首先根据字母轮廓和少数几个未被扭曲的示例字母的外观生成模型,然后用它来确定在扭曲的验证码短语中对应的是哪个字母。
正如研究人员在文章中写到的,如果一台机器能以高于 1% 的准确率解决这个问题,那么验证码就被破解了。 Vicarious 算法提供了多种不同的验证码风格,并且在破解方面具有非常高的成功率。 它解决 reCAPTCHA 的准确率为 66.6%,BotDetect 的准确率为64.4%,雅虎验证码的准确率为 57.4%,Paypal 验证码准确率为 57.1%,所有这些只需要“非常少的训练数据”。 例如,对于 reCAPTCHA,算法每个字符只训练了五个非失真的案例。
其他现有技术的神经网络将需要比实际验证码字符串大 5 万倍的训练集,而不仅仅是清晰的字符。 作为一个基准,研究人员使用不同的神经网络模型来达到 89.9% 的准确率,但是它需要 230 万训练图像才能到实现,而且当验证码做出很小的改变时,准确率就会大大下降。
新算法的主要改进在于,Vicarious 的研究人员创建了一个神经网络,该神经网络将根据形状和外观创建字母模型 可以用来“理解”验证码。而不是通过数百万个验证码实例来训练神经网络破解特定类型的验证码。
研究人员在创建了可以解决各种验证码的神经网络,意味着人类将不得不开始寻找更强大的机器人训练机制。Google 开创的一个解决方案就是音频 reCAPTCHA,就像文本验证码一样,但通过语音。 最近马里兰大学的一个计算机科学家团队创建了 unCaptcha,一个免费的算法,可以在几秒钟内解决 reCAPTCHA ,准确率达到 85% 以上。
尽管验证码在可预见的将来仍然可能被用作互联网的第一道防线,但它不能保证网站的访客百分之百是真人。不久之后,我们可能会使用银翼杀手中的“人性测验”来登陆网站。