机器人现可完全破解验证码:未来安全技术何去何从?

article/2025/6/8 14:35:56

引言

随着计算机视觉技术的飞速发展,机器学习模型现已能够100%可靠地解决Google的视觉reCAPTCHAv2验证码。这标志着一个时代的结束——自2000年代初以来,CAPTCHA("全自动区分计算机与人类的图灵测试"的缩写)一直是区分网站访问者与机器人的最流行工具。对于企业来说,这意味着是时候永久性地放弃reCAPTCHA技术了。对用户而言,这也是个好消息,因为他们往往发现解决验证码是一件令人烦恼的事情。然而,数百万网站仍在使用验证码,因此了解为何reCAPTCHA不再有效至关重要。

1. 图像识别机器人已赶上人类

1.1 机器学习模型的突破

独立研究人员经常测试包括验证码在内的在线安全工具,以评估它们对潜在攻击者的抵抗能力。直到最近,图像识别AI模型对视觉reCAPTCHA(要求用户查看3x3图像网格并识别诸如路灯或公交车等常见物体的验证码)的成功率约为70%。2024年9月,瑞士苏黎世联邦理工学院(ETH Zurich)的研究人员宣布,他们已经构建了一个高效的AI模型,能够100%击败视觉reCAPTCHA。

这些研究人员在14,000张交通图像上训练了一个名为YOLO("You Only Look Once")的实时对象识别机器学习模型,然后用它来解决单个reCAPTCHA挑战。这个开源模型能够以69%到100%的准确率正确识别不同类型的图像,对于无法解决的挑战,它会要求展示另一个验证码。最终,该模型能够在平均约19次尝试中击败每个reCAPTCHA。

值得注意的是,模型或人类击败reCAPTCHA挑战所需的尝试次数之间没有统计学上的显著差异。此外,YOLO模型可以在有限的处理能力下本地运行。这意味着它可以被欺诈者大规模部署用于进行机器人攻击。

1.2 为什么不制作更难的验证码?

自2014年以来,神经网络已被用于可靠地绕过基于文本的验证码(自2011年起用于音频验证码)。现在模型也能持续击败视觉挑战,开发者需要寻找新的方法来检测机器人。但是,有充分理由不继续发展CAPTCHA范式:

  • 对人类来说太难:reCAPTCHA已经以对人类难以解决而闻名。让它们变得更难可能会赶走更多合法的网站访问者。根据挑战类型的不同,它们还会给视障或听障人士带来无障碍问题。
  • 消耗太多时间:人类用户解决基于图像的reCAPTCHA大约需要10秒钟,这会降低用户体验。自验证码发明以来,人类已花费8.19亿小时解决reCAPTCHA(这几乎相当于1,200个人的寿命!)
  • 损害销售:实施更难的挑战可能会对转化率产生比当前reCAPTCHA更糟糕的影响。研究估计,验证码会使转化率降低3%至40%。
  • 这是一场无法获胜的军备竞赛:由于机器人学习击败它们的速度,没有单一的验证码能长期有效。

总结起来,这些缺点明显多于优点。企业需要探索reCAPTCHA的替代方案来保护其网站。

2. 有效的机器人检测策略

2.1 多层次机器人检测方法

检测机器人的有效方法是将设备智能作为多层次欺诈检测方法的一部分,该方法结合技术数据和行为特征来形成对用户行为和意图的完整图像,同时不影响客户体验。一些公司可以共同使用的最有效技术包括:

  • 蜜罐技术:在表单提交中设置对使用图形界面浏览的人类用户不可见但对机器人可见的隐藏字段,从而诱捕机器人。如果人类填写表单,则该字段为空白,但当机器人扫描网站的HTML代码时,它们会填写该字段。这会标记它们的提交以进行阻止。
  • 行为分析:滚动时间、鼠标移动和导航模式等指标有时可以区分人类用户和机器人。机器人倾向于以闪电般的速度在操作之间移动,且没有犹豫。
  • 机器学习:在已知的人类和机器人交互的大型数据集上训练模型,以发现模式。这些发现的模式随后可以帮助实时识别机器人的行为。
  • 设备智能:全面的设备智能平台分析数百种浏览器和设备特性,可用于标记可能表明机器人冒充真实用户的可疑活动和设备。
  • IP黑名单:检查访问者IP地址是否与定期更新的已知机器人IP、数据中心范围和恶意代理数据库匹配。

所有这些机器人检测策略都在后台无形中工作,收集数据并发现模式,而不会打扰合法的人类用户。它们共同提供了一种深度防御方法,能够随着欺诈者不断发展的技术而调整。

3. 结语

reCAPTCHA不再提供它承诺的机器人保护。设备智能是阻止恶意机器人尝试入侵客户账户、降低网站速度或抓取网站内容的更好替代方案。

随着计算机视觉和机器学习技术的不断发展,传统验证码技术已经无法有效区分人类与机器。企业需要采用更先进、更智能的解决方案,如多层次欺诈检测系统、行为分析和设备智能等技术,以保护网站安全并提升用户体验。最终,无需打扰用户的"无形"安全措施将成为未来网络安全的主要发展方向。


http://www.hkcw.cn/article/asZFFXMgOf.shtml

相关文章

AI赋能SEO关键词革新

内容概要 随着人工智能技术与搜索引擎优化的深度融合,传统关键词策略正经历系统性变革。基于智能语义分析与深度学习算法,AI能够实时解析海量搜索数据,构建动态更新的关键词库,突破人工筛选的局限性。通过自然语言处理技术&#…

深入解析Java11核心新特性

文章目录 前言一、标准化HTTP Client:告别HttpURLConnection1.1 HttpURLConnection 的痛点1.2 标准化 HTTP Client 的解决方案1.3 实战应用指南1.4 总结 二、局部变量类型推断增强:Lambda中的var2.1 解决的问题:类型声明的一致性困境2.2 实现…

香橙派3B学习笔记6:基本的Bash脚本学习_UTF-8格式问题

今日学习基本的linux 的一些 bash 脚本 ssh : orangepi本地ip 密码 : orangepi 操作系统发行版: 基于 Ubuntu 20.04.6 LTS(Focal Fossa)的定制版本,专门为 Orange Pi 设备优化。PRETTY_NAME"Orange P…

腾讯下乡了。。。

大家好,我是苍何。 这两天在网上出现很多腾讯元宝在乡下的横幅,着实把我吓了一大跳。 甚至养猪问题也可以直接问元宝🐶 前两天,刚好回乡下给我儿子过 2 岁生日,家里大婶的弟弟就是专业的养猪大户,在吃饭的…

如何在PowerBI中使用Analyze in Excel

如何在PowerBI中使用Analyze in Excel 之前分享过如何使用DAXStudio将PowerBI与Excel连接 ,今天介绍另外一个工具,也可以实现同样的功能,Analyze in Excel。 使用Analyze in Excel 第一步: 首先准备好一个PBIX文件&#xff0c…

接口测试的用例设计

1.简介 在这篇文章里,我们来学习一下接口测试用例设计,主要是来学习一些用例设计要点。其实说白了,接口用例设计和功能用例设计差不多,照猫画虎即可。不要把它想象的多么高大上,多么的难,其实一样&#xff…

AI“实体化”革命:具身智能如何重构体育、工业与未来生活

近年来,人工智能(AI)技术的飞速发展正在重塑各行各业,而具身智能(Embodied AI)作为AI领域的重要分支,正逐渐从实验室走向现实应用。具身智能的核心在于让AI系统具备物理实体,能够与环…

车规级BMS芯片国产化!精准电量监测延长电池寿命

通品替代芯片充电管理类应用值得一看:华芯邦以创新技术领航国产化新赛道。 在消费电子、新能源汽车、工业设备等领域,电源管理芯片如同设备的“心脏”,直接决定了产品的续航能力、安全性和用户体验。然而,长期以来,这…

【摘录】LCD/LED/OLED/Micro LED

端午节焦点访谈播出了:成都辰显光电有限公司总经理黄秀颀博士作为科技领军人才代表出镜,分享了其带领团队推进Micro-LED技术创新与产业化。作为显示行业的一份子很惭愧,对这些技术还是一片空白,补补知识吧。 1、LCD(液…

C++和C#界面开发方式的全面对比

文章目录 C界面开发方式1. **MFC(Microsoft Foundation Classes)**2. **Qt**3. **WTL(Windows Template Library)**4. **wxWidgets**5. **DirectUI** C#界面开发方式1. **WPF(Windows Presentation Foundation&#xf…

【氮化镓】钝化层对p-GaN HEMT阈值电压的影响

2021年5月13日,中国台湾阳明交通大学的Shun-Wei Tang等人在《Microelectronics Reliability》期刊发表了题为《Investigation of the passivation-induced VTH shift in p-GaN HEMTs with Au-free gate-first process》的文章。该研究基于二次离子质谱(SIMS)、光致发光(PL)…

Juce实现Table自定义

Juce实现Table自定义 一.总体展示概及概述 在项目中Juce中TableList往往无法满足用户需求,头部和背景及背景颜色设置以及在Cell中添加自定义按钮,所以需要自己实现自定义TabelList,该示例是展示实现自定义TableList,实现自定义标…

VBA 64位API声明语句第010讲

跟我学VBA,我这里专注VBA, 授人以渔。我98年开始,从源码接触VBA已经20余年了,随着年龄的增长,越来越觉得有必要把这项技能传递给需要这项技术的职场人员。希望职场和数据打交道的朋友,都来学习VBA,利用VBA,起码可以提高…

【鸿蒙】HarmonyOS NEXT之如何正常加载地图组件

1、不支持模拟器,需要真机! 2、Map地图需要在AGC上申请权限,需要在AGC上创建对应的项目 地址: AppGallery Connect 2.1 AGC中项目创建 2.1.1 添加项目 2.1.2 起个名字 2.1.3 添加应用: 2.1.4 选择HarmonyOS APP&…

精美的软件下载页面HTML源码:现代UI与动画效果的完美结合

精美的软件下载页面HTML源码:现代UI与动画效果的完美结合 在数字化产品推广中,一个设计精良的下载页面不仅能提升品牌专业度,还能显著提高用户转化率。本文介绍的精美软件下载页面HTML源码,通过现代化UI设计与丰富的动画效果&…

3. 简述node.js特性与底层原理

😺😺😺 一、Node.js 底层原理(简化版) Node.js 是一个 基于 Chrome V8 引擎构建的 JavaScript 运行时,底层核心由几部分组成: 组成部分简要说明 1.V8 引擎 将 JS 编译成机器码执行&#xff0…

【后端高阶面经:架构篇】51、搜索引擎架构与排序算法:面试关键知识点全解析

一、搜索引擎核心基石:倒排索引技术深度解析 (一)倒排索引的本质与构建流程 倒排索引(Inverted Index)是搜索引擎实现快速检索的核心数据结构,与传统数据库的正向索引(文档→关键词&#xff0…

LayoutLM 模型文章总结

模型处理的文本图片样例: LayoutLM,一种简单而有效的文本和布局预训练方法,用于文档图像理解任务。BERT模型中输入的文本信息主要通过文本嵌入和位置嵌入来表示,LayoutLM 增加了两种输入嵌入: (1) 二维位置嵌入&…

低成本单节电池风扇解决方案WD8001

功能说明 1 、充电参数: 5V/500mA ,满电 4.2V ,充电指示灯为 LED4 ,充电亮, 满电熄灭; 2 、工作电压: 2.7---4.2V,BAT 电压低于 2.7V ,芯片禁止输出; 3 、工作说明&a…

6个月Python学习计划 Day 13 - 文件操作基础

第一周 Day 1 - Python 基础入门 & 开发环境搭建 Day 2 - 条件判断、用户输入、格式化输出 Day 3 - 循环语句 range 函数 Day 4 - 列表 & 元组基础 Day 5 - 字典(dict)与集合(set) Day 6 - 综合实战:学生信息…