Browser-Use实践

article/2025/8/22 0:34:37
  1. 构建一个包含 3 轮对话的上下文,调用 API 获取最终回复 and 发送一张图片并获取描述。

  2. 自行探索,并使用 Browser-use Web-UI 自带的录制功能,将书生大模型操作浏览器过程录制下来,放到作业中。

安装虚拟环境

conda create -n Internlm python=3.10

conda activate Internlm  

conda deactivate  

pip install requests openai #推荐使用官方SDK或原生requests库
#首先安装 dotenv 用于加载环境变量
pip install dotenv
  • 大语言模型

python openai1.py

from openai import OpenAI
from dotenv import load_dotenv
import osInternLM_api_key = os.getenv("InternLM", load_dotenv())
client = OpenAI(api_key=InternLM_api_key,  base_url="https://chat.intern-ai.org.cn/api/v1/",
)chat_rsp = client.chat.completions.create(model="internlm3-latest",messages=[{"role": "user",         #role 支持 user/assistant/system/tool"content": "你知道刘慈欣吗?"}, {"role": "assistant","content": "为一个人工智能助手,我知道刘慈欣。他是一位著名的中国科幻小说家和工程师,曾经获得过多项奖项,包括雨果奖、星云奖等。"},{"role": "user","content": "他什么作品得过雨果奖?"}],stream=False
)for choice in chat_rsp.choices:print(choice.message.content)
#若使用流式调用:stream=True,则使用下面这段代码
#for chunk in chat_rsp:
#    print(chunk.choices[0].delta.content)

  • 多模态模型

python openai2.py

from openai import OpenAI
from dotenv import load_dotenv
import osInternLM_api_key = os.getenv("InternLM", load_dotenv())
client = OpenAI(api_key=InternLM_api_key,  base_url="https://chat.intern-ai.org.cn/api/v1/",
)chat_rsp = client.chat.completions.create(model="internvl2.5-latest",messages=[{"role": "user","content": "你好"},{"role": "assistant","content": "你好,我是 internvl"},{"role": "user","content": [                                    #用户的图文提问内容,数组形式{"type": "text",                        # 支持 text/image_url"text": "Describe these two images please"},{"type": "image_url","image_url": {"url": "https://static.openxlab.org.cn/internvl/demo/visionpro.png"  #支持互联网公开可访问的图片 url 或图片的 base64 编码}},{"type": "image_url",                                                     # 单轮对话支持上传多张图片"image_url": {"url": "https://static.openxlab.org.cn/puyu/demo/000-2x.jpg"}}]}],n=1,stream=False
)for choice in chat_rsp.choices:print(choice.message.content)

三轮对话示例代码

python openai3.py

Browser-Use 是一款专为 Agent 与浏览器交互设计的工具,旨在通过简单而强大的自动化界面,让 Agent 轻松访问和操作网页。它提供了连接大模型与浏览器的便捷桥梁,使开发者能够快速实现网页自动化任务,无需复杂编码。

安装 uv 并创建项目环境

首先我们新建一个Internlm文件夹,并用vscode打开,启动终端

直接使用Python自带的pip安装,兼容性最佳,这里需要python版本为3.8及以上:

pip install uv  
# 检测是否安装成功,出现版本号则成功
uv --version 

这边检测电脑安装的是

(base) PS D:\acyq\Internlm> python --version
Python 2.7.16 :: Anaconda, Inc.

需要升级

conda create -n Internlm python=3.12

conda activate Internlm

git clone https://github.com/sanjion/Web-ui.git
cd web-ui
uv pip install -r requirements.txt  
playwright install --with-deps chromium

报错原因分析:节点和360防火墙没关

 

 python webui.py

Web-UI 选项配置


http://www.hkcw.cn/article/EIxOnwVmVa.shtml

相关文章

何小鹏谈智能辅助驾驶技术路线 选择强大大脑

小鹏汽车在辅助驾驶技术路线上已经放弃了激光雷达,转而采用视觉融合方案,但仍然保留了毫米波雷达和超声波雷达。小鹏汽车董事长何小鹏在接受采访时对此进行了说明,他表示:“拥有聪明的眼睛好呢还是一个更强大的大脑更好?我们选择了更强大的大脑。”友商们选择了不同的技术…

Flutte ListView 列表组件

目录 1、垂直列表 1.1 实现用户中心的垂直列表 2、垂直图文列表 2.1 动态配置列表 2.2 for循环生成一个动态列表 2.3 ListView.builder配置列表 列表布局是我们项目开发中最常用的一种布局方式。Flutter中我们可以通过ListView来定义列表项,支持垂直和水平方向展示…

53岁男子诱骗近百名中小学女生,手机藏满未成年人隐私视频

丧心病狂!53岁男子诱骗近百名中小学女生,手机藏满未成年人隐私视频!5月29日,江苏省人民检察院召开新闻发布会,介绍近年来加强未成年人网络司法保护的工作情况及典型案例。如皋市检察院副检察长卢海琴介绍了其中一例典型案例,该案,检察院通过深挖彻查,案件从1名被告人追…

大连梅花鹿遭野狗追逐坠落死亡 流浪狗威胁野生动物安全

大连梅花鹿遭野狗追逐坠落死亡 流浪狗威胁野生动物安全!近日,有网友反映辽宁大连出现多起梅花鹿被流浪狗撕咬致死的情况。据大连野境自然保护中心透露,这类事件已持续一段时间,最近的一起发生在5月27日凌晨。当时一只母鹿在被狗群追逐时从土墙上坠落摔伤,全身多处撕咬伤,…

sourcetree无法获取远程所有的tag

2025年5月29日11:30:17 sourcetree widnwos v3.4.23版本 突然发现线上的代码库里有很多新打的tag,但是sourcetree死活无法拉去所有的tag,尝试卸载重新安装也不行,全网也找了还是不知道,但是mac版本好像没有这个问题 方法1&…

高性能DeepSeek V3上线星辰MaaS平台,更快、更稳定

以DeepSeek模型为代表的MoE技术路线,正不断突破通用大模型的效果上限。其创新的PD优化与大EP推理方案,推动大模型迈向“高性能、低成本、强普惠”的新阶段。 事实上,早在1991年,两位人工智能界的泰斗Michael Jordan与Geoffrey Hin…

github双重验证密码忘记或者获取不了了怎么办

背景 近期由于换了新手机,之前配置好的Authenticator这个App无法使用,导致获取不到二次验证的Authenticator code,登陆不上GitHub,不知道有没有人和我遇到同样的问题? 当我们配置2FA双重验证后,每次登陆gi…

Spring框架学习day4--Spring集成Mybatis(IOC)

Spring集成Mybatis1.添加jar包(pom.xml)2.配置sqlSessionFactiory(spring.xml)3.再service类中注入Dao代理接口4.测试类5文件结构 Spring集成Mybatis Spring集成Mybatis其核心是将SqlSessionFactory交由Spring管理,并由 Spring管理…

Nexus仓库数据高可用备份与恢复方案(上)

#作者:闫乾苓 文章目录 1、要解决的问题2、解决方案方案说明 3、方案验证部署nexus pvc部署nexus deployment部署nexus svc查看部署状态访问UI页面创建基于minio 的Blob Store 库准备测试数据 1、要解决的问题 Nexus使用容器化部署并使用NFS或者HostPath作为数据持…

今天北京最高气温32℃,午后阵风明显 出行注意防暑防风

今天白天多云,北风一级转南风三级,阵风六级,最高气温32℃;夜间多云,南转北风一二级,最低气温22℃。今天云量增多,气温仍较高,午后阵风明显,出行注意防暑防风勤补水。温红征 摄责任编辑:0882

工具识别系统Python+深度学习+人工智能+卷积神经网络算法+TensorFlow+图像识别

一、介绍 工具识别系统,使用Python作为主要编程语言,基于TensorFlow搭建卷积神经网络算法,通过收集了8种常见的日常工具图片(“汽油罐(Gasoline Can)”, “锤子(Hammer)”, “钳子&…

歌手终于炒出新菜了!

歌手终于炒出新菜了!《歌手2025》迎来了一位新面孔,原创歌手兼音乐剧演员湛嘉丽。她凭借代表作《海鸥》展现了不俗的实力,网友们对这位新人充满期待,并评论说:“歌手终于炒出新菜了。”今年的《歌手》节目给了音乐剧很大的舞台,不仅打破了以往依赖“回锅肉”的模式,还注…

机器学习-线性回归基础

一、什么是回归 依据输入x写出一个目标值y的计算方程,求回归系数的过程就叫回归。简言之:根据题意列出方程,求出系数的过程就叫做回归。 回归的目的是预测数值型的目标值y,分类的目的预测标称型的目标值y。 二、线性回归 2.1线性…

什么是MSBC

mSBC(Modified SubBand Coding)是蓝牙协议中用于语音通话的一种音频编码格式,专为HFP/HSP(蓝牙免提/耳机规范)设计。它是对SBC(SubBand Coding)的改进版本,核心目标是在有限带宽下保…

2024长春全国邀请赛CCPC

文章目录 G - Platform GameI - The Easiest ProblemL - Recharge G - Platform Game 题目来源:G - Platform Game 解题思路 可以先对每个平台的高度从大到小排序,高度相同再根据横坐标从左往右排序,依次遍历每个平台,如果高…

王树森推荐系统公开课 排序06:粗排模型

shared bottom 表示神经网络被所有特征共享。精排模型主要开销在神经网络,神经网络很大且很复杂。 每做一次推荐,用户塔只做一次推理。物品塔存放入向量数据库。 后期融合模型常用于召回,前期融合模型常用于精排。 物品塔短时间内比较稳…

中国车企经营状况几何 高负债背后的研发投入

近日,“车圈恒大”这一话题在舆论界引起广泛关注,资本市场因此出现连续震荡,汽车股集体下跌。恒大的问题主要在于其“高负债、高周转、高风险”的扩张模式,最终导致资金链断裂。汽车行业是否存在类似现象?这种论调能否作为行业洞察?从可收集到的上市整车公司公开财务数据…

RPG16.重攻击

1.创建GA_HeavyAttackMaster 2.打开,然后设置实例化策略为每个实例化Actor 设置标签 创建子类GA_HeavyAttack_Axe,设置子类的标签 父类里添加print输出用于调试 3.添加输入,复制LightAttack,重命名 打开DA_InputConfig,添加输入…

Dify中 SYSTEM, USER, ASSISTANT 的关系、职责与使用方法

在Dify这类对话式AI应用构建平台中,SYSTEM, USER, ASSISTANT 这三种消息类型共同定义了与大型语言模型(LLM)交互的结构和上下文。它们的关系可以理解为: SYSTEM: 扮演着“导演”或“场景设定者”的角色。USER: 扮演着“提问者”或“任务发起者”的角色。ASSISTANT: 扮演着“…

藏海传全面登顶 肖战演技获肯定

藏海传全面登顶 肖战演技获肯定!《藏海传》全面登顶,肖战用实力证明了自己不仅仅是流量,也打破了很多人对流量的偏见,肖战演技值得被肯定藏海传全面登顶 肖战演技获肯定。责任编辑:0882