您现在的位置是: > 快讯快讯
微软开源创新框架:可将DeepSeek-R1等模型变成AIAgent
admin 2025-02-17 08:44:42 快讯 已有人查阅
导读本站消息, 微软在官网发布了视觉 Agent 解析框架 OmniPaer 最新版本 V2.0,可将 DeepSeek-R1、GPT-4o、Qwen-2.5VL 等模型,变成可在计算机使用的 AI Agent。与 V1...
消息, 微软在官网发布了视觉 Agent 解析框架 OmniParser 最新版本 V2.0,可将 DeepSeek-R1、GPT-4o、Qwen-2.5VL 等模型,变成可在计算机使用的 AI Agent。与 V1 版本相比,V2 在检测较小的可交互 UI 元素时准确率更高、推理速度更快,延迟降低了 60%。在高分辨率 Agent 基准测试 ScreenSpot Pro 中,V2 GPT-4o 的准确率达到了惊人的 39.6%,而 GPT-4o 原始准确率只有 0.8%,整体提升非常大。除了 V2,微软还开源了 omnitool,这是一个基于 Docker 的 Windows 系统,涵盖屏幕理解、定位、动作规划和执行等功能,也是将大模型变成 Agent 的关键工具。(金十)
本文标签:
很赞哦! ()
相关文章
随机图文
微软开源创新框架:可将DeepSeek-R1等模型变成AIAgent
本站消息, 微软在官网发布了视觉 Agent 解析框架 OmniPaer 最新版本 V2.0,可将 DeepSeSciHub社区AI方向首个产品SCAICH开始公测
2 月 17 日,据官方消息,SciHub 社区 AI 方向首个产品 SCAICH 开始公测。据悉,SCAICH 是一Odaily编辑部Meme操作全记录(2月14日)
本新栏目为 Odaily 编辑部成员真实投资经历分享,不接受任何商务广告,不构成投资建议(因为日本能源公司Remixpoint过去一年花费5900万美元投资加密货币,加密储备九个月增长8,000%
本站消息, 日本能源公司 Remixpoint 过去一年花费 5900 万美元(90 亿日元)投资加密货币