消息称谷歌将推出“Project Jarvis”:可实现网页任务自动化
2024-10-27 07:39:02人工智能 IT之家 远洋
据 The Information 报道,谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。
最新 10 月 27 日消息,据 The Information 报道,谷歌计划在 12 月预览其大型动作模型“Project Jarvis”。知情人士透露,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。
报道称,“Jarvis”将由未来版本的谷歌 Gemini 驱动,专门针对 Chrome 浏览器进行优化。该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本,帮助用户“自动化日常的网页任务”。目前,该工具在执行不同操作的时候,中间会有几秒钟的间隔时间。
最新注意到,目前所有大型 AI 公司都在研发类似功能的模型。微软的 Copilot Vision 可以与用户讨论正在浏览的网页;苹果的 Apple Intelligence 预计将在明年具备跨多个应用程序的屏幕识别能力;Anthropic 刚刚推出的 Claude 测试版已能在计算机上执行操作;OpenAI 也在研发类似的功能。
报道称,谷歌展示“Jarvis”的计划也可能会有所变动,预计将首先向少量测试者发布,以帮助公司修复潜在的 Bug。
赞一个! ()
相关文章
- 2024 胡润中国人工智能企业 50 强公布:寒武纪 2380 亿
- 阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频
- 开源媒体播放器 VLC 下载破 60 亿次,预览本地 AI 字幕
- 英伟达迷你超算遭友商嘲讽:宣传 FP4 算力,实际“不如买
- 银河通用发布全球首个端到端具身抓取基础大模型 Grasp
- 雷蛇推出“AI 游戏伴侣”Project AVA:支持实时指导 +
- 京东方 CES 2025 发布行业首款 65 英寸 4K 超高清“AI
- 微软开源 140 亿参数小语言 AI 模型 Phi-4,性能比肩 GP
- 微软承认必应 AI 图像生成器 PR16“开倒车”,现回滚至
- 西藏地震期间“小孩被埋”等 AI 图大量传播,严重可追责