专题:下半年A股指数稳、结构牛 中国资产重估刚刚开始
Google I/O 2025 作为谷歌年度最大的开发者大会,于周二和周三在山景城的海岸线圆形剧场举行。
I/O 大会展示了谷歌全系列产品的发布内容,包括与 Android、Chrome、谷歌搜索、YouTube 相关的大量新闻,当然还有谷歌的人工智能聊天机器人 Gemini。
谷歌此前还举办了一场专门讨论 Android 更新的活动 ——Android Show,宣布了查找丢失 Android 手机和其他物品的新方法、其高级保护计划的额外设备级功能、防范诈骗和盗窃的安全工具,以及名为 Material 3 Expressive 的新设计语言。
以下是 Google I/O 2025 上宣布的所有内容:
Gemini Ultra
据谷歌称,Gemini Ultra(目前仅限美国地区)提供对谷歌人工智能应用和服务的 “最高级别访问”,订阅费用为每月 249.99 美元,包括谷歌的 Veo 3 视频生成器、新推出的 Flow 视频编辑应用,以及尚未上线的强大人工智能功能 Gemini 2.5 Pro Deep Think 模式。
AI Ultra 订阅还包括 Google NotebookLM 平台和图像重混应用 Whisk 的更高使用限额,用户还能在 Chrome 中使用 Gemini 聊天机器人、访问由 Project Mariner 技术支持的部分 “代理工具”、享受 YouTube Premium 服务,以及在 Google Drive、Google Photos 和 Gmail 中获得 30TB 存储空间。
Gemini 2.5 Pro 的 Deep Think 模式
Deep Think 是谷歌旗舰模型 Gemini 2.5 Pro 的 “增强型” 推理模式,允许模型在回答问题前考虑多个答案,从而提升其在特定基准测试中的表现。
谷歌未详细说明 Deep Think 的工作原理,但它可能类似于 OpenAI 的 o1-pro 和即将推出的 o3-pro 模型,后者可能使用引擎搜索并综合给定问题的最佳解决方案。
Deep Think 已通过 Gemini API 向 “可信测试人员” 开放。谷歌表示,在全面推出前需要额外时间进行安全评估。
Veo 3 视频生成人工智能模型
谷歌称,Veo 3 可以生成音效、背景噪音甚至对话来配合其创建的视频。此外,谷歌表示,Veo 3 在生成视频的质量方面比其前身 Veo 2 有所提升。
从周二开始,订阅谷歌每月 249.99 美元 AI Ultra 计划的用户可在 Gemini 聊天机器人应用中使用 Veo 3,用户可以通过文本或图像进行提示。
Imagen 4 人工智能图像生成器
A sample from Imagen 4.
谷歌表示,Imagen 4 的速度比 Imagen 3 更快,而且很快会变得更快。在不久的将来,谷歌计划发布一个比 Imagen 3 快 10 倍的 Imagen 4 变体。
据谷歌介绍,Imagen 4 能够渲染织物、水滴和动物皮毛等 “精细细节”,可以处理写实和抽象风格,生成各种纵横比、最高 2K 分辨率的图像。
Veo 3 和 Imagen 4 都将用于支持 Flow—— 谷歌面向电影制作的人工智能视频工具。
Gemini 应用更新
谷歌宣布,Gemini 应用的月活跃用户已超过 400 万。
Gemini Live 的摄像头和屏幕共享功能将于本周向 iOS 和 Android 的所有用户推出。该功能由 Project Astra 提供支持,用户可以与 Gemini 进行近乎实时的语音对话,同时将智能手机的摄像头或屏幕画面流式传输到人工智能模型。
谷歌表示,未来几周 Gemini Live 还将更深入地与其他应用集成:很快就能提供谷歌地图的导航指引、在谷歌日历中创建事件,并通过谷歌任务生成待办事项列表。
谷歌还表示,将更新 Deep Research(Gemini 生成详细研究报告的人工智能代理),允许用户上传自己的私人 PDF 和图像。
Stitch
Stitch 是一款人工智能工具,通过生成必要的用户界面元素和代码帮助用户设计网页和移动应用的前端。用户可以用几句话甚至一张图片提示 Stitch 创建应用界面,并为生成的设计提供 HTML 和 CSS 标记。
与其他类似的编码工具相比,Stitch 的功能略有限制,但提供了相当多的自定义选项。
谷歌还扩大了 Jules 的使用范围。Jules 是一款旨在帮助开发者修复代码错误的人工智能代理,可帮助开发者理解复杂代码、在 GitHub 上创建拉取请求,并处理某些待办事项和编程任务。
Project Mariner
Project Mariner 是谷歌的实验性人工智能代理,可浏览和使用网站。谷歌表示,已大幅更新其工作方式,允许代理一次处理近十二项任务,目前正在向用户推出。
例如,Project Mariner 用户无需访问第三方网站,即可购买棒球比赛门票或在线购买杂货,只需与谷歌的人工智能代理聊天,它就会访问网站并代用户执行操作。
Project Astra
谷歌的低延迟多模态人工智能体验 Project Astra 将为搜索、Gemini AI 应用和第三方开发者的产品提供一系列新体验。
Project Astra 源自谷歌 DeepMind,旨在展示近乎实时的多模态人工智能能力。谷歌表示,目前正与三星和 Warby Parker 等合作伙伴开发 Project Astra 眼镜,但尚未确定发布日期。
AI 模式
谷歌本周将向美国用户推出 AI 模式 —— 这一实验性的谷歌搜索功能允许用户通过人工智能界面提出复杂的多部分问题。
AI 模式将支持在体育和金融查询中使用复杂数据,并为服装提供 “试穿” 选项。今年夏末推出的 Search Live 将允许用户根据手机摄像头实时捕捉的内容提出问题。
Gmail 是首个支持个性化上下文的应用。
Beam 3D 远程会议
Beam(前称 Starline)结合了软件和硬件(包括六摄像头阵列和定制光场显示器),使用户能够与他人交谈,仿佛对方就在同一间会议室里。人工智能模型将来自不同角度对准用户的摄像头视频转换为 3D 渲染图像。
谷歌的 Beam 具备 “近乎完美” 的毫米级头部跟踪和 60 帧 / 秒的视频流。与 Google Meet 配合使用时,Beam 提供人工智能驱动的实时语音翻译功能,保留原说话者的声音、语气和表情。
此外,谷歌宣布 Meet 将新增实时语音翻译功能。