2025谷歌开发者大会有哪些值得关注的内容?
Alphabet(GOOGL.O)谷歌年度最盛大的开发者大会Google I/O 2025于本周二和周三在加州山景城的海岸线圆形剧场举行。这是展示其全产品线发布动态的舞台,涵盖安卓、Chrome、谷歌搜索、YouTube,以及当然不可或缺的AI聊天机器人Gemini等众多领域。
谷歌还专门为安卓更新举办了一场独立活动。公司宣布了多项新功能,包括寻找遗失安卓手机和其他物品的新方式、Advanced Protection高级保护计划新增的设备级安全功能、防诈骗防盗的安全工具,以及全新设计语言Material 3 Expressive。
以下是Google I/O 2025公布的重磅内容:
Gemini Ultra
Gemini Ultra(目前仅限美国)提供对谷歌AI应用与服务“最高级别的访问权限”,月费为249.99美元。套餐内含Veo 3视频生成器、新推出的视频剪辑工具Flow,以及尚未上线的强大AI功能Gemini 2.5 Pro的Deep Think模式。
订阅Gemini Ultra的用户还将获得更高配额的NotebookLM与图像混合应用Whisk,以及在Chrome中使用Gemini聊天机器人、基于Project Mariner技术的多项“智能代理”工具、YouTube Premium和Google Drive、Photos、Gmail的30TB存储空间。
Gemini 2.5 Pro的Deep Think模式
Deep Think是Gemini 2.5 Pro模型的一种“增强型推理模式”,可在回答前综合多个答案,提高模型在某些基准测试中的表现。
谷歌尚未详细介绍其具体原理,但其可能类似于OpenAI的o1-pro或即将推出的o3-pro,具备搜索和整合最佳解决方案的能力。
Deep Think目前通过Gemini API向“受信测试者”开放。谷歌表示将在更广泛推出前进行额外的安全评估。
Veo 3视频生成AI
谷歌称,Veo 3可生成音效、背景噪音,甚至是配音对白。画质方面也优于前代Veo 2。
Veo 3将从周二起上线Gemini聊天机器人应用,仅向Gemini Ultra订阅用户开放,可通过文字或图像提示生成视频内容。
Imagen 4图像生成AI
Imagen 4的速度比Imagen 3更快,未来还将发布比Imagen 3快十倍的版本。它能够生成布料、水珠、动物毛发等“精细细节”,支持写实与抽象风格,图像可达2K分辨率,多种尺寸比例。
Veo 3和Imagen 4都将为视频创作工具Flow提供核心支持。
Gemini应用更新
谷歌宣布Gemini系列应用月活跃用户数突破4亿。
Gemini Live将在本周向所有iOS和安卓用户开放摄像头与屏幕共享功能,借助Project Astra技术,用户可以与AI实现近实时语音互动,并实时共享手机画面。
未来数周,Gemini Live还将与谷歌生态其他应用深入整合,例如调用Google地图导航、创建日历事件、管理任务清单等。
此外,Deep Research功能升级,用户现在可上传私有PDF和图片生成研究报告。
Stitch
Stitch是一款AI工具,可用于设计网页和移动应用前端,用户只需几句话或一张图片,即可生成UI元素及HTML和CSS代码。
尽管Stitch的功能较部分“可视化编程”工具略有限制,但它提供了较高的自定义空间。
同时,谷歌扩大了开发者AI助手Jules的使用范围,Jules能帮助理解复杂代码、在GitHub上创建Pull Request、处理代码积压任务等。
Project Mariner
Project Mariner是谷歌的实验性AI代理,可代用户访问和操作网页。其现已更新,支持同时处理近十项任务,开始面向部分用户开放。
例如,用户无需打开第三方网站,只需与AI聊天即可完成购票或在线购物等任务。
Project Astra
Project Astra是由Google DeepMind推出的低延迟多模态AI项目,将为搜索、Gemini应用及第三方产品提供支持。谷歌也正与三星、Warby Parker等公司合作开发Project Astra眼镜,但尚未公布发布日期。
AI Mode
谷歌正在美国推出AI Mode —— 一种实验性的搜索功能,支持用户通过AI接口提出复杂的多段式问题。
AI Mode能处理涉及体育与金融的复杂数据查询,还提供服饰“试穿”功能。今夏晚些时候上线的Search Live将结合手机摄像头的实时画面支持基于视觉的搜索提问。
Gmail是首款支持个性化语境处理的应用。
Beam 3D视频会议
Beam(原名Starline)结合六摄像头阵列与定制光场显示器,让远程会议仿若面对面。其AI模型将不同角度的视频流合成为3D渲染图像。
Beam实现毫米级头部追踪与60帧/秒的视频流传输,结合Google Meet使用时,还可提供AI实时语音翻译,并保留原说话人的音色、语调与表情。
Google Meet本身也将支持实时语音翻译功能。
更多AI更新
Gemini将整合进Chrome浏览器,作为全新AI浏览助手,帮助用户快速理解页面内容并完成任务。
Gemma 3n是为手机、笔记本、平板优化的AI模型,周二起开启预览,支持音频、文本、图像与视频处理。
谷歌还为Gmail、Docs和Vids带来大量AI办公更新。Gmail将新增个性化智能回复与收件箱清理功能,Vids增强了内容创建与编辑功能。
NotebookLM将新增视频概览功能,同时谷歌上线了SynthID Detector —— 一个基于SynthID水印技术的AI内容识别平台。音乐生成模型Lyria RealTime也将通过API开放使用。
Wear OS 6
Wear OS 6引入统一字体,提升界面一致性;Pixel Watch将支持主题色同步,增强动态美感。
新设计平台将帮助开发者构建更丰富的个性化应用,并实现无缝的界面过渡。谷歌将提供开发者设计指南及Figma模板文件。
Google Play
谷歌为安卓开发者在Play商店新增多项工具,包括订阅管理、内容预览(如音频片段)、更流畅的支付流程等。
美国用户可访问“主题浏览”页面,快速发现与影视作品相关的应用。开发者还将获得专属的测试与发布页面及应用发布监控工具。遇到严重问题时,开发者可暂停应用发布。
订阅工具也获升级,支持多产品结账。开发者可在主订阅下销售附加服务,实现统一结账。
安卓Studio
安卓Studio将集成多项新AI功能,包括配合Gemini 2.5 Pro的“Journeys”(AI开发代理流程)与“Agent Mode”自动化开发功能。
此外,App Quality Insights面板的“崩溃洞察”功能也将由Gemini提供支持,帮助分析源码、定位崩溃原因并提供修复建议。
(责任编辑:基金工具)
-
转型前,友友租车有近500个员工,而转型后其实不需要这么多员工。...[详细]
-
还有一些创业者会跟我讲他们的题库有多少道习题,他们的平台上有多少小时的课。...[详细]
-
TOP8:即刻APP特朗普Twitter信息生成器 赵圆圆(奥美资深创意总监):即刻是一个神奇的社交app,它能够实时提醒用户,你关注的明星又秒删微博了,B站四大天王又更新了之类,而恶搞川普推特...[详细]
-
甚至目前还有一种现象:同样的动画或者影视剧如果存在两个视频,那么用户会更倾向于选择弹幕多的那个——弹幕越多,视频讨论的热度越高,看起也更加有趣。...[详细]
-
做事情是要先思考,但不要纠结在选择,如果实在想不清楚也不用纠结,先去做,试试看,或许就有思路了。...[详细]
-
对电商而言没有什么比高购物车放弃率更让人沮丧。...[详细]
-
我忽然觉得我找到了交换友情链接的关键难点在哪里了,原来大家是一直困惑于找不到合适的网站交换,目标网站权重太高,根本不可能跟你交换。...[详细]
-
SEC推迟对Canary Capital提交的莱特币ETF审批决定
另外两个重要指标是复购和留存,这两项是综合指标,涉及到的因素复杂多样,但也是衡量运营工作是否成功的关键指标。...[详细]
-
如果其他页面没有指向这个页面,你就可以考虑删掉他了。...[详细]
-
抓准时机并在已有的技术基础上建立趋势是发展业务的好方法之一。...[详细]