谷歌在搜索领域迈出了创新一步,近日在其官方博客上宣布,实验室于6月13日推出了音频概览(Audio Overviews)功能。这是谷歌首次在搜索结果中整合由人工智能生成的播客式音频摘要,标志着AI技术在信息检索领域的又一次重要应用。
与之前的NotebookLM项目不同,此次音频概览并非简单移植,而是基于相同技术框架的独立功能扩展。用户在Chrome浏览器中搜索复杂话题,如“神经网络的工作原理”或“氩元素的用途”时,该功能即被激活。点击“生成音频概览”按钮后,大约40秒即可听到由两位AI“主持人”以对话形式呈现的语音总结。
音频概览功能的实现依赖于Gemini模型,该模型能够在前10秒内迅速抓取网页内容并进行语义分析。接下来的25秒,Gemini基于分析结果构建问答脚本,模拟出符合逻辑的对线秒,模型完成语音合成并输出。这一过程中,播放器提供暂停、倍速调节及原文跳转功能,非常适合驾驶、烹饪等无屏场景。
然而,为了提高响应速度,音频概览的交互能力有所牺牲。与NotebookLM能够实时追问不同,此版本仅支持单向输出,用户无法即时提出新问题。该功能目前仅面向美国用户提供英文服务,非英文搜索内容无法生成对应音频摘要。
NotebookLM作为谷歌推出的个性化AI研究助手,支持多种格式文档上传,并能提供精准摘要和对话形式的内容呈现。而音频概览功能则延续了NotebookLM的对话式音频技术,能够提取搜索结果首页内容,帮助用户更便捷地理解信息。用户还可以调整播放速度,实现“边听边看”的沉浸体验。
值得注意的是,音频概览功能早在2024年9月已在NotebookLM中亮相,并呈现出完整形态,支持用户实时追问。今年5月,外媒报道称该功能沿用了谷歌I/O大会发布的“重构信息流”技术架构。为了优化用户体验,谷歌技术团队将音频生成时长固定在40秒左右,旨在验证用户对这一基础功能的接受程度。
随着6月13日的升级更新,音频概览功能正式在谷歌搜索结果中面向用户开放。这一创新不仅丰富了搜索结果的呈现方式,也为用户提供了更加便捷的信息获取途径。在教育场景中,学生可以通过收听AI主播的40秒音频,更高效地吸收复杂概念;科研人员则可以突破文字壁垒,通过语音摘要加速跨学科知识整合。
然而,技术伦理问题也随之浮现。AI“主持人”对信息的取舍逻辑尚未透明,双人对话形式可能存在诱导性解读风险。因此,在享受技术带来的便利时,我们也需要关注并探讨如何建立更严格的信息溯源机制,确保信息的准确性和公正性。
【综合报道】6月18日消息,据techcrunch报道,Meta 首席执行官马克・扎克伯格近期积极招募顶尖人工智能研究人员,以充实Meta 新的超级智能团队。 Altman 表示,OpenAI 员…
紫金财经6月17日消息 今天下午,百度在AI Day现场官宣打造业界首个超头主播罗永浩数字人,并发布了高说服力数字人的四大突破。这背后依托的是百度研制的多模协同的数字人技术,基于文心 4.5T 实现了融合…
所以当北京市将AI课程纳入义务教育体系时,实则是为未来产业竞争预埋人才“增量池”,这种从 “根” 上培育的思路,比企业临时高薪挖人更具长远价值。 这些企业以实际业务需求为导向,通过参与智能交通系统搭建、电商…
6月18日消息,百度宣布,罗永浩将正式担任百度慧播星首席产品体验官。除了罗永浩本人入驻百度优选进行真人直播带货外,其数字人也将不定期开播、常态化为用户带来更多福利。 6月15日,罗永浩数字人直播首秀创…
【综合报道】6月19日消息,谷歌近日在其搜索服务中推出一项创新功能,允许用户通过人工智能模式进行来回语音对话。同时,语音Search Live运用了查询扇出技术,能够向用户展示更广泛、更多样化的实用…
6月19日消息,近日,河南移动与华为联合创新,率先实现华为智能体、智能追焦单元、智能板等在网络保障领域的规模落地应用。 其中,智能追焦单元是中国移动与华为联合发布的基站天线数字化解决方案,具备拓扑关系实…
在6月20日的华为开发者大会2025(HDC 2025)上,华为常务董事、华为云计算CEO张平安发布了CloudRobo具身智能平台。基于CloudRobo平台,具身智能的训练样本可以20%靠采集,80%靠生…
【综合报道】据外媒6月20日报道,Meta首席执行官马克·扎克伯格在人工智能领域的布局再次加速,他不仅以143亿美元投资了AI创业公司Scale AI并挖走了其创始人,还进一步将目光投向了其他人工智…
“智聚大上行”加速体验变现和AI应用繁荣,助力中国电信打造高速泛在5G-A网络 电信集团共建共享工作组总经理黄礼莲在发布会上表示,技术融合驱动变革,5G-A与AI的深度结合正重构人机交互模式,推动信息交互向…
【综合报道】6月19日消息,OpenAI创始人山姆·奥特曼在最新播客中披露,备受关注的GPT-5预计将于今年夏季发布,目前具体发布日期尚未确定。这一消息引发了人工智能领域的广泛关注,业内人士指出,该…
周澳回说,毕业的时候有不少同学选择了互联网企业,而他更想在传统赛道干出一番新事业,“AI有无限的可能,我希望利用自己的所学,让AI真正能够赋能业务,帮助传统行业迭代焕新。” 采访中,周澳回打趣自己是一名“智…
金山办公助理总裁冯文广表示,办公软件已从“工具属性”升级为“生产力引擎”,企业愿意将最新的技术和产品应用到浙江,以企业大脑的模式支持浙江“未来工厂”的建设,助力万千企业落地好大模型,为浙江的高质量发展贡献力…
谷歌证实,其确实依赖YouTube视频库训练AI模型,但强调仅使用其中一部分内容,并会遵守与创作者及媒体公司的特定协议。但鉴于平台规模,即便仅使用1%的视频库,也相当于23亿分钟的内容——专家称这一数据量是…
这个链接可能存在安全风险,为了保护您的设备和数据安全,请避免访问此链接。
【导读】短短3天时间,字节技术副总裁就借助AI原生IDE——TRAE,打造并开源了一款英语学习应用「积流成江」。 洪定坤说他已经有一段时间没在一线写代码,「自己有点生锈」,但是在TRAE的帮助下,开发…
近日,有消息称,张一鸣持续在北京和新加坡之间往返,并且对AI业务投入力度不断加强。 此前记者从知情人士处获悉,尽管已经卸任字节跳动CEO一职,但张一鸣已经将其工作重心转到大模型和AI(人工智能)的战…
特斯拉“烧钱”440亿美元,自由现金流隐忧浮现,Robotaxi试运营受阻
宜居带超级地球Kepler-725c:外星生命探索的新曙光?
85后博士孔大力,兼任双职!国家天文台与上海天文台新掌门人
本网站LOGO小熊标志受版权保护,版权登记号:鲁作登字-2015-F-025467,未经ITBEAR官方许可,严禁使用。Kaiyun官网 登录入口