EMC易倍官方网站
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 百度“搜索+信息流”成为趋势

    2026-05-08 08:44

    在互联网下半场流量天花板困境凸显的当下,“下沉市场”的概念反复被提起。用户规模超6亿的下沉市场存在巨大红利,驱动互联网巨头审视新的用户需求,寻找新增量。在百度“搜索+信息流”精确服务下沉用户

  • “互联网保险”把钱花哪了?

    2026-05-06 15:51

    五年前,首张互联网保险拍照横空出世时,曾引无数同业羡慕。但是区别于传统保险公司的经营模式,互联网保险公司直接可在全国范围开展业务,带给市场极大的想象空间。梦想虽好,怎奈何现实的骨感。{{K}

  • 一名优秀的网站设计师需具备哪些能力?

    2026-05-03 17:33

    如果你的职业目标是成为一名优秀的北京网站建设公司,尽管可能不需要涉及技术和复杂的计算机技巧,但是北京网站建设公司EMC易倍官方网站认为以下所提到的设计技能是你必须要具备的。一、走向的掌控能力这里所提

  • 营销网站要怎样才能建设高质量的外链呢?

    2026-05-01 07:27

    外链是一个网站优化推广的关键,我们必须重视外链的质量。所谓的网站高质量的外链,是指内容关联度较高、来自权威网站、更多来源域名的链接。高质量的链接对网站优化、企业品牌的推广有着非常重要的作用,

  • 网站排版的是否合理将会影响用户的直接“体验”

    2026-04-20 06:31

    企业网站设计设计如何使用文字和色彩来吸引访客只是一方面,其实网站设计重要的特性它易用性,它并不像图形设计范畴那样有很大的局限性。有的时候我们但要让它美观,还要对网站设计的实用性更加注重。在网

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-04-23 16:07
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。