毁掉一款智能音箱 就封掉它的内容入口

昨天发生了一件大事,事件的主角是Google和Amazon两家科技巨头,事件的内容是Google在没有任何征兆的情况下突然关掉了Amazon旗下新款智能音箱EchoShow的Youtube视频入口。EchoShow的用户表示,他们在事先没有收到任何提示的情况下就无法在该产品上使用Youtube了。 继续阅读毁掉一款智能音箱 就封掉它的内容入口

Youtube自动字幕已识别环境音 国内还在靠字幕组

在国内,下载好电影后,再去字幕网站搜索外挂字幕,已经是影迷们的固有动作。这种习惯的养成,归功于近10年来逐渐形成的野生网络字幕组,用业余时间为影迷们贡献了大量、快速的免费字幕。

相比国内的野生字幕组,谷歌的技术宅们在2009年为Youtube上线了一个自动字幕系统(Automatic Captioning System),借助人工智能技术,在视频里实时生成字幕。时隔7年后,YouTube宣布已经有10亿多条视频采用了该系统生成的字幕,而全球日活跃用户也达1500万。

在Google给定的视频中,可以在设置中选择开启自动字幕,之后视频下方会随着视频中的人声,逐个显示对应字幕。另外,在字幕开启菜单中,也有“自动翻译”的选项,包括中文繁体、简体在内的上百种语言均可翻译。

此外,雷锋网(公众号:雷锋网)3月23日还报道过,由Accessibility、Sound Understanding和YouTube三个团队共同完成了,通过深度神经网络(DNN)模型,在自动字幕增加音效信息的技术,进一步提升了观众的“看片”体验。

其中,Google Accessibility团队致力于让每个人都能够享用互联网带来的便利,尤其是残障人士,他们主要负责监控Google产品的无障碍状况,协调开展无障碍培训、测试并提供咨询服务。Accessibility产品团队需要接受相关培训,以在产品的设计和发布过程中体现无障碍原则。此外他们还努力与各类用户和致力于推广无障碍功能的团体建立密切的关系,以便征求反馈意见。

而Youtube的自动字幕系统,在很大程度上实现了视频观看的“无障碍”,尤其是听不到声音的聋人,也能通过自动生成的字幕进行高质量的视频信息获取。

Google Sound Understanding团队,此前曾负责AudioSet数据集,致力于教学机器,通过建立状态机器学习模型,生成大规模的音频事件数据集,并定义声音之间存在的层次关系,来准确地感知音频。

目前,国内主流视频网站均未推出过自动字幕系统,不过在坊间流传着一个能够自动生成字幕的软件——Autosub,最初该软件只帮助字幕组成员自动对轴,后来的更新版本调用了谷歌的API,支持自动生成字幕,不过效果不佳,此后鲜有更新。

雷锋网还了解到,2011年《电子学报》的一篇论文称,以《新闻联播》为语料进行训练,实现了音频提取、音频分类与切分、说话人识别、大词汇量连续语音识别、视频文件播放、文本字幕自动生成等功能,从而实现“全自动中文新闻字幕生成”。但此论文中并未提及是否可以做到“实时”。

这项技术的难点在于,一方面一条视频中的声音有很多,包括对白和混合在一起非常复杂的环境声,要辨别哪个声音是我们想要的,并把几个同时产生的声音区分开来相当不易;另一方面视频实时字幕生成,需要在极短的时间内做出反馈,对于计算速度考验巨大。

针对分辨声音而言,搜狗CEO王小川就表示过,目前语音识别已经有了较高的准确度,接近实用,但还有很多的限制。比如需要安静的环境,当有噪音的时候同时有两个人说话机器就搞不定了。搜狗的做法是预先录制,比如在汽车环境里面,预先录制发动机引擎的声音,把没有见过的环境变成机器能够见过的环境,就能够做识别。针对计算速度而言,则需要依靠硬件和算法的进步。

现在能实现的程度,需要归功于过去几年间,DNN技术、Residual/Highway 网络技术和粗粒度建模单元技术的进展。但环境音非常复杂,想要把所有的独立声音预先录下来,是一项巨大的工程。即便是谷歌自动字幕系统的研究人员们,也只是选取了“鼓掌、音乐、笑声”三种语义清楚的背景声。

视频之外,在语音转文字这项技术上,国内外企业多有涉及。比如微软帮助聋人通话实时将语音转换为文字的RogerVoice,比如百度新近推出的SwiftScribe、再如国内企业科大讯飞等,还有各类录音、速记应用程序,都能够不同程度的支持语音转文字的技术。一般来说环境越安静,识别的准确率越高。

科大讯飞相关人士向雷锋网表示,视频字幕需求分为两类,一类为已录制视频的字幕配置,另一类为直播视频的字幕配置,科大讯飞的识别技术均可实现上述两类字幕需求。

目前讯飞开放平台已对外提供第一种已录制视频字幕配置需求的”语音转写”产品,准确率可达95%,而对于第二种直播视频的字幕配置产品将在今年年中对外提供。

被指变相支恐 谷歌遭众多大企业抵制

新华社北京3月25日新媒体专电(记者郭倩)英美等国已有超过250家企业或机构暂停向互联网巨头谷歌旗下视频分享网站优兔投放广告,22日和23日,新加入这一行列的包括美国通信公司韦里孙、美国电话电报公司,以及美国医药制造商强生和美国银行摩根大通。这些企业不满其广告出现在优兔“不良”视频的片头,并且广告费被这些视频的发布者分走,认为这样相当于变相支持“错误的价值观”,玷污了其品牌形象。

【变相支恐?】

英国《泰晤士报》近日发现,优兔上一些散播仇恨、反同性恋、反犹太主义言论的视频前,会播放各类广告,即所谓贴片广告。例如在埃及人瓦格迪·古奈姆的优兔个人频道的视频正片开始播放前,会出现大众汽车、英国广播公司(BBC)等的广告。古奈姆是被英国政府禁止入境的“恐怖主义煽动者”。然而根据优兔的政策,一名用户的视频每吸引到1000次点击,该用户就可从优兔分到6英镑(约合51元人民币)广告提成。而古奈姆的多条视频点击量破万,这意味着大众、BBC付给优兔的广告费中,有一部分进入了古奈姆的户头。

作为优兔网站用户,《泰晤士报》向谷歌举报6条含反犹内容的视频,但是优兔24小时内没有采取措施。当该报再度联系谷歌,优兔才删除了其中4条视频。

此事一经报道,多个品牌开始联合抵制谷歌,办法就是暂停向优兔或谷歌其他广告渠道投放广告。加入抵制行列的品牌涵盖零售、金融、汽车等多个行业,包括欧莱雅、麦当劳、玛莎百货、亨氏、乐购、汇丰、苏格兰皇家银行、大众、丰田、奥迪,英国政府、BBC、独立电视台、《卫报》等一些英国政府机构及媒体也参与了抵制。

美国电话电报公司在声明中说:“我们的广告可能与优兔上煽动恐怖主义和仇恨的内容一同出现,这令我们深感困扰。在谷歌确保这样的事不再发生前,我们的广告将从谷歌搜索引擎以外的所有平台上撤除。”

【承诺整改】

谷歌首席商务官菲利普·申德勒21日在博客上致歉并承诺改进。他说谷歌将在三方面采取整改措施,分别是:对允许播出的内容制定更严格的标准,“防止仇恨性、冒犯性和诽谤性视频出现”;广告主对他们的广告费流向哪里拥有更多控制权;对广告主来说,他们的广告在何处播放“将更透明可见”。他提出将雇用“数量巨大的”员工审核视频内容,以决定这些视频是否适合插入广告。

此外,申德勒认为谷歌的人工智能技术近期所取得的突破,也可以帮助计算机系统更好地像人类那样过滤、审核视频。22日,谷歌说已开始全面审视其广告政策。

谷歌很大程度上依靠自动程序给优兔视频加广告。目前,每分钟有总长大约400小时的视频内容被上传至优兔,如果雇人来审核视频内容是否适合添加广告,将耗费大量人力。

【效果不明】

去年美国总统选举和英国脱欧公投期间,社交网络和新闻聚合平台就因“散播假新闻”遭到广告主们的谴责。因为商家或机构做广告是为了提升品牌知名度和形象,而非让消费者将其品牌与假新闻和不恰当的言论联系在一起。

虽然谷歌承诺了整改措施,但效果将如何现在不得而知,因为谷歌可能并不在乎来自优兔的广告费。

美国电子商务市场研究公司(eMarketer)的数据显示,2016年,谷歌从优兔平台获得的广告净收入为55.8亿美元。但优兔并非谷歌主要广告收入来源,谷歌的搜索引擎才是大头。2017年,谷歌全年广告总收入预计将达737.5亿美元,搜索引擎预计将贡献其中的83%。

此外,网络平台上的广告收入主要来自众多中小企业,而非大企业。因为不像后者,前者一般没有实力在电视上投放广告。调研机构莫非特·内桑森公司分析认为,如果大企业、大广告公司中止与像脸书、谷歌这样的大型网络平台合作,可能会将这部分广告费用转移到电视平台,那么受益的是电视台,而这些网络巨头则可能“感觉不到什么伤害”。