探秘身份认证利器——声纹识别!

探秘身份认证利器——声纹识别!

 

 

 

 

声纹识别神秘面

在这个移动互联网大行其道的年代,人们不用互相见面就可以完成很多事情,比如社交、购物、网上开店、金融交易等等,但是如何验证身份变成了人和人在不见面的情况下最难的事情。传统的解决方案就是密码或者秘钥,它需要你记住或者存起来,容易忘又容易丢,还容易被黑客利用各种手段攻击。有多少人使用“123456“这种简单密码在网络上行走,他们就是黑客们最喜欢的目标;你家的路由器是不是还在用”admin”这种默认密码,这就是物联网领域中安全最薄弱的环节。不过,好在我们每个人身上都长满了“活密码”,指纹、脸、声音、眼睛等等,都是人和人之间相互区分的独一无二的标识,我们称之为“生物特征”。声音就是这种一种可以反映人身份的生物特征,参考“指纹”的命名方式,我们可以叫它“声纹”。

各种生物特征比较

声纹是指人类语音中携带言语信息的声波频谱,它同指纹一样,具备独特的生物学特征,具有身份识别的作用,不仅具有特定性,而且具有相对的稳定性。声音信号是一维连续信号,将它进行离散化后,就可以得到我们现在常见的计算机可以处理的声音信号。

计算机可以处理的离散声音信号

声纹识别(也称说话人识别)技术也如同现在在智能手机上应用十分广泛的指纹识别技术一样,从说话人发出的语音信号中提取语音特征,并据此对说话人进行身份验证的生物识别技术。每个人都具有独一无二的声纹,这是由我们的发声器官在成长过程中逐渐形成的特征。无论别人对我们的说话模仿的多么相似,声纹其实都是具有显著区别的。

现实生活中的“未见其人,先闻其声”就是人类通过声音去识别另一个人身份的真实描述,你妈甚至通过你电话里的一个“喂”字就知道是你,而不是隔壁老王家的儿子打的电话,这是我们人类经过长期进化所获得到的超常的能力。虽然目前计算机还做不到通过一个字就判断出人的身份,但是利用大量的训练语音数据,可以学出一个“智商”还不错的“声纹”大脑,它在你说出8-10个字的情况下可以判断出是不是你在说话,或者在你说1分钟以上的话后,就可以准确地判断出你是否是给定的1000人中的一员。这里面其实包含了大部分生物识别系统都适用的重要概念:1:1 和 1:N,同时也包含了只有在声纹识别技术中存在的独特的概念:内容相关和内容无关。

工作原理

对于一个生物识别系统而言,如果它的工作模式是需要你提供自己的身份(账号)以及生物特征,然后跟之前保存好的你本人的生物特征进行比对,确认两者是否一致(即你是不是你),那么它是一个1:1的识别系统(也可以叫说话人确认,Speaker Verification);如果它只需要你提供生物特征,然后从后台多条生物特征记录中搜寻出哪个是你(即你是谁),或者哪个都不是你,那么它是一个1:N的识别系统(也可以叫辨认,Speaker Identification),见图1。技术上,简单的声纹识别的系统工作流程图来见图2。

图1 说话人确认和说话人辨认

图2 声纹识别工作流程图

对于声纹识别系统而言,如果从用户所说语音内容的角度出发,则可以分为内容相关和内容无关两大类技术。顾名思义,“内容相关”就是指系统假定用户只说系统提示内容或者小范围内允许的内容,而“内容无关”则并不限定用户所说内容。前者只需要识别系统能够在较小的范围内处理不同用户之间的声音特性的差异就可以,由于内容大致类似,只需要考虑声音本身的差异,难度相对较小;而后者由于不限定内容,识别系统不仅需要考虑用户声音之间的特定差异,还需要处理内容不同而引起的语音差异,难度较大。

目前有一种介于两者之间的技术,可以称之为“有限内容相关”,系统会随机搭配一些数字或符号,用户需正确念出对应的内容才可识别声纹,这种随机性的引入使得文本相关识别中每一次采集到的声纹都有内容时序上的差异,这种特性正好与互联网上广泛存在的短随机数字串(如数字验证码)相契合,可以用来校验身份,或者和其他人脸等生物特征结合起来组成多因子认证手段。

具体到声纹识别算法的技术细节,在特征层面,经典的梅尔倒谱系数MFCC,感知线性预测系数PLP、深度特征Deep Feature、以及能量规整谱系数PNCC 等,都可以作为优秀的声学特征用于模型学习的输入,但使用最多的还是MFCC特征,也可以将多种特征在特征层面或者模型层面进行组合使用。在机器学习模型层面,目前还是N.Dehak在2009年提出的iVector框架一统天下,虽然在深度学习大红大紫的今天,声纹领域也难免被影响,在传统的UBM-iVector框架下衍化出了DNN-iVector,也仅仅是使用DNN(或者BN)提取特征代替MFCC或者作为MFCC的补充,后端学习框架依然是iVector。

图3示出了一个完整的声纹识别系统的训练和测试流程,可以看到在其中iVector模型的训练以及随后的信道补偿模型训练是最重要的环节。在特征阶段,可以使用BottleNeck特征取代或者补充MFCC特征,输入到iVector框架中训练模型,如图4所示。

图3 声纹识别算法的完整训练和识别框架

图4 使用BottleNeck特征训练iVector模型

在系统层面,不同的特征及模型,可以从不同的维度刻画说话人的声音特征,加上有效的分数规整,将各子系统融合能有效的提高系统的整体性能。

 

 

 

本文来自合作伙伴“阿里聚安全”,发表于2016年12月14日 11:10.

时间: 2017-05-02

探秘身份认证利器——声纹识别!的相关文章

【深度】小度VS最强大脑声纹识别战成平局,吴恩达详解技术原理

2016年1月13日晚,百度人工智能代表"小度"与最强大脑选手孙亦廷在声纹识别上展开人机大战,最终双方战平.在总比分上,小度凭借着上周险胜王峰,继续保持领先优势.这场人机大战依然留有悬念,双方将在下周迎来终极决战. 本周比赛的项目是凭借既有声音片段识别发声者身份,也就是所谓的声纹识别(Speaker Recognition).比赛的设置是,最强大脑"听音神童"孙亦廷和小度需要凭借3位目标对象残缺的声音资料,在性别相同.年龄相仿.声线极为相似的专业合唱团中将她们分别找

你不知道的声纹识别,尽在阿里聚安全攻防挑战赛!

 2016年12月19日 13:36  1670 由阿里巴巴安全部主办的"阿里聚安全攻防挑战赛"决战日12月28日即将到来,许多参赛的小伙伴都发现了此次比赛与以往的攻防大赛有很大的不同.就是参赛者可以尝试用声音攻击一套声纹验证系统,通过设计攻击用的音频骗过声纹验证系统,让系统验证成功. 赛事官方网址:https://tianchi.shuju.aliyun.com/mini/aliJuActivity.htm 声纹识别作为一种安全身份认证手段,不可避免的要面临非法用户的攻击风险.声纹识

滴滴每天完成2500万单,AI 助力出行;长虹推全球首款声纹识别人工智能电视

滴滴每天完成2500万单 人工智能助力出行 据外媒报道,近日滴滴出行总裁柳青在纽约接受了美国公共电视节目<查理·罗斯访谈(Charlie Rose Show)>的专访,畅谈正在被科技改变的中国.她说,"我深深相信中国的创新力量,科技已经极大地改变了中国." "人工智能和大数据利用是解决城市问题和挑战的重要工具."柳青在回答查理·罗斯提问时说.在她看来,未来的城市应当以人为中心,而不是围绕停车场和汽车来建设.因此,滴滴还有很多工作要做,也需要强大的技术支持

详解声纹识别:如何正确评价小度在最强大脑中战平人类?|独家解析

雷锋网按:作者陈孝良,博士,声智科技创始人,曾任中科院声学所副研究员和信息化办公室主任,中科院上海高等研究院客座,北京市公安局首届网络应急专家,主要从事声学信号处理和 GPU 深度学习算法研究工作.本文系雷锋网独家首发文章. 百度小度在"最强大脑"比赛中以1:1战平名人堂公认最擅长声音辨别的选手孙亦廷,引发了一些媒体的追踪报道,我们惊喜的同时也发现有些文章的报道是不准确的,这种漫无边际的夸大实质上对百度口碑是不利的.我们始终应该清晰的认识到:人工智能经过半个多世纪的起起伏伏,到如今开始

中科联想身份认证云服务联合实验室在北京揭牌

中国科学院自动化研究所与联想(北京)有限公司联合成立的"中科联想身份认证云服务联合实验室"在自动化所揭牌. 记者26日从中国科学院自动化研究所获悉,该所与联想(北京)有限公司联合成立的"中科联想身份认证云服务联合实验室"已在北京揭牌.该实验室面向国家"互联网+"行动计划中金融.政务.公安.社保.交通.教育.医疗等领域对自主可控身份认证云服务的重大需求. 如今在中国,"互联网+"势头正足,但也存在一些网络安全隐患.而"

WINPASS静脉身份认证系列产品最大的技术优势是安全性

很长一段时间里,应用最广泛也最为公众了解的生物识别身份认证技术是指纹识别身份认证.随着更多的指纹产品进入寻常百姓家,安全问题逐渐引起大家的关注.为了解决大家对安全问题的担忧,智冠股份通过对生物识别身份技术的进一步了解,发现日本80%的ATM都使用了指静脉识别身份认证装置取代密码输入.既然指静脉身份识别技术能在日本金融领域大规模应用,那是否证明了这项技术具有高安全性呢?智冠股份通过进一步的调查,确定了这一事实并将静脉识别技术引入国内.智冠股份从创业之初的进军电子政务领域到2010年涉足生物识别技术

生物识别与身份认证技术无缝结合 国民认证终结移动支付最大痛点

以生物特征为主的多因子认证技术代表了移动支付领域的最新发展方向,将成为未来互联网金融安全的重要支撑.为解决当前移动支付安全领域的难题:安全与便捷的平衡,万达集团旗下"快钱钱包"欲以生物认证技术为切入口,与国民认证合作上线指纹身份认证. "现在连买个煎饼果子都可以用手机支付了!" 这句话很形象地体现了当今中国移动支付发展迅猛之势.出门不带钱,掏出手机就可以"买买买",移动支付已经逐渐把我们引入不带钱包的时代! 不过,这么简单快速的手机支付,我们多少

专访牛津教授Ivan Martinovic:基于生物识别的身份认证也不安全,金融监管还需哪些黑科技?

随着金融科技迅猛的发展,日益凸显的金融风险和安全隐患也对金融监管提出了越来越高的新要求.金融科技在推动引发着金融领域的创新变革的同时,也正促进着关于监管本身,其监管科技(Regtech)的不断升级. 近日,"中英金融监管科技高峰论坛"在深圳举办.其中,在<对身份认证的攻击与防范办法>为主题的演讲中,来自牛津大学计算机科学系的教授Ivan Martinovic详细介绍了其正主导研究的生物行为特征识别技术,在身份识别和保障金融信息安全中的作用. 关于金融科技中的生物计量认证,据

新金融、新安全下的身份认证方式

[51CTO.com原创稿件]身份认证是保障网络金融安全最重要的一道防线.既安全又便捷的身份验证方式是什么呢?这就是生物识别技术. 10月25日,在2016蚂蚁金服新金融安全论坛上,蚂蚁金服安全产品技术部资深总监冯春培表示,传统的身份验证方式就是账号加密码.互联网发展至今,几乎我们每个人都会在不同网站或者APP上注册账号,随着账号的增加设置的密码难免相同,非常容易被攻击者在得知一个账号密码后在别的平台实施撞库,致使其他平台的信息遭遇泄露的风险.于是出现了手机短信验证,动态的验证码不易被泄露,但是