理想论坛_专业20年的财经股票炒股论坛交流社区 - 股票论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 3298|回复: 0

拥挤的AI语音芯片赛道,探境科技凭啥突围?

[复制链接]

9650

主题

9650

帖子

2万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
28966
发表于 2019-12-27 16:20 | 显示全部楼层 |阅读模式
  由于资本的涌入、智能家居的炽热和野生智能的突起,市场对语音市场的关注度灵敏提拔。特别是近年来随着亚马逊、谷歌、华为和 BAT 等厂商入局智能音箱,争先押宝这个智能家居的关键进口以后,语音市场变无暇前拥堵。
  按照 ReportLinker 的猜测,到 2024 年,举世智能语音市场范围将跃升到 215 亿美圆,而在傍边 AI 语音芯片就饰演了一个关键脚色。不同于过往的芯片只考虑 PPA,开辟者在挑选语音芯片的时候更多是考虑其体验,但这是很多过往的硬件打点计划所不具有的。这就吸引了众多传统厂商大要草创企业起头纷纷涌入 AI 语音芯片这个赛道,用 MCU、DSP 大要 ASIC 的计划来打点现有,有些厂商甚至还推出了倾覆传统的新架构去抢占市场。
  但在行业专家看来,这些计划或多或少都存在一些题目。要了解这一点,就必须从语音识别行业的一些现状说起。
  语音识别面临的几大搬弄
  以智能音箱为例,现在的语音识别产物在厂商的智能家居计划蓝图中是饰演一小我与呆板交换的桥梁,那在现实利用中就要求音箱可以大要听获得人说的话,同时还要求它听得清楚和听得准。这就提出了第一个搬弄——那就是信噪比。
  所谓信噪比,就是目标信号与干扰信号强度比值的对数,我们需要必定的信噪比,才华让呆板听得清楚。但按照声音的传布特征,它在空气中衰减会很是大,但人在与智能音箱交换的进程中,大要会处在差此外位置和间隔。这就给相关的计划供给商提出了一个困难,这也是语音识别所面临的最大搬弄。
  第二个题目黑白稳态的噪声影响。假如我们面临的是纪律的噪声,应对的法子无疑会简单很多。但在现实的利用情况中,我们经常碰面临的是带有突发性和不成预见性的乐音,这给供给商也带来了不小的搬弄。
  第三,多声源的题目。智能音箱在利用的进程中,只会服从一个声源的指令,但在人机交换的进程中,一定会出现干扰源。怎样处置赏罚这个干扰的题目,也困扰着相关供给商和开辟者。而实在面临这些题目,产业链已经想了很多应对之法。例如麦克风阵列、波束成形和降噪的引入,更强的野生智能芯片加持,但这仍然没有能完全打点题目。

  如上图所示,在传统计划中,系统末端识此外信号是在波束成形以后做的,由于波束成形依靠于声源定位(即 DOA),但 DOA 一样平常用单 MIC 信号来做检测。换而言之,我们这样计划的目标本来是为了提拔叫醒率和识别率,但依靠于单 MIC 信号的检测以后,两者之间就存在相互依靠的关系,这就会给装备的叫醒率形成影响。
  其次,传统计划里面有多个模块和多个环节,但他们并不都是以低落识别率为优化目标,这就让降噪、信号增强和末端的识别大要会出现不适配的情况,使得系统固然降了噪,但没有获得想要的识别率的提拔。
  再者,传统的流程对硬件要求很是高,对 MIC 的齐截性以及电容元器件的齐截性要求很是高。这就节能会致使大家在实行室和在量产线上获得差此外成果。量产场景下的识别率很是差。这重要与波束成形和声源定位要求高,一旦出现波动会影响识别成果有关。
  此外,波束成形算法道理是增强设定波束内的信号强度,衰减波束外的信号幅度。那就意味着当干扰声源和目标声源偏向很是靠近的时候,信号和噪声是会同时增强,这是传统波束成形算法也不能打点的题目。
  单从芯片的角度看,也有很多的困难要面临。如算力题目、冯诺依曼架构带来的内存墙题目,还有基于浮点练习出来的模子与定点推理之间的不婚配引致的重新练习和精度丧失等题目。其他如对神经收集支持不够、功耗太高和开辟复杂等也是当下很多语音识别芯片的掣肘地址。市场渴求更好的打点计划。
  基于创新架构开辟新途径
  面临以上各种搬弄,由 Marvell 中国芯片研发部分前高管鲁勇建立的探境科技正在从架构、芯片、软件和算法等多维度创新动手,帮助语音识别计划客户打点其题目。而其倾覆性创新的 SFA(storage First Architectur)架构则是他们“全栈”式办事的底子。
  探境科技 CEO 鲁勇教员首先告诉半导体行业观察记者,他们的 SFA 架构并不是大家所以为的存算一体架构。在他看来,现在很多所谓的存算一体架构存在着本钱、牢靠性、算法兼容性等题目。
  “我们的 SFA 从架构上也是将盘算和存储单元分隔,可是我们的做法是以存储来驱动盘算,而且将传统 AI 运算时要在数据在存储和盘算单元中往返搬回屡次的进程紧缩到一次却又不影响成果精度。这是我们的焦点合作力地址,这也能很多 AI 语音识别芯片碰到的题目水到渠成”,鲁勇说。
  从现实测试上看,探境科技 AI 语音芯片的表现杰出。据鲁勇先容,在现实测试中,探境科技的 AI 语音识别芯片的数据拜候可低落 10~100 倍,存储子系统功耗下降 10 倍,而基于 28nm 工艺打造的芯片系统能效超出 4T OPS/W。

SFA 架构芯片与其他芯片的对照注:在 28nm 公用测试芯片上获得的对照数据,测试方式为带有卷积加速器扩大指令的 DSP 形式与 SFA 架构形式的对照,乘法器数目类似,DRAM 为 LPDDR4

  除了高性能的能耗比之外,这个架构还有很是好的易用性和通用性。
  鲁勇指出,基于 SFA 架构打造的 AI 芯片不是针对某一个神经收集做的优化,可以支持全数已知的神经收集,而且能让全数神经收集在其上面都能跑出最高的服从;同时它对参数也没有限制,可以用尽情的参数;此外,基于 SFA 架构打造的芯片对数据典范也没有限制,可以支持定点数、位点数。针对常见的希奇数据,这个芯片也有自顺应的支持,而不用野生干涉。“探境科技供给的工具链可以让开辟者可以大要零底子切入 SFA 架构芯片的开辟。”鲁勇夸大。

探境科技的语音产物矩阵

  基于 SFA 架构,探境科技开辟出了语音和图像两条产物线,其中语音产物已经获得了客户的高度认可。其中音旋风 611 功不成没。
  据了解,这是探境科技针对智能家居市场推出的一款语音识别芯片,是现在市道上综合性能最好,性价比最高的一款芯片。以下图所示,它可以大要支持 200 条的命令词,可以大要做到 99% 的叫醒率和极低的误叫醒率。
  至于探境科技的另一条产物线图像芯片也已经流片乐成,等待探境科技用其给市场带来更多的赋能。

音旋风 611

  固然基于 SFA 打造的芯片具有多项上风。但正如上文所说,语音识别计划是一个触及多个模块的项目,芯片只是傍边的一环。为此,探境科技从多个角度动手,为语音识别计划商供给了一个交钥匙计划。
  针对前文提到的传统麦克风阵列信号增强算法的弱点,探境科技提出了一个新的处置赏罚方式,把增强和识别一体化处置赏罚,做了一个端到真个识别流程。

  据探境科技的技术副总裁李同治先容,他们在这个识别流程里放弃了用传统数字信号处置赏罚算法来做语音增强的做法,而是用一套基于神经收集的 AI 算法来做信号增强。他指出,这个计划的处置赏罚算法全数的参数都是和神经收集一路练习的,这样团体优化的目标都是为了低落末端的识别毛病率,而不但仅是提拔信号质量。

端对真个处置赏罚算法是最前沿的处置赏罚算法

  “我们这套降噪算法与传统的降噪算法纷歧样,我们的降噪算法是基于深度进修的 AI 降噪算法,不但可以处置赏罚常见的稳态噪声,对一些非稳态的噪声和突发性的噪声也可以很好地处置赏罚。”,李同治补充说。
  除了这个降噪算法之外 ,探境科技还开辟出了专门用来做语音识此外高盘算强度的神经收集 HONN。据了解,高强度神经收集的参数目不大,仅为 DNN 的五分之一,这就让探境科技可以用更少的参数目和更少的存储到达了更好的成果。
  与此同时,高强度盘算神经收集的算力需求量很大,但 DNN 只要个位数的盘算强度,两者之间差了 30 倍。这也是为什么其他厂商并没有益用成果更好的 HONN,而是 DNN 的原因原由。由于这个算力要求对基于 SFA 打造的 AI 芯片来说是绰绰不足,但对很多其他架构芯片来说,是难以对付的,李同治告诉记者。
  “SFA 不但仅是适配于终端,也适配于云端、推理、练习,可以组分解各类差此外产物形状,适当于终端、推理、练习”,鲁勇末端说,但他也夸大,将 SFA 利用到云端会是一个很冗长的进程。我们现在可以看到的是,探境科技正在用他们的全栈气力在拥堵的语音 AI 芯片赛道上找到了属于他们的”捷径”.

免责声明:假如加害了您的权益,请联系站长,我们会实时删除侵权内容,感谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|理想论坛_专业20年的财经股票炒股论坛交流社区 - 股票论坛

GMT+8, 2020-7-7 20:48 , Processed in 0.158362 second(s), 29 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表