佛法学院宣布语音AI的新进展：移动终端还可以实现接近真实人的语音交互体验

9月18日，在2020年Yunqi会议上，佛学院（Dharma Academy）宣布了语音AI技术的最新突破：设备上的语音识别和语音合成功能首次达到了可与云媲美的水平，这意味着将来，个人用户可以使用移动终端。轻松体验接近真实人群的语音技术。
据报道，达摩学院最新的语音技术已在淘宝直播，DingTalk，AutoNavi导航等场景中得到了大规模应用，并向外界全面开放。语音AI的核心是使机器能够理解人类的语音和语音。
语音合成和语音识别技术是实现这些目标的基础。但是，由于该行业在过去几年中未能在语音模型上进行突破性创新，因此高精度语音交互任务长期以来一直依赖于云计算能力，从而导致诸如不可避免地延迟语音命令处理之类的问题。
这次，佛法学院率先创新算法模型，推出了E2E-ASR端到端语音识别技术和全新的端到端KAN-TTS语音合成技术，实现了接近语音识别和合成效果。首次在移动终端上云。
据报道，在语音识别方面，达摩学院提出了一种SAN-M网络结构和一种基于SCAMA的流媒体端到端语音识别框架，可以提高计算效率，并在困难场景中将语音识别错误率降低近一半。 30％。
。由Dharma Academy开发的语音识别系统可以完全离线且低成本地部署在手机上。
原型系统不到40MB，识别效果可媲美达摩学院上一代的DFSMN-CTC云系统（超过100GB）。去年发布了自主开发的仿真率达97％的KAN-TTS语音合成模型后，达摩研究所（Dharma Institute）已实现了“大减肥”。
移动终端上的语音模型。与云相比，终端上的模型尺寸减少了101倍。
计算量被压缩了35倍，并且可以通过终端的计算能力快速再现接近真实人的声音。例如，AutoNavi Maps最近发布了李嘉琪，林志玲，小团团和其他使用佛法学院新语音技术合成的星空导航语音包。
语音效果比以前更自然，即使断开网络连接，语音导航也不会中断。佛法学院语音实验室负责人严志杰说：“在终端上处理语音任务一直是学术界和工业界的难题。
佛法学院的最新语音技术有效地释放了终端设备的功能，使终端可以轻松地处理语音任务。，我们相信，在终端计算能力和云计算能力的共同支持下，语音交互将在未来无处不在。
”在过去的几年中，阿里巴巴语音AI取得了一系列突破。 2019年，阿里巴巴语音AI被美国麻省理工学院评论评选为``全球十大突破性技术''之一，并且是名单上唯一的中国技术公司; IDC于今年7月发布了有关中国AI云服务市场的半年度研究报告。
阿里巴巴语音AI以44％的市场份额在云语音AI市场中排名第一。

公司: 深圳市捷比信实业有限公司

电话: 0755-29796190

邮箱: momo@jepsun.com

产品经理: 聂经理

QQ: 2215069954

地址: 深圳市宝安区翻身路富源大厦1栋7楼

微信二维码

更多资讯

获取最新公司新闻和行业资料。

大毅大毅智能穿戴设备：以科技赋能健康生活，重塑人机交互体验大毅大毅智能穿戴设备：从硬件到生态的全面升级作为国内领先的智能穿戴品牌，“大毅大毅智能穿戴设备”依托母公司大毅电子的技术积累，持续推动产品智能化、个性化与健康管理能力的深度融合。1. 全栈自研核心技术大毅...
AM系列高保真组件：打造极致音质体验的科技之选 AM系列高保真组件：定义音频新标准在追求极致音质的音频领域，AM系列高保真组件凭借其卓越的性能与精湛的工艺，已成为高端音响系统中的核心组成部分。该系列不仅继承了品牌一贯的高品质基因，更在声学设计、材料选择和...
can通讯终端电阻可以低于120欧吗 CAN总线终端电阻器的功能是什么？为什么是120Ω？为什么是0.25W？CAN总线的端子电阻通常为120欧姆。事实上，在设计时，两个60欧姆的电阻器串联，总线上通常有两个120欧姆的节点。终端电阻器的作用CAN总线端子电阻器具有三种功...
嵌入式通信技术：实现设备间高效互联的新范式嵌入式通信：连接万物的智能神经网络嵌入式通信技术正成为物联网（IoT）、工业自动化和智能终端发展的核心驱动力。通过将通信模块深度集成于主控芯片或传感器内部，实现了低功耗、高可靠性的数据交互。1. 嵌入式通信的...
GEMS真空压力开关PS81系列：实现高可靠性与长使用寿命 GEMS真空压力开关PS81系列是专为需要高可靠性和长使用寿命的应用设计的。这款压力开关具有出色的性能和耐用性，能够在各种工业环境中稳定工作。PS81系列特别适用于那些要求频繁动作且需要最小维护的系统。其设计考虑了减...
测量金属丝电阻率实验采用分压还是限流视情况而定,如果题目明确要求电阻电压要从0开始变化,或者滑动变阻器的最大阻值远小于待测电阻的阻值,以上两种情况必须采用分压式.其次限流法测小电阻,分压式测大电阻（一般与滑动变阻器阻值相比）. 希望对你有帮助...
viking新品播报：长端接厚膜电阻器- CRW ..A 系列关注稳健设计，为 PCB 散热提供更短的路径，提高额定功率，宽电极结构支持良好的热循环性能。调整焊膏的成分以提供所需的近似电阻，并通过激光微调器将其微调至指定值。特征- 长边端接增强了紧凑尺寸的额定功率- AEC-Q200 ...
从硬件到云端：如何高效实现 ThunderBolt 切换器与 TIA Portal 及 MindSphere 的联动从硬件到云端：如何高效实现 ThunderBolt 切换器与 TIA Portal 及 MindSphere 的联动随着工业4.0的深入发展，企业对“软硬一体”的集成化解决方案需求不断上升。要充分发挥 ThunderBolt 切换器在高速数据交换中的潜力，必须将其与西门子...
深入解析：AM系列高保真组件如何提升家庭影音系统表现 AM系列高保真组件：重塑家庭影音系统的听觉边界随着人们对居家娱乐品质要求的不断提升，传统音响系统已难以满足对音质、稳定性和智能交互的多重期待。AM系列高保真组件应运而生，成为构建高端家庭影音系统的关键基石。...
浪涌保护器的专业术语 1.空气终端系统用于直接接受或承受雷电的金属物体和金属结构，如避雷针、避雷带(线)、避雷网等。 2.引下线系统连接空气终端和接地装置的金属...
HELI2 RGB 3mm LED灯珠实战指南：如何实现多色动态灯光效果掌握HELI2 RGB 3mm LED灯珠的编程与控制技巧HELI2 RGB 3mm LED灯珠不仅具备出色的光学性能，更支持多种控制方式，是实现创意灯光项目的理想选择。本文将详细介绍其实现多色动态效果的技术路径。硬件连接方式建议使用共阴极（Commo...
如何根据实际需求选择合适的电阻阵列：CN..A、SWR..A与CRW..A系列深度指南前言：电阻阵列在现代电子设计中的重要性随着电子产品向小型化、高性能和高可靠性方向发展，传统单个电阻已难以满足复杂电路的设计需求。电阻阵列作为一种集成化解决方案，不仅节省了PCB空间，还提升了装配效率与一致...
如何高效实现超小封装电容的可靠安装？实用技巧全解析引言：为何超小封装电容安装挑战大？随着5G通信、智能穿戴设备和微型传感器的发展，电路板空间日益紧张，超小封装电容成为主流选择。然而，其微小尺寸带来的安装难题也日益凸显——从贴装偏差到焊接缺陷，每一个环节都...
音讯系统设计中的核心要素与实践策略音讯系统设计中的核心要素与实践策略在现代数字媒体与智能设备广泛应用的背景下，音讯系统设计已成为技术开发中的关键环节。一个高效、稳定且用户体验优良的音讯系统，不仅影响产品的功能性，更直接决定用户对产品整...
可编程晶振技术解析：I²C接口如何实现精准频率调节可编程晶振的核心优势与应用前景随着电子设备对时钟精度和灵活性要求的不断提升，可编程晶振（Programmable Crystal Oscillator, PCXO）正逐渐成为现代嵌入式系统中的关键元件。尤其在支持I²C通信协议的可编程晶振中，用户可通过软...
RLN金属箔电流传感器：实现非接触式高精度电流检测的新方案 RLN金属箔电流传感器的技术突破RLN金属箔电流传感器是一种基于霍尔效应与磁通门原理相结合的新型电流检测装置，利用高精度金属箔感应元件实现对导体周围磁场的精准捕捉，从而无损地测量通过导线的电流大小。创新设计亮...
镜头盖如何科学使用以避免镜头划伤？深度解析实用技巧前言：镜头划伤的常见原因分析镜头划伤不仅影响图像清晰度，还可能导致眩光、鬼影等问题。据统计，超过60%的镜头损伤源于不当存放或操作。其中，镜头盖使用不当是主要原因之一。一、镜头盖的材质选择至关重要1. 塑料镜...
电流感应贴片电阻器与PSoC可编程片上系统协同设计：实现高精度实时监测引言在现代电子系统中，精确的电流监测对于设备安全、能效优化和故障预警至关重要。电流感应贴片电阻器（CS系列）与可编程片上系统（PSoC）的结合，为智能电源管理提供了高效、紧凑且灵活的解决方案。1. 电流感应贴片电...
薄膜精密电阻器AR..A系列：实现微小误差下的精准控制薄膜精密电阻器AR..A系列的技术亮点AR..A系列作为薄膜精密电阻器的代表产品，专为需要极致精度与长期稳定性的应用而生。其在材料选择、制造工艺和质量控制方面均达到行业领先水平。关键技术特性超低噪声特性：采用高纯度...
如何通过讯达电容优化音讯设备性能？实用指南如何通过讯达电容优化音讯设备性能？实用指南在追求极致音质的音频爱好者与工程师群体中，更换或升级电容已成为一种常见且有效的调音手段。尤其当使用‘讯达电容’替换传统电解电容或普通薄膜电容时，往往能带来令人...