Paraformer语音模型:一种语音模型加速方法

article/2025/7/6 15:13:32

随着智能语音技术的普及,语音识别(ASR)、语音合成(TTS)、声纹识别等应用场景对模型推理效率提出了极高要求,本文介绍将Paraformer语音模型从预训练模型导出为ONNX格式,并使用ONNX Runtime进行推理的过程。

1、加载Paraformer模型

使用PyTorch的torch.load()函数加载已训练好的Paraformer模型权重文件。

2、定义输入张量

根据模型输入的要求,创建一个符合模型输入维度的虚拟张量(dummy tensor)。这个张量将用于在模型导出过程中模拟实际输入数据。

3、导出模型

使用PyTorch的onnx.export()函数将模型导出为ONNX格式。该函数需要传入模型对象、输入张量、输出文件路径等参数。在导出过程中可根据需要设置优化选项(如opset_version),以提高模型在ONNX Runtime中的推理性能。

4、验证ONNX模型

使用ONNX的验证工具(如onnx.checker.check_model())检查导出的ONNX模型是否有效。

5、加载ONNX模型

根据模型输入的要求,创建一个符合模型输入维度的虚拟张量(dummy tensor)。这个张量将用于在模型导出过程中模拟实际输入数据。使用ONNX Runtime的onnxruntime.InferenceSession()函数加载导出的ONNX模型文件。

6、准备输入数据

使用PyTorch的onnx.export()函数将模型导出为ONNX格式。该函数需要传入模型对象、输入张量、输出文件路径等参数。在导出过程中可根据需要设置优化选项(如opset_version),以提高模型在ONNX Runtime中的推理性能。将测试数据转换为与模型输入兼容的格式。使用InferenceSession对象的run()方法进行推理。该方法需要传入输入数据的容器和输出张量的名称。推理结果将以NumPy数组的形式返回。

7、处理推理结果

根据需要对推理结果进行后处理,包括解码、转换格式。

模型优化过程包含量化、剪枝,配置选项。量化是一种减少模型大小和提高推理速度的有效方法。在ONNX模型中,蒙帕巡检机器人使用Post-Training Quantization (PTQ)技术,进行高效率的模型优化。

图1机器人进行语音模型加速后的时间对比

PTQ:使用ONNX Runtime提供的量化工具,在导出ONNX模型后对模型权重进行量化,使用quantize_dynami方法改变其数据类型;剪枝是一种通过移除模型中不重要的部分来减小模型大小和提高推理速度的技术。

对于ONNX模型,使用onnx_simplifier库下的optimize方法来实现剪枝:首先遍历计算图中的所有节点,找到不需要剪枝的节点(例如输入节点、输出节点、常量节点等),对其他节点进行剪枝;

配置选项可根据特定的硬件和场景进行调整以提高性能,包括设置线程数和启用内存优化等。通过调整这些配置选项,可以确保ONNX Runtime能充分利用硬件资源达到最佳性能。

日常巡检过程中,蒙帕巡检机器人通过将Paraformer模型导出为ONNX格式,并使用ONNX Runtime进行高效推理,从而赋能设备巡检、人机互动等应用场景,有效提高巡检运维的智能化与准确率。


http://www.hkcw.cn/article/BJkxynjdUw.shtml

相关文章

Spring,SpringMVC,SpringBoot

1.Spring最核心包括aop和ioc概念 AOP 能够将将哪些于业务无关的,并且大量重复的业务逻辑进行封装起来,便于减少重复代码,降低模块之间的耦合度,给未来的系统更好的可用性和可维护性。 Spring中AOP是采用动态代理,JDK代…

浏览器的渲染原理

浏览器的渲染原理 掘金 整个过程 网络 网络线程: 收到html,css,js 文件资源. 产生一个渲染任务,并将其传递给渲染主线程的消息队列. 渲染 在事件循环机制下, 渲染主线程取出消息队列中的渲染任务,开启渲染流程. 整个过程 渲染主线程 完成 绘制之前的所有工作合成线程和…

【30万像素实时调控!石墨烯“魔镜”突破毫米波极限】

12厘米见方的超表面,藏着30万个比头发丝还细的像素单元,正在无声地操控着无形的太赫兹波束。曼彻斯特大学的科学家们将石墨烯的非凡电学特性与现代显示技术巧妙融合,创造出世界上最大规模的可编程智能超表面。想象一下,只需轻轻点…

线性调频波形测距测速信号处理——全代码+注释

clear all close all clc %% 参数设置 fs600e6;%采样率 fc10.45e9;% 波形发射载频 t10e-6;%脉宽 f050e6;%波形中频频率 B10e6;%带宽 uB/(2*t);%调频斜率 Tv100e-6;% 脉冲重复周期 Num64;% 测速脉冲数 lamdfs/B;% 抽取带宽 Nsround(fs*t); NTvround(fs*Tv); tt0:1/fs:t-1/fs; ff…

Spine工具入门教程2之导入

1、导入定义 从原画转化为Spine的环节。 (1)选择路径,拖动图片导入方式 缺点:定位不准 【使用批量导出的方式】 在PS工具中,选择所有图层后右键选择导出。 在Spine工具中,选择路径导入图片。 然后再拖…

吴恩达MCP课程(1):chat_bot

原课程代码是用Anthropic写的,下面代码是用OpenAI改写的,模型则用阿里巴巴的模型做测试 .env 文件为: OPENAI_API_KEYsk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx OPENAI_API_BASEhttps://dashscope.aliyuncs.com/compatible-mode…

Z-AnyLabeling1.0.1

1.前段时间写了第一个版本的Z-AnyLabeling,使用起来只能标注一个文件夹里面的图片,不能标注多个文件夹数据 2.现在更新一个版本可以标注多个文件夹数据,同时可以保存成一个工程文件。 3.软件开发环境:Pycharm,Pyside6 4.软件界面 …

告别充电焦虑:移动充电桩如何优化传统充电模式?

新能源汽车的普及,充电难、充电慢的问题日益凸显。传统固定充电桩受限于场地和电网,难以满足用户灵活、高效的充电需求。而移动充电桩的出现,正逐步改变这一局面。它以其灵活部署、智能调度和高效补能的优势,为缓解充电焦虑提供了…

github访问慢

解决github外玩访问慢 ,点击解决方案

榕壹云医疗服务系统:基于ThinkPHP+MySQL+UniApp的多门店医疗预约小程序解决方案

在数字化浪潮下,传统医疗服务行业正面临效率提升与客户体验优化的双重挑战。针对口腔、美容、诊所、中医馆、专科医院及康复护理等需要预约或诊断服务的行业,我们开发了一款基于ThinkPHP+MySQL+UniApp的多门店服务预约小程序——榕壹云医疗服务系统。该系统通过模块化设计与开…

RPA如何支持跨平台和跨浏览器的自动化

RPA,即机器人流程自动化(Robotic Process Automation),正日益成为企业实现业务流程高效自动化的关键技术。在复杂的数字化环境中,跨平台和跨浏览器的自动化需求极为迫切,RPA 通过多种技术手段和策略来满足这…

SpringBoot简单体验(TODO)

1 Helloworld 打开:https://start.spring.io/ 选择maven配置。增加SpringWeb的依赖。 Generate之后解压,代码大致如下: hpDESKTOP-430500P:~/springboot2/demo$ tree ├── HELP.md ├── mvnw ├── mvnw.cmd ├── pom.xml └── s…

事件驱动架构入门

主要参考资料: 软件架构-事件驱动架构: https://blog.csdn.net/liuxinghao/article/details/113923639 目录 简介事件队列事件日志事件收集器响应队列读事件 vs. 写事件 简介 事件驱动架构是一种系统或组件之间通过发送事件和响应事件彼此交互的架构风格。当某个事…

2024全国青少年信息素养大赛python复赛真题——计算握手次数

2024全国青少年信息素养大赛python复赛真题——计算握手次数 题目可点下面去处,支持在线编程,在线测评~ 计算握手次数(2024全国青少年信息素养大赛复赛真题)_python_少儿编程题库学习中心-嗨信奥 题库收集了历届各白名…

[春秋云镜] CVE-2023-23752 writeup

首先奉上大佬的wp表示尊敬:(很详细)[ 漏洞复现篇 ] Joomla未授权访问Rest API漏洞(CVE-2023-23752)_joomla未授权访问漏洞(cve-2023-23752)-CSDN博客 知识点 Joomla版本为4.0.0 到 4.2.7 存在未授权访问漏洞 Joomla是一套全球知名的内容管理…

Trae Builder编程助手-基于Builder完成算法生成+api接口实现全流程

Trae插件下载链接 ​ 总结 使用过Builder后,我的感觉就是,可以通过嘴写代码!!雄起吧,我们程序员的口语交际能力。同时重点要先把自己的编码环境设置好,否则很麻烦 参考 安装过程单击Trae插件下载链接&…

python笔面试题汇总

1. 如何利用SciKit包训练一个简单的线性回归模型 利用linear_model.LinearRegression()函数 # Create linear regression object regr linear_model.LinearRegression() # Train the model using the training sets regr.fit(data_X_train, data_y_train) 2. 例举几个常用的…

pandas数据分析

数据读取 import pandas as pd df pd.read_csv(D:\my_app\python\python project\data\sample_data.csv) print(df)数据保存 import pandas as pd# 创建示例数据 data {Name: [Alice, Bob, Charlie, David, Eve],Age: [25, 30, 35, 28, 22],City: [Beijing, Shanghai, Guan…

力扣每日一题——找到离给定两个节点最近的节点

目录 题目链接:2359. 找到离给定两个节点最近的节点 - 力扣(LeetCode) 题目描述 解法一:双指针路径交汇法​ 基本思路 关键步骤 为什么这样可行呢我请问了? 举个例子 特殊情况 Java写法: C写法&a…

一种通用图片红色印章去除的工具设计

朋友今天下午需要处理个事情,问我有没有什么好的办法能够去除,核心问题是要去除图片上的印章。记得以前处理过类似的需求,photoshop操作比较简单,本质是做运算。这种处理方式有很多,比如现在流行的大模型,一…