麦克风和电脑内播放声音实时识别转文字软件FunASR整合包V5下载

article/2025/8/13 10:54:38

我基于FunASR制作的实时语音识别转文字软件当前更新到V5版本。软件可以实时识别麦克风声音和电脑内播放声音转为文字。

FunASR软件介绍

FunASR 是一款基础语音识别工具包和开源 SOTA 预训练模型,支持语音识别、语音活动检测、文本后处理等。

我使用FunASR制作了一款实时语音识别转文字软件,当前版本为V4版本,由于前几天分享过另一个音视频识别转文字软件faster-whisper《音频视频转文字软件faster-whisper 1.1.1整合包下载,精准快速语音转录工具》,那个软件已经很好用了,所以当前软件版本我删除了文件识别功能,只保留了实时语音识别功能。

FunASR在2月5日刚更新过,我基于最新版制作了当前版本实时语音识别软件整合包

如果需要同时有识别文件和实时识别功能的话,请用V3版本,链接《实时语音识别转文字软件V3版,批量音频视频录音转文字提取工具》

FunASR实时语音识别整合包V5软件使用说明

软件下载解压后直接双击【启动软件.exe】即可启动。软件操作界面比较简单

首先选择识别内容保存位置,识别结果输出文件格式为txt

块长度和上下文长度决定了最终的识别效果,块长度值越大,相同语速下每段识别出的内容的字数越多,上下文长度值建议是块长度值的1/2,这两个值越大,识别出的文字内容越准确,但是延迟也越高,这个可以自行测试效果,选择合适的值

音量阈值就是用于屏蔽低音噪音的,如果说话人环境比较嘈杂,可以设置该值,屏蔽掉低音噪音部分,值越大,屏蔽的声音分贝越高,也就是屏蔽的声音越多

翻译工具国内用户用百度,国外用户用谷歌,免费申请百度翻译API可以查看下面教程《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》

如果你想翻译成的目标语言在列表里没有,可自行设置语言代码,百度翻译和Google翻译语言代码参考下面文章《百度翻译谷歌翻译API语言代码名称对照表》,将所需要的语言代码填入目标语言输入框里即可

由于软件是收集一定长度的识别文本之后再将文本提交到翻译工具进行翻译,然后收到返回翻译结果再进行显示,所以翻译文本和识别的文本有时间差,不会同步显示

待翻译文本长度的意思就是一次性提交给翻译工具的文本长度,软件并不是每次识别出内容之后都提交给翻译工具的,而是收集到一定长度的文本内容之后再发送给翻译工具进行翻译。发送给翻译工具的文本越短,翻译结果越不准确,发送的文本越长,翻译工具越能综合上下文意思翻译的更准确,但是收集的文本越长等待时间也就越长,可自行取舍。一个英文字母算一个字符,一个汉字也算一个字符,如果是类似英语语言这个值建议大一点

软件支持识别电脑内播放的声音或是麦克风等外部输入的声音。如果需要识别电脑内播放的声音,需要先进行电脑设置,鼠标右键点击电脑屏幕右下角音量喇叭图标,选择 【声音】,点击录制选项卡,鼠标右键点击【立体声混音】,选择【设置为默认设备】,如果立体声混音没启动的话,需要先启用,然后运行软件开始处理,就可以实时识别电脑播放声音了。

如果想同时接收麦克风声音和电脑内播放声音,可在软件音频源中选择电脑播放声音,电脑声音设置里-录制-麦克风,点击鼠标右键,选择麦克风属性,勾选【侦听此设备】

字幕文本显示长度就是前端实时显示语音识别出的文本的字幕字符长度

如果无法使用的话,可以勾选显示调试窗口查看报错信息

软件使用视频教程:电脑实时语音识别转文本工具FunASR整合包视频使用教程-诺瓦小站

注意事项

本软件只支持识别中英文,不支持识别其它语言

软件运行路径中不要出现中文及空格,否则会报错

软件只支持win10或win11,不支持其他版本Windows系统,也不支持手机和MAC

有部分Win11用户发现软件无法检测到音频,也就是电脑立体声混音没有音频输入,可以安装voicemeeter虚拟声卡解决。在【1 HARDWARE INPUT】设置硬件声音输入设备,在【VIRTUAL INPUT】选中【B】,在【HARDWARE OUT】选择声音输出设备,然后打开电脑系统-声音-录制,将默认设备选择为VoiceMeeter VAIO3 Output,VoiceMeeter点击下载>>

电脑实时语音识别转文字软件V5版本下载链接

麦克风电脑内播放声音实时识别转文字软件FunASR整合包V5下载-诺瓦小站


http://www.hkcw.cn/article/ZvEPfslqcf.shtml

相关文章

Ollama 开放 局域网访问 外网访问 mac

目录 问题描述 搜索尝试 最终方案 问题描述 我们在本地安装Ollama模型后通过127.0.0.1:11434访问正常返回 但是无法通过局域网IP访问如: http://192.168.1.158:11434 搜索尝试 搜索发现需要添加环境变量 OLLAMA_HOST 才能开放外网访问 export OLLAMA_HOST0.0.…

让Windows“怀上”macOS,不要太漂亮

记得Windows 11刚发布时,很多人都说它“果味十足”,仿佛是在向macOS靠拢。虽然大家觉得Windows有点“没骨气”,但不得不承认,它的界面确实很美观。 今天给大家介绍两款软件,能让Windows拥有macOS的风格,看起…

Gradle配置指南:深入解析settings.gradle.kts(Kotlin DSL版)

文章目录 Gradle配置指南:深入解析settings.gradle.kts(Kotlin DSL版)settings.gradle.kts 基础配置选项单项目配置多项目配置 高级配置选项插件管理(Plugin Management)基础配置模板案例:Android项目标准配…

Android SDK安装与配置(小白教程)

目录 1、下载: 2、安装: 3、配置环境变量: 4、验证是否安装成功: Android SDK(软件开发工具包)是一套为开发者提供的全面工具和资源集合,涵盖不同版本平台、各类开发与调试工具、支持库等&a…

[wsl2]MacOS/Win局域网ssh连接wsl2:Ubuntu24.04 LTS

【wsl2】MacOS/Win局域网ssh连接wsl2:Ubuntu24.04 LTS 保证使用的是微软应用商店中下载的Ubuntu发行版本,本文在配置时发现若使用docker所基于的ubuntu系统配置会失败。遂采用默认的子发行版本。写在前面why wsl2?win11的好处 开始配置之前1.…

JAVA游戏打手俱乐部护航小程序+APP+公众号+h5 源码游戏陪玩小程序系统

一、系统概述 JAVA 游戏打手俱乐部护航陪玩系统是一款集小程序、APP、公众号和 H5 于一体的综合性游戏陪玩平台。该系统凭借丰富多样的功能,为游戏玩家和陪玩师傅搭建了便捷的沟通桥梁。其主要功能包括精准分类、优惠券管理、我的团队、师傅申请入驻、师傅端抢单机…

使用Mac下载MySQL修改密码第一篇_数据库

Mac下载MySQL MySQL官网链接MySQL​​​​​​ 当进入到官网后下滑到community社区,进行下载 然后选择community sever下载 这里就是要下载的界面,如果需要下载之前版本的话可以点击archives, 可能会因为这是外网原因,有时候下…

【Mac 从 0 到 1 保姆级配置教程 08】- 快速配置 Neovim、LazyVim 以及常用开发环境,如果之前有人这么写就好了

文章目录 2. 安装 Neovim3. 安装 LazyVim3.1. 安装依赖3.2. 安装 LazyVim3.3. 问题修复 4. 配置 LazyVim4.1. 基础知识4.2. 内置快捷键4.3. 自定义快捷键4.4. 配置主题4.5. 配置 C/C 环境4.6. 配置 JSON 和 Markdown 5. 最后6. 参考资料7. 系列教程 Mac 从 0 到 1 保姆级配置教…

Android SMS发送技术指南

本文还有配套的精品资源,点击获取 简介:本文详细介绍了在Android平台上如何使用编程接口(API)发送短信,包括 SmsManager 类的使用、调试技巧和设备兼容性处理。通过实例代码展示了如何实现文本消息的发送&#xf…

AndroidStudio创建Android虚拟机教程

前言 在 Android 开发的世界中,拥有一个可靠且灵活的测试环境是至关重要的。Android Studio 提供了虚拟设备(AVD)管理器,这是一个强大的工具,允许开发者创建自定义的虚拟设备来模拟不同的 Android 设备。通过 AVD&…

uniapp 小程序 web-view 打开H5页面传参以及调用postMessage回传参数

uniapp 小程序 web-view 打开H5页面传参以及调用postMessage回传参数 uniapp 运行微信小程序,在小程序内利用 web-view 打开H5页面进行数据流转的总结。 首先做点准备工作,官网明确的说了小程序是不支持本地的,那怎么进行调试呢,…

mac 下载nvm

先在终端查看是否安装brew brew -v显示版本,开始下一步,如果不显示版本,则需要先安装brew 安装brew 使用brew安装nvm 执行安装命令 brew install nvm配置环境变量 配置环境变量之前,先查看nvm下载的位置 brew list nvm这是…

Android的uid~package~pid的关系

UID : Linux 系统级用户标识,Android 中每个应用安装时分配唯一 UID(如 1000)。 Package: Android 应用包名(例如android),一个 UID 可关联多个 Package(共享 UID 场景如android:sharedUserI…

Rust 学习笔记:发布一个 crate 到 crates.io

Rust 学习笔记:发布一个 crate 到 crates.io Rust 学习笔记:发布一个 crate 到 crates.io提供有用的文档注释常用标题文档注释作为测试注释所包含的项目 使用 pub use 导出一个方便的公共 API设置 crates.io 账户添加 metadata 到一个新的 crate发布到 c…

大白话 Seata 分布式事务浅析,详解TCC模式

大家好,我是此林。 说到分布式事务,第一时间想到 Seata,它支持多种事务模型,比如:XA模式、AT模式、TCC模式、Saga模式(长事务)。 其中 TCC 模式是高性能分布式事务解决方案,适用于核心系统等对 性能有很高…

超标量处理器设计6-指令解码

1. 指令缓存 指令缓存本质上是一个FIFO, 它能够将指令按照程序中指定的顺序存储起来,这样指令在解码的时候,仍然可以按照程序中指定的顺序进行解码。指令缓存是超标量处理器中必须的部件,其原因有两个: 1. 每周期可以取指的个数大…

技嘉华硕微星主板BIOS开启TPM模块教程

目录 一. TPM模块安装 二. 在BIOS开启TPM功能 华硕主板(Intel平台) 华硕主板(AMD平台) 技嘉主板(Intel平台) 技嘉主板(AMD平台) 微星主板(Intel平台) …

java基础知识

ASCII码 1. next() 示例​​ 读取一个字符串(遇到空格或换行符停止) 运行示例:​​ 输入: 张三 李四 输出: 张三 // 只读取了"张三","李四"留在输入缓冲区

【解决】【亲测下载obsidian可行】打不开github.com 或者 加速访问 github

Windows系统 基本思路:通过修改IP绑定来实现加速访问 1、hosts文件目录 C:\Windows\System32\drivers\etc\hosts2、修改内容 2.1 ping github.com 在Windows的cmd页面下直接输入: ping github.comPS:这一步只是看一下,没在后…

逆向入门(1)

前言: 本篇文章面向想入门逆向的新手小白。 NSSCTF和BUUCTF是两个刷题网站,知识点下面会有对应的题,大家可以自己试着做一下 NSSCTF:https://www.nssctf.cn/problem BUUCTF:https://buuoj.cn/challenges 1.看exe模式(位数&am…