「Windows 语音输入工具,基于豆包 ASR 实现实时语音识别。」
简介
豆包语音输入 - 极速版
基于 doubao-ime-win 开源项目二次开发,新增 按键说话 与 可视化设置 功能。
🌟 动作功能
本工具调用豆包大模型 API,提供低延迟、高准确率的实时语音转文字输入功能。
核心特性
- 双模式支持:
- 👆 按键说话 (默认):像对讲机一样,按下快捷键(默认 F2)开始说话,松开立即上屏。适合高频短语输入。
- ⚡ 双击触发:双击修饰键(默认 Ctrl)开启录音,再次双击停止。适合长段听写。
- 极速响应:采用流式识别技术,边说边转,几乎无感延迟。
- 可视化设置:右键托盘图标即可打开设置界面,轻松修改识别模式和快捷键,无需手动修改配置文件。
- 智能标点:自动添加标点符号,智能断句。
🎯 适用场景
- 即时通讯:微信、QQ、Discord 聊天时快速回复。
- 文档写作:Word、Notion、Obsidian 中快速口述草稿。
- 代码注释:编程时快速录入中文注释。
- AI 对话:与 ChatGPT、Claude 等 AI 助手对话时快速输入长指令。
📖 使用方法
1. 首次配置
- 下载并运行程序
doubao-voice-input.exe。
- 程序会在运行目录下生成
config.toml 文件。
- 这是一个独立的 EXE 程序,可以通过 Quicker 的“打开/运行”动作启动,或设为开机自启。
2. 日常使用
- 按键说话模式 (推荐):按住 F2 键开始说话,屏幕出现红色图标,松开即输入。
- 修改设置:右键点击任务栏“豆包”图标 -> 选择 “设置”。修改后需重启程序生效。
📌 修改说明
相比原版项目,我们进行了以下改进:
- 新增按键说话模式:交互更符合自然习惯,松开即上屏。
- 新增设置界面:Win32 原生对话框,方便快速配置快捷键。
最近更新
|
修订版本
|
更新时间
|
更新说明
|
|
0
|
13小时4分钟前
|
|