豆包语音输入

豆包语音输入 公开 已发布

ailele 分享于 13小时4分钟前 | 0 | 2
如何安装动作?

适用于
分类(旧)
文本处理 剪贴板相关 AI
关键词



更多信息
分享时间 13小时4分钟前
最后更新 13小时4分钟前
修订版本 0
用户许可 -未设置-
Quicker版本 1.44.55
动作大小 4 KB

分享到

「Windows 语音输入工具,基于豆包 ASR 实现实时语音识别。」

简介

豆包语音输入 - 极速版

基于 doubao-ime-win 开源项目二次开发,新增 按键说话可视化设置 功能。

🌟 动作功能

本工具调用豆包大模型 API,提供低延迟、高准确率的实时语音转文字输入功能。

核心特性

  • 双模式支持
    • 👆 按键说话 (默认):像对讲机一样,按下快捷键(默认 F2)开始说话,松开立即上屏。适合高频短语输入。
    • ⚡ 双击触发:双击修饰键(默认 Ctrl)开启录音,再次双击停止。适合长段听写。
  • 极速响应:采用流式识别技术,边说边转,几乎无感延迟。
  • 可视化设置:右键托盘图标即可打开设置界面,轻松修改识别模式和快捷键,无需手动修改配置文件。
  • 智能标点:自动添加标点符号,智能断句。

🎯 适用场景

  • 即时通讯:微信、QQ、Discord 聊天时快速回复。
  • 文档写作:Word、Notion、Obsidian 中快速口述草稿。
  • 代码注释:编程时快速录入中文注释。
  • AI 对话:与 ChatGPT、Claude 等 AI 助手对话时快速输入长指令。

📖 使用方法

1. 首次配置

  1. 下载并运行程序 doubao-voice-input.exe
  2. 程序会在运行目录下生成 config.toml 文件。
  3. 这是一个独立的 EXE 程序,可以通过 Quicker 的“打开/运行”动作启动,或设为开机自启。

2. 日常使用

  • 按键说话模式 (推荐):按住 F2 键开始说话,屏幕出现红色图标,松开即输入。
  • 修改设置:右键点击任务栏“豆包”图标 -> 选择 “设置”。修改后需重启程序生效。

📌 修改说明

相比原版项目,我们进行了以下改进:

  • 新增按键说话模式:交互更符合自然习惯,松开即上屏。
  • 新增设置界面:Win32 原生对话框,方便快速配置快捷键。

最近更新

修订版本 更新时间 更新说明
0 13小时4分钟前

最近讨论

暂无讨论