模型更新

FDJKDF 创建于 2025-02-07 15:36

项目有更新哎，可以直接隐藏后台

转眼间一年就过去了，目前图形化界面包分支已基本完善，欢迎体验：https://github.com/H1DDENADM1N/CapsWriter-Offline/releases

## 相较于原版的年度累计变化总结：

### 1. 图形界面（GUI）

- 新增图形化界面：基于 `PySide6` 和 `Qt-Material` 实现了服务端和客户端的图形化界面，提升了用户体验。

- 透明窗口与极简设计：客户端界面透明，支持字体大小调整、窗口贴边自动隐藏、无任务栏图标等特性。

- 托盘图标与右键菜单：支持最小化到系统托盘，并提供丰富的右键菜单功能，如启动/停止服务、打开配置界面等。

### 2. 功能增强

- 离线与在线翻译：

- 新增离线翻译功能，支持将中文翻译为英文，快捷键为 `Left Shift + CapsLock`。

- 新增在线翻译功能，基于 `DeepLX` 支持多国语言翻译，默认翻译为日文，快捷键为 `Right Shift + CapsLock`。

- 云剪贴板：支持将文本上传至云剪贴板，生成链接和二维码，方便分享。

- Everything 搜索：支持使用 `Everything` 搜索光标选中的文字，快捷键为 `Ctrl + Alt + F`。

- 简繁体切换：支持双击 `CapsLock` 临时切换简繁体输出，可通过配置设置默认输出语言。

- 输入状态提示：新增输入状态提示功能，支持在光标位置或鼠标位置显示“语音输入中”提示，提升用户交互体验。

- 任务提示音：支持在任务开始和结束时播放提示音，提升操作反馈。

### 3. 配置灵活性

- 图形化配置界面：新增 `edit_config_gui.exe`，提供图形化配置界面，方便用户修改服务端和客户端的配置。

- 配置文件优化：使用 `config.toml` 文件进行配置，支持更多自定义选项，如快捷键、录音开关、翻译目标语言等。

- 热词与关键词功能：支持动态载入热词和关键词，提升识别准确性和个性化体验。

### 4. 模型与性能优化

- 多模型支持：新增 `SenseVoice` 模型，支持中、粤、英、日、韩多语种识别，同时保留 `Paraformer` 模型，用户可根据需求选择。

- 模型路径配置：支持自定义模型路径，方便用户管理和更新模型。

- 性能优化：优化了录音和转录的分段长度与重叠时间，提升了识别效率和准确性。

### 5. 系统兼容性与易用性

- 管理员权限支持：支持以管理员权限运行客户端，解决某些程序无法输入识别结果的问题。

- 自启动与隐藏窗口：支持开机自启动，并可配置启动后自动缩小至托盘，提升使用便捷性。

### 6. 其他改进

- 阿拉伯数字年份转换：支持将中文年份转换为阿拉伯数字，提升识别结果的规范性。

- 录音与音频处理优化：支持录音时静音或暂停其他音频播放，避免干扰，提升录音质量。

- 多开限制：支持禁止多开，避免资源冲突。

请绑定手机号后发表评论

M-cc 2025-03-17 08:52

这个不是原作者的版本，而是用户自行修改的版本。
官方最新版本仍然是2024.8月发布。

请绑定手机号后发表评论