模型更新

随便聊聊 · 97 次浏览
FDJKDF 创建于 2025-02-07 15:36

项目有更新哎,可以直接隐藏后台


转眼间一年就过去了,目前图形化界面包分支已基本完善,欢迎体验:https://github.com/H1DDENADM1N/CapsWriter-Offline/releases

 

## 相较于原版的年度累计变化总结:

 

### 1. 图形界面(GUI)

- 新增图形化界面:基于 `PySide6` 和 `Qt-Material` 实现了服务端和客户端的图形化界面,提升了用户体验。

- 透明窗口与极简设计:客户端界面透明,支持字体大小调整、窗口贴边自动隐藏、无任务栏图标等特性。

- 托盘图标与右键菜单:支持最小化到系统托盘,并提供丰富的右键菜单功能,如启动/停止服务、打开配置界面等。

 

### 2. 功能增强

- 离线与在线翻译:

 - 新增离线翻译功能,支持将中文翻译为英文,快捷键为 `Left Shift + CapsLock`。

 - 新增在线翻译功能,基于 `DeepLX` 支持多国语言翻译,默认翻译为日文,快捷键为 `Right Shift + CapsLock`。

- 云剪贴板:支持将文本上传至云剪贴板,生成链接和二维码,方便分享。

- Everything 搜索:支持使用 `Everything` 搜索光标选中的文字,快捷键为 `Ctrl + Alt + F`。

- 简繁体切换:支持双击 `CapsLock` 临时切换简繁体输出,可通过配置设置默认输出语言。

- 输入状态提示:新增输入状态提示功能,支持在光标位置或鼠标位置显示“语音输入中”提示,提升用户交互体验。

- 任务提示音:支持在任务开始和结束时播放提示音,提升操作反馈。

 

### 3. 配置灵活性

- 图形化配置界面:新增 `edit_config_gui.exe`,提供图形化配置界面,方便用户修改服务端和客户端的配置。

- 配置文件优化:使用 `config.toml` 文件进行配置,支持更多自定义选项,如快捷键、录音开关、翻译目标语言等。

- 热词与关键词功能:支持动态载入热词和关键词,提升识别准确性和个性化体验。

 

### 4. 模型与性能优化

- 多模型支持:新增 `SenseVoice` 模型,支持中、粤、英、日、韩多语种识别,同时保留 `Paraformer` 模型,用户可根据需求选择。

- 模型路径配置:支持自定义模型路径,方便用户管理和更新模型。

- 性能优化:优化了录音和转录的分段长度与重叠时间,提升了识别效率和准确性。

 

### 5. 系统兼容性与易用性

- 管理员权限支持:支持以管理员权限运行客户端,解决某些程序无法输入识别结果的问题。

- 自启动与隐藏窗口:支持开机自启动,并可配置启动后自动缩小至托盘,提升使用便捷性。

 

### 6. 其他改进

- 阿拉伯数字年份转换:支持将中文年份转换为阿拉伯数字,提升识别结果的规范性。

- 录音与音频处理优化:支持录音时静音或暂停其他音频播放,避免干扰,提升录音质量。

- 多开限制:支持禁止多开,避免资源冲突。


回复内容
暂无回复
回复主贴