realTimeVTT/README.md

本项目目标是实现实时语音识别功能，支持中英文。
实现思路如下：
1. 语音输入：使用麦克风采集音频数据。
2. 语音预处理：对音频数据进行预处理，如降噪、增益控制等。
3. 语音识别：使用语音识别模型将预处理后的音频数据转换为文本。

# 基础环境
+ 操作系统：linux
+ 语言：python 3.12
+ 虚拟环境及包管理工具：uv
+ 语音识别框架：新一代kaldi
+ 语音识别模型：zipformer
+ 部署框架：sherpa-onnx

# 目录层级说明
```text
.
├── .venv
│   ├── bin
│   ├── lib
│   └── pyvenv.cfg
├── .python-version
├── docs
├── src
│   └── main.py
├── config
├── tests
├── static
├── README.md
├── hello.py
├── pyproject.toml
└── uv.lock
```
+ docs 存放项目文档
+ src 存放项目源码
+ config 存放项目配置文件
+ tests 存放单元测试代码
+ static 目录下存放静态文件，如图片、css、js等
+ README.md 项目说明文件
+ pyproject.toml 项目配置文件
+ uv.lock 虚拟环境依赖文件

除main.py外，其他文件均需要放置在src子目录下，要求子目录名称清晰易读不能过长。

# 包管理命令说明
1. 添加包  uv add <package>
2. 移除包  uv remove <package>
3. 所有包管理命令均需要在项目根目录下执行，并且强制使用uv命令，不能使用pip命令。

# 脚本运行命令说明
1. 运行项目  uv run main.py
2. 运行单元测试  uv run -m pytest tests

*禁止修改本文件*