本项目是基于Pytorch的声音分类项目,旨在实现对各种环境声音、动物叫声和语种的识别。项目提供了多种声音分类模型,如EcapaTdnn、PANNS、ResNetSE、CAMPPlus和ERes2Net,以支持不同的应用场景。此外,项目还提供了常用的Urbansound8K数据集测试报告和一些方言数据集的 ...
该要求仅针对标准模式,轻量模式使用在线模型,不需要安装torch等库,也不需要显卡即可运行。 开发者在以下环境下进行代码调试,在该环境下能够避免最多环境问题。 本框架使用 fschat驱动,统一使用 huggingface进行推理,其他推理方式(如 llama-cpp,TensorRT加速 ...