Python 转换繁简字体
zhconv 库 (Python)
安装
pip install zhconv
使用示例
本次示例是使用
whisper
模型对mp3中的音频进行转化,转换之后的文本是繁体,需要经过zhconv
转换。
import whisper
import zhconv # 导入zhconv库
# 加载模型
model = whisper.load_model("base")
mp3_file_name = "output_audio"
# 转写音频
result = model.transcribe(rf"D:\p\v-test-lx\planc\test_v\{mp3_file_name}.mp3")
# 获得转写的繁体文本
traditional_text = result["text"]
# 将繁体文本转换为简体文本
simplified_text = zhconv.convert(traditional_text, 'zh-cn')
# 打印转换后的简体文本
print(simplified_text)
# 输出结果写到文件,文件名和MP3文件名一致,只是后缀名不同
with open(rf"D:\p\v-test-lx\planc\test_v\{mp3_file_name}.txt", "w", encoding="utf-8") as f:
f.write(simplified_text)
f.close()
print("转写完成!")
使用zhconv.convert
函数将繁体中文转换为简体中文。这样,你就可以得到简体字版本的转写结果
写在最后
zh-cn 大陆简体
zh-tw 台灣正體
zh-hk 香港繁體
zh-sg 马新简体
zh-hans 简体
zh-hant 繁體
相关链接
License:
CC BY 4.0