工程狮与程序猿的记录板
搜索
最新主题
热门主题
热门下载
返回首页
会员注册
/
登入
本地deepseek入口
文章发表人是: 曲光昱
论坛首页
»
个人资料 曲光昱
»
文章发表人是 曲光昱
内容
[
+
]
2025物联网与嵌入式技术
»
2024第十四组 数字人
, 06/05/2024 15:57:32 »
加入讨论
课题报告
[
+
]
2025物联网与嵌入式技术
»
2024第十四组 数字人
, 12/04/2024 16:48:15 »
加入讨论
使用autodl玩linly talker,教程如下:
https://github.com/Kedreamix/Linly-Talker/blob/main/AutoDL%E9%83%A8%E7%BD%B2.md
[
+
]
2025物联网与嵌入式技术
»
2024第十四组 数字人
, 12/04/2024 16:46:31 »
加入讨论
使用lily talker生成视频
[
+
]
2025物联网与嵌入式技术
»
2024第十四组 数字人
, 05/04/2024 08:31:39 »
加入讨论
生成未校对台本
[
+
]
2025物联网与嵌入式技术
»
2024第十四组 数字人
, 05/04/2024 08:28:17 »
加入讨论
首先使用UR5对原样本去除bgm,只保留人声,然后对人声文件进行识别分割TTS,经过数据清理生成台本
处理prompts
写一个python脚本,首先进入目录C:/dev/Chat-Haruhi-Suzumiya/yuki_builder
然后遍历C:\dev\dataset\dorazmon\sound\HP2_rename\,其中都是类似P001.wav,P002.wav这样的文件
轮询这些文件,然后根据文件名顺序调用下列命令,注意其中003的字样要根据当前循环的文件名进行替换
python yuki_builder.py whisper -input_video C:\dev\dataset\dorazmon\sound\HP2_rename\P003.wav -srt_folder srt_folder/003
python yuki_builder.py srt2csv -input_srt srt_folder\003\P003.srt -srt_folder srt_folder\003
python yuki_builder.py recognize -input_video C:\dev\dataset\dorazmon\sound\HP2_rename\P003.wav -input_srt srt_folder\003\P003.srt -role_audios ./role_audio -output_folder ./story_output
帮我改写上述脚本,在本来要执行的地方注释掉,并加上打印出需要执行脚本的print函数
[
+
]
2025物联网与嵌入式技术
»
2024第十四组 数字人
, 05/04/2024 08:25:41 »
加入讨论
后端需要自建知识库,使用BBdown下载https://www.bilibili.com/video/BV13x411k79Q,从里面抽取台本,台本抽取方式如下
[
+
]
2025物联网与嵌入式技术
»
2024第十四组 数字人
, 03/04/2024 12:29:18 »
加入讨论
分工情况
论坛首页
»
个人资料 曲光昱
»
文章发表人是 曲光昱
前往:
选择一个版面
2025物联网与嵌入式技术
2025单片机原理课堂记录
2024程序设计思维与方法
2024计算机原理课堂记录
2024无人机-电类创新实践课程
书籍资料
吐槽版
行动版
Powered by
JForum 2.6.2
© 2019 JForum Team • Maintained by
Andowson Chang
and
Ulf Dittmer