MuseTalk一键整合包
1 环境安装
下面是官方安装:
video-retalking一键整合包下载
video-retalking一键整合包
1 环境安装
下面是官方安装:
facechain- stable diffusion讨论 方案实现
AI stable diffusion和 facechain
20230916讨论.md
project_facechain/1.讨论 at main · hit-perfect/project_facechain (github.com)
1 目前计划实现的内容
导入拍摄好的图片,通过AI处理提取人脸、身形等关键信息
Faster_Whisper部署教快速入门教程
1 Faster_Whisper优点
Faster_Whisper是基于OpenAI的Whisper模型的高效实现。主要包括以下特点:
- 更高效:其利用CTranslate2,一个专为Transformer模型设计的快速推理引擎。这种实现既提高了语音识别的速度,同时还优化了内存使用效率。
- 稳定性:Faster-Whisper的核心优势在于其能够在保持原有模型准确度的同时,大幅提升处理速度。
- 可用性:减少模型的层数、参数量和模型结构,这样就减少了计算量和内存消耗,并改进了推理算法和计算过程,减少了冗余计算,进一步提高了模型的运行速度。
适用场景主要包括:语音识别、语音转写、大规模语音数据处理等。在处理大规模的语音数据时,因为其高效的计算能力和优秀的内存优化,使得Faster_Whisper得到了广泛应用
Lora/DB模型云端训练(适配Kaggle云平台) - Training GUI 秋叶版
Lora/DB模型云端训练(适配Kaggle云平台) - Training GUI 秋叶版
创建时间:2023年11月11日 上次更新:2024年1月5日 】
1 本项目旨在降低模型训练的门槛,帮助更多人不花钱就能炼出自己的模型
2 使用教程见专栏:https://www.bilibili.com/read/cv28372468/?jump_opus=1
2.1 Lora训练GUI使用了秋叶发布的保姆式LoRA模型一键包文件,对新人友好
2.2 Kaggle为世界最大的数据平台,提供了免费显卡资源。
2.3 经测试,此项目可在Android手机上Edge浏览器运行,但上传训练集步骤可能存在困难,建议PC端运行。
2.4 新版训练GUI现在支持训练DB大模型了,经过测试可训练
3 作者 BY bilibili NYAN9。此源码为免费公开,分享。若发现有人倒卖,请立即向作者举报