一、获取API-KEY 最近看到阿里DashScope模型服务中有flux-schnell和flux-dev两个文生图模型,FLUX文生图模型在阿里DashScope模型服务灵积首次申请api后可以免费生成1000张图片。 第一步首先要访问DashScope管理控制台:模型服务灵积-总览 (aliy…
部署过程 上篇文章讲了阿里的CosyVoice模型的搭建,这篇文章就讲阿里的SenseVoice语音转文本模型的搭建。 1.安装CUDA和cuDNN CUDA下载地址:https://developer.nvidia.com/cuda-12-3-0-download-archive cuDNN下载地…
1.简介 CosyVoice是用于多语言、音色和情感控制的自然语音生成的阿里巴巴的一个创新模型,他在多语言语音生成、零样本语音生成、跨语言语音克隆和指令跟随功能方面表现出色。 github地址:https://github.com/FunAudioLLM/CosyVoice 2.部署 下载项目文件 …
1.简介: Deep-Live-Cam是github上的一个开源的实时换脸项目,仅需一张图片就可以实现实时换脸 github地址:https://github.com/hacksider/Deep-Live-Cam 2.效果 3.部署过程 Deep-Live-Cam项目语音为python,建议使用c…