MoneyPrinterPlus:AI自动短视频生成工具-腾讯云配置详解

MoneyPrinterPlus:AI自动短视频生成工具-腾讯云配置详解

article2024/7/1 5:55:02/文章来源:https://blog.csdn.net/superfjj/article/details/139949029

MoneyPrinterPlus可以使用大模型自动生成短视频，其中的语音合成和语音识别部分需要借助于一些第三发云厂商的语音服务。

很多小伙伴可能不知道应该如何配置，这里给大家提供一个详细的腾讯云语音服务的配置教程。

项目已开源，代码地址：https://github.com/ddean2009/MoneyPrinterPlus

腾讯云的具体配置

MoneyPrinterPlus在生成视频过程中需要进行一些语音合成和语音识别工作。

为了保证最后生成视频的质量，所以我们会用到一些云厂商提供的语音合成和语音识别服务。

这里腾讯云为例，来讲解如何进行腾讯云语音的配置。

获取腾讯云的access ID和Secret Key

首先我们到腾讯云的官网上去注册一个账号，在最上面的搜索框，我们输入访问密钥，在下面的控制台入口，点击访问密钥，即可进入腾讯云的访问密钥控制台。

在API密钥管理部分，点击右边的新建密钥，即可生成APPID,SecretID和SecretKey这三个值。

大家把这三个数据保存下来。我们后面在MoneyPrinterPlus中会用到这三个值。

开通智能语音服务

同样的，我们在最上面的搜索框中输入语音合成，点击下方的控制台入口–》语音合成按钮，进入到语音合成界面。

进入语音合成界面之后，我们找到左边的语音合成资源包，点击领取免费资源包，这样可以领取免费的语音合成资源。

如果你的资源包用完了，没关系，我们点击左下角的语音合成设置，开通后付费服务即可。

同样的，对于语音识别功能，我们同样可以领取免费的语音识别资源包。

如果资源包不够用的话，可以在语音识别设置中开通后付费服务。

这样，我们在腾讯云的语音合成和语音识别服务就开通好了。

在MoneyPrinterPlus中配置

启动我们的项目，在web页面点击最左边的基础配置，找到右边的配置音频库信息，选择Tencent。

填入我们之前保存的Access Key ID ,Access Key Secret和App Key。

回车后，这样我们的配置就保存了。

其他的配置

资源库

资源库指的是我们从哪里获取视频或者图片信息，这里目前提供了两个资源提供方，分别是pexels和pixabay。

大家任意选择一个即可。

以pexels为例，我们登入pexels官网 https://www.pexels.com/zh-cn/ ，注册一个账号。

在图片和视频API里面，可以查看自己的api密钥。

查看自己的API密钥：

把这个API密钥记下来，拷贝到MoneyPrinterPlus的配置即可。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

大模型配置

目前支持Moonshot,openAI,Azure openAI,Baidu Qianfan, Baichuan,Tongyi Qwen, DeepSeek这些。

国内要用的话推荐Moonshot（最近发现moonshot不太稳定，大家可以考虑Baichuan或者DeepSeek）。

同样的到Moonshot开发者平台上注册一个key：https://platform.moonshot.cn/ 填入对应的配置即可。

AI短视频生成

有了基础配置之后，就可以点击左边的AI视频进入AI视频生成页面。

LLM视频文案生成

在视频主题区输入你需要生成的视频主题，然后点击生成视频文案。

程序会自动使用大模型生成对应的视频文案和视频文案关键字：

如果你对视频文案或者关键字不满意，可以手动进行修改。

视频配音区

在视频配音区可以选择配音语言和对应的配音语言，目前支持100+配音语言。

还可以选择不同的配音语速，以支持不同使用场景。

如果你对配音不太确定，可以点击试听声音试听对应的配音语音。

背景音乐

背景音乐放在项目下的bgmusic目录下面，你可以自行添加背景音乐文件到该文件夹下面。

可以选择是否开启背景音乐，和默认的背景音乐音量。

视频配置区

视频配置区可以选择视频布局：竖屏，横屏或者方形。

可以选择视频帧率，视频的尺寸。

还可以选择每个视频片段的最小长度和最大长度。

最最重要的，还可以开启视频转场特效。目前支持30+视频转场特效。

字幕配置

如果你需要字幕，那么可以点击开启字幕选项，可以设置字幕字体，字幕字体的大小和字幕颜色等。

如果你不知道怎么设置，选择默认即可。

最后的视频生成

最后点击生成视频按钮即可生成视频。

页面会有相应的进度提醒。

最后生成的视频会展示在页面最下面，大家可以自行播放。

点我查看更多精彩内容:www.flydean.com

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/753934.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

基于多模态知识图谱的多模态推理-MR-MKG

基于多模态知识图谱的多模态推理-MR-MKG

MR-MKG论文中提出了一种新的多模态推理方法，即利用多模态知识图（Multimodal Knowledge Graph, MMKG）进行多模态推理的方法。这种方法旨在通过从MMKG中学习，扩展大型语言模型（LLMs）的多模态知识。 1 三个模…

阅读更多...

嘉立创学习

嘉立创学习

1.两个设置，一般用左边那个 2.焊盘分类基本焊盘热风盘：也叫花焊盘（负片） 隔离焊盘：外面那圈黑色，用作隔离（负片） 钢网层：（锡膏） 阻焊层&…

阅读更多...

AI大模型日报#0628：谷歌开源9B 27B版Gemma2、AI首次实时生成视频、讯飞星火4.0发布

AI大模型日报#0628：谷歌开源9B 27B版Gemma2、AI首次实时生成视频、讯飞星火4.0发布

导读：AI大模型日报，爬虫LLM自动生成，一文览尽每日AI大模型要点资讯！目前采用“文心一言”（ERNIE-4.0-8K-latest）生成了今日要点以及每条资讯的摘要。欢迎阅读！《AI大模型日报》今日要点&#xf…

阅读更多...

http服务网络请求如何确保数据安全(含python示例源码)

http服务网络请求如何确保数据安全(含python示例源码)

深度学习类文章回顾【YOLO深度学习系列】图像分类、物体检测、实例分割、物体追踪、姿态估计、定向边框检测演示系统【含源码】【深度学习】物体检测/实例分割/物体追踪/姿态估计/定向边框/图像分类检测演示系统【含源码】【深度学习】YOLOV8数据标注及模型训练方法整体流程…

阅读更多...

Charles抓包工具系列文章（三）-- 接口映射工具（Map Remote和Map Local）

Charles抓包工具系列文章（三）-- 接口映射工具（Map Remote和Map Local）

一、背景前文的http请求都是静态的，像compose a new request，仅适用于接口的自测。回放repeat 一个 http 请求，也无法做到动态调试。这里的动态还是静态，是站在客户端的角度，数据是实时的，可调试的。 …

阅读更多...

市场拓展招聘：完整指南

市场拓展招聘：完整指南

扩大招聘业务会给你带来很多挑战，更不用说你已经在处理的问题了。助教专业人士每周花近13个小时为一个角色寻找候选人。此外，客户的需求也在不断变化，招聘机构之间的竞争也在加剧。毫无疑问，对增长有战略的方法会有很大的帮助。一…

阅读更多...

《Redis设计与实现》阅读总结-4

《Redis设计与实现》阅读总结-4

第 17 章集群 Redis集群是Redis提供的分布式数据库方案，集群通过分片（sharding）来进行数据共享，并提供复制和故障转移的功能一、命令 CLUSTER MEET命令：用来连接不同的开启集群支持的 Redis 节点，以进入…

阅读更多...

dataX同步SQLserver到MySQL数据

dataX同步SQLserver到MySQL数据

引用datax官方描述： DataX 是阿里云 DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS…

阅读更多...

易用且免费的在线3D交互编辑器？

易用且免费的在线3D交互编辑器？

目前市面上的在线3D交互编辑器，有收费、免费、永久免费的。 1、博维数孪：永久免费的在线3D数字孪生应用平台，用户可以轻松创作和分享多种应用类型，包括3D交互展示、3D产品目录、交互式动画、3D产品配置器、交互式演示文稿、在线商…

阅读更多...

webstorm无法识别tsconfig.json引用项目配置文件中的路径别名

webstorm无法识别tsconfig.json引用项目配置文件中的路径别名

问题 vite项目模板中，应用的ts配置内容写在tsconfig.app.json文件中，并在tsconfig.json通过项目引用的方式导入 {"files": [],"references": [{"path": "./tsconfig.app.json"},{"path": "./t…

阅读更多...

Dominate_一个用于生成和操作 HTML 文档的 Python 库

目录 01初识 Dominate 什么是 Dominate？ 为什么选择 Dominate？ 安装与配置 02Dominate 的基本使用创建简单的 HTML 文档添加表格嵌套结构 03Dominate 的高级功能动态内容生成使用…

阅读更多...

【自动化测试】Selenium自动化测试框架 | 相关介绍 | Selenium + Java环境搭建 | 常用API的使用

【自动化测试】Selenium自动化测试框架 | 相关介绍 | Selenium + Java环境搭建 | 常用API的使用

文章目录自动化测试一、selenium1.相关介绍1.Selenium IDE2.Webdriverwebdriver的工作原理： 3.selenium Grid 2.Selenium Java环境搭建3.常用API的使用1.定位元素2.操作测试对象3.添加等待4.打印信息5.浏览器的操作6.键盘事件7.鼠标事件8.定位一组元素9.多层框架定…

阅读更多...

CO-DETR利用coco数据集训练和推理过程

CO-DETR利用coco数据集训练和推理过程

CO-DETR利用coco数据集训练和推理过程，参考链接 Co-DETR训练自己的数据集文章目录前言训练过程推理过程总结前言环境：PyTorch 1.11.0 Python 3.8(ubuntu20.04) Cuda 11.3 先是在github上下载CO-DETR模型 !git clone https://github.com/Sense-X/Co…

阅读更多...

新手教程系列 -- SQLAlchemy对同一张表联表两次

新手教程系列 -- SQLAlchemy对同一张表联表两次

在开发过程中，我们经常会遇到对同一张表进行多次联表查询的需求。比如在查询航线时，我们希望将起飞和降落的机场名称代入结果中。为了实现这一目标，机场名称统一存放在 AirPort 表中。下面，我们将介绍如何通过 SQLAlchemy 实现这一需求。问题描述一般情况我们第一时间会…

阅读更多...

针对VMWare无法使用鼠标功能键问题

针对VMWare无法使用鼠标功能键问题

在使用 VMWare 虚拟机的Ubuntu系统时发现无法使用许多鼠标带有额外的功能键，比如常用的前进后退，但是双系统中的Ubuntu没有问题，后来一搜发现是，虚拟系统中不支持这些功能键。因此我们对这个问题进行了解决。解决方案 1.找到自…

阅读更多...

Jenkins容器的部署

Jenkins容器的部署

本文主要是记录如何在Centos7上安装docker，以及在docker里面配置tomcat、mysql、jenkins等环境。一、安装docker 1.1 准备工作 centos7、VMware17Pro 1.2 通过yum在线安装dokcer yum -y install docker1.3 启动docker服务 systemctl start docker.service1.4 查看docke…

阅读更多...

【AUTOSAR 基础软件】DEM模块详解（诊断故障管理）

【AUTOSAR 基础软件】DEM模块详解（诊断故障管理）

文章包含了AUTOSAR基础软件（BSW）中DEM模块相关的内容详解。本文从ISO标准，AUTOSAR规范解析，ISOLAR-AB配置以及模块相关代码分析四个维度来帮读者清晰的认识和了解DEM这一基础软件模块。文中涉及的ISOLAR-AB配置以及模块相关代码都…

阅读更多...

hive零基础入门

hive零基础入门

1、hive简介 hive：由facebook开源用于解决海量结构化数据的统计工具。 hive是基于Hadoop的数据仓库工具，可以将结构化的数据文件映射为一张表，并提供sql查询功能。 2、hive本质 hive的本质是HQL（HiveSQL）转化成MapR…

阅读更多...

【人工智能】—XGBoost、CatBoost、LightGBM算法构建信用卡欺骗识别模型

【人工智能】—XGBoost、CatBoost、LightGBM算法构建信用卡欺骗识别模型

引言在金融领域，信用卡欺诈行为一直是银行和金融机构面临的一大挑战。随着电子商务的快速发展，信用卡欺诈事件的数量和复杂性都在不断增加。据统计，全球每年因信用卡欺诈造成的损失高达数十亿美元。因此，开发有效的欺诈检测系统…

阅读更多...

检索增强生成 (RAG)：揭开这一术语的神秘面纱并解释其带来的价值

检索增强生成 (RAG)：揭开这一术语的神秘面纱并解释其带来的价值

一、介绍如今，数据已成为新的黄金，而高效筛选这些丰富信息的能力则是成功企业脱颖而出的关键。Retrieval Augmented Generation（RAG）是创新的标杆，尤其是在知识管理领域。它不再只是为了存储信息，而是为了…

阅读更多...

最新文章