MuseTalk是由腾讯推出的一个实时的高质量音频驱动唇形同步模型,能够根据输入的音频信号自动调整数字人物的面部图像,使其唇形与音频内容高度同步,支持多种语言,并实现每秒30帧以上的实时处理速度。这意味着观众可以看到数字人物的口型与声音完美匹配的效果。
TuneFlow 是一个新一代AI音乐制作平台,它配备了一整套强大的人工智能算法,集成了声音克隆、智能作曲、智能鼓手等AI工具,覆盖音乐制作的每个环节。通过云端同步,随时随地开启创作之旅,享受无缝的音乐制作体验。
MusePose是一个由腾讯Lyra Lab开发的姿态驱动的图像到视频生成框架,专注于虚拟人类的生成。它能够在给定的姿态序列下,生成参考图像中的人类角色的舞蹈视频。这个框架使用了先进的扩散模型和姿态对齐算法,以生成与输入姿态高度匹配的平滑、逼真的动画。
Supertone Shift是一款创新的实时语音变换器,由韩国Supertone公司开发。它允许用户即时切换到任选的声音,为虚拟主播(VTubers)、内容创作者、游戏玩家以及希望准确表达角色声音的用户提供了强大的支持。
美图MoKi是美图公司推出的一款AI短片创作工具。它能够在用户完成脚本、视觉风格、角色等前期设定后,自动生成分镜图并转换为视频素材。此外,MoKi还提供智能剪辑、AI配乐、AI音效和自动字幕等功能,帮助用户串联素材并制作成短片。
VidAU AI是一个强大的视频和音频生成平台,它能够帮助用户简单地通过产品链接或描述在几分钟内批量生成引人入胜的营销视频,并支持通过逼真的AI数字人以不同的语言和口音作为产品介绍。此外,VidAU AI还提供了丰富的视频编辑功能,如换脸、翻译、字幕翻译、水印或字幕去除、混合等。
NovaVSS是一款新一代的AI音视频音轨分离工具,它基于VSS领域最顶级的人工智能算法,并且经过大量电影电视数据训练和调优后的AI模型来实现。它专门用于从电影、电视等视频中精准提取人声、背景音乐和特效声。
讯飞有声是由科大讯飞股份有限公司开发的一款软件,旨在帮助用户以“听”的方式来获取信息。它是一款文字转语音朗读软件,现拥有近百位AI主播,提供听网页、听文档、听文字、听图片、听书、听小说等多种格式的朗读功能。
V-Express是由南京大学和腾讯AI实验室共同开发的一项技术,旨在通过参考图像、音频和一系列V-Kps图像来生成说话的头像视频。这项技术可以根据不同的信号,如声音、姿势、图像参考等来控制视频内容,确保即使是弱信号也能有效地影响最终生成的视频,使视频生成更加逼真和多样化。
AudioGen是一个提供AI音频生成服务的平台。其核心功能包括生成适用于专业工作室的高保真声音,提供无限变化的定制音频,且无需担心版权问题。
Dream Machine是一款由Luma AI推出的AI视频生成模型,能够直接从文本和图像快速生成高质量的逼真视频。可以在120秒内生成120帧视频,具备流畅的运动、电影摄影和戏剧效果。它理解人物、动物和物体与物理世界的互动,确保视频角色的一致性和物理准确性。
HeyMusic AI是一个AI生成音乐的网站,轻松地使用 AI 从您自己的歌词或简单提示中生成迷人的音乐。这个平台极大地简化了音乐创作的流程,无论您是音乐新手还是资深创作者,都能轻松地将音乐构想变为现实。
Character-1 是Hedra Labs推出的人物角色视频生成工具,它可以通过文本和图片生成唱歌视频。它是一个全新的创作平台,为用户提供了无限的视频创作机会。在Hedra的世界里,用户可以成为造物主,创作出丰富多彩的世界、角色和故事,拥有完全的创作控制权。
Diffutoon是一种先进的动漫风格渲染技术,它能够将真人视频转换成动漫风格。这个技术由阿里巴巴和华东师范大学的研究人员推出,基于扩散模型的可编辑卡通着色技术。Diffutoon具备内容一致性、高分辨率输出和智能编辑功能,适用于高分辨率和快速运动的视频。
Ecrett Music是一个由人工智能驱动的音乐创作软件,它可以帮助用户快速、简单、便宜地制作出适合自己的无版权音乐。每月能生成超过50万种独特的旋律模式,用户无需任何音乐专业知识就能使用。
VidIQ是一款专为YouTube创作者设计AI视频营销工具。它提供了一系列工具来帮助用户优化视频内容,为视频创作者、营销人员和品牌提高视频在YouTube上的搜索排名和曝光率。
AI Coevo是一个利用人工智能技术将视频转换成动漫风格的平台。它提供了一个简单的界面,用户可以上传自己的视频,然后选择不同的动漫风格进行转换。例如,可以将真人视频转换成像素风格或者平面动漫风格的视频。此外,AI Coevo还提供了其他功能,比如文生图和角色动态,让用户可以通过输入文本提示词快速生成绘画和艺术作品,或者上传一张人物图像和一个动作视频,让图像中的人物做出同样的动作。
Speechify是一款强大的AI文字转语音阅读工具,它使用先进的文本转语音技术帮助用户将文档、文章、书籍、PDF和电子邮件等内容转换成音频。这款应用程序适用于Chrome浏览器、iOS和Android系统,能够以高质量的AI人工智能语音朗读内容,让用户以比眼读快2-3倍的速度听取内容。
Voicemod是一个免费实时语音转换器和音效面板软件,它可以改变你的声音并播放各种音效。它具有超过100种以上的变声情境,可以直接连接到游戏和其他应用程序,如Zoom、Google Meet、Skype、Discord等。
Crayo AI 是一个专为创建病毒式短视频而设计的平台。它利用人工智能技术,自动生成视频字幕、特效、背景和音乐,使用户可以在几分钟内创建引人入胜的短视频。这个工具特别适用于 TikTok、Instagram 和 YouTube Shorts 等平台,帮助用户快速制作吸引人的视频内容。
ChatTTS是专为对话场景设计的文本转语音(Text-to-Speech, TTS)生成模型,它支持中英文,并能生成自然流畅的对话语音,特别适用于大型语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。
MimicMotion是腾讯推出的高质量人类动作视频生成框架,利用置信度感知的姿态引导技术,生成时间平滑、细节丰富的动态视频。该框架通过区域损失放大和渐进式潜在融合策略,实现了任意长度视频的高效生成,并对视频内容进行精确控制,包括动作、姿势和视频风格等,适用于多种应用场景。
Vocalist.ai是一个人工智能平台,它能够将人声录音转化为专业水准的歌唱和说唱表演。这个工具使用定制的人声模型,让用户可以从即使是随意录制的音频中创作出工作室级别的人声。它提供了一个免版税、符合倫理的AI声音平台,意味着创作者可以使用这些人工智能声音而不必支付版权费用,同时确保了平台遵循道德标准。
ProPainter 是一款先进的视频修复工具,利用 AI 技术去除视频中的特定对象和水印。通过循环流补全网络和 Transformer 技术,ProPainter 能够智能检测并移除视频中的移动物体,修复损坏区域,恢复视频的完整性。无论是去除水印还是修复视频,ProPainter 都能提供高质量的解决方案。
寻光是由阿里达摩院推出的一站式AI视频创作平台。它旨在通过人工智能技术提供全新的视频创作模式,重塑传统视频制作的全流程。寻光平台集成了剧本创作、分镜图设计、视频素材编辑等步骤,让创作者可以在同一个平台上流畅完成视频创作。
Enhance Speech是Adobe公司出品的一款免费AI音频处理工具,它利用AI技术来增强录音品质,使之听起来像是在专业播客录音室中录制的。这个工具特别适合需要改善录音音质的播客、视频制作者或任何需要清晰语音录音的用户。
白日梦AI是一款文本生成图像或图像生成视频的工具,它可以将文本生成图像、图像生成视频、配音字幕和后期剪辑等功能整合成一个完整的AI视频生产工作流,只需几分钟时间,你就可以将2000字以内的文案一键生成原创IP故事视频,视频长度可达6分钟。
SunoAIOnline是一个Suno AI的音乐生成器,它可以在线即时生成并下载个性化的MP3音乐。这个平台允许用户探索和创作独特的音乐作品,无需任何音乐制作经验。
Vimi是商汤科技推出的可控人物视频生成大模型,通过动作视频、动画、声音和文字等多种驱动元素,Vimi能够生成与目标动作一致的人物视频。它不仅能精准控制人物表情和肢体动作,还能生成合理的头发、服饰和背景,支持光影变化。Vimi突破了传统AI视频生成的限制,能够稳定生成分钟级的单镜头人物视频,画面效果自然流畅。无论是娱乐创作还是专业视频制作,Vimi都是您的理想选择。
海绵音乐是一个由字节跳动推出的免费AI音乐生成工具。海绵音乐提供灵感创作和自定义创作,支持一键生成歌词等功能,单次可生成1分钟时长的歌曲。