AI 模型文档

了解平台上使用的 AI 模型及其开发商

合作模型开发商

🖼️

图像生成模型

从文字描述生成高质量图片,支持多种风格和分辨率。

模型开发商说明等级
Seedream 4.5ByteDance最新旗舰 · 原生中英双语 · 4K 超清标准
Seedream 4ByteDance高质量图像生成 · 中英双语快速
Dreamina 3.1ByteDance高保真美学风格 · 艺术感强高端
Qwen ImageAlibaba20B 参数 · 中文文字渲染优秀标准
Wan 2.6 ImageAlibabaWan 系列图片版 · 高分辨率快速
✏️

图像编辑模型

上传现有图片进行编辑、增强或风格转换。

模型开发商说明等级
FLUX Kontext ProBlack Forest Labs上下文感知编辑 · 修图/修文字首选高端
FLUX Kontext Pro MultiBlack Forest Labs多图上下文编辑 · 风格一致性高端
UNOByteDance通用图像编辑 · 图文混合标准
Real-ESRGANXintao Wang et al.图像超分辨率增强 · 画质提升快速
🎬

视频生成模型(文字转视频)

通过文字描述自动生成短视频,部分模型支持同步生成音频。

模型开发商说明等级
Wan 2.2 — 480p Ultra FastAlibaba极速生成 · 约 5 秒出片快速
Wan 2.2 — 720pAlibaba高清分辨率标准
Wan 2.6音频Alibaba最新 Wan 系列 · 支持音频生成 · 最佳画质标准
Seedance 1.5 Pro音频ByteDance电影级画质 · 支持音频生成高端
Kling Video O3Kuaishou最佳运动质量 · 动态效果一流高端
🎞️

视频生成模型(图片转视频)

将静态图片转化为动态视频,赋予图片生命力。

模型开发商说明等级
Wan 2.2 i2v — 480p FastAlibaba图片转视频 · 快速生成快速
Wan 2.2 i2v — 720pAlibaba图片转视频 · 高清标准
Seedance 1.5 Pro i2v音频ByteDance图片转视频 · 电影级 · 支持音频高端
📝

文字生成模型

多家领先 AI 大语言模型,用于社交内容创作、改写和优化。

模型开发商说明等级
GPT-4oOpenAI旗舰级 · 综合能力最强高端
GPT-4o MiniOpenAI轻量快速 · 性价比高快速
GPT-5OpenAI最新旗舰模型高端
Claude Sonnet 4Anthropic出色的写作质量高端
Claude 3.5 HaikuAnthropic快速 · 高性价比快速
Gemini 2.5 FlashGoogle极速 · 低成本快速
Gemini 2.5 ProGoogle高性能推理高端
Grok 3xAI实时感知 · 紧跟热点高端
Grok 3 MinixAI轻量快速快速
Mistral SmallMistral高效欧洲模型快速
Mistral MediumMistral均衡性能标准
🎙️

语音合成模型

将文字转换为自然语音,支持多种音色和语速调节。

模型开发商说明等级
TTS-1OpenAI高品质文字转语音 · 6 种音色标准
可选音色: Alloy · Echo · Fable · Onyx · Nova · Shimmer
🎵

背景音乐生成模型

根据视频内容和文字描述自动生成同步的背景音乐,无需额外素材。

模型开发商说明等级
MMAudio V2Cheng et al.视频转音频 · 多模态同步 · 高质量背景音乐生成标准
🗣️

视频旁白模型

AI 自动分析视频内容并生成配音旁白。该功能由两个模型协作完成:先用 Gemini 2.5 Flash 分析视频画面,再用 TTS-1 将生成的脚本转换为语音。

模型开发商说明等级
Gemini 2.5 Flash分析Google视频内容分析 · 自动生成旁白脚本快速
TTS-1合成OpenAI旁白语音合成 · 6 种音色标准
旁白风格: 专业 · 轻松 · 戏剧化 · 纪录片 · 活力

模型等级说明

快速

生成速度最快,费用最低,适合快速迭代和日常使用。

标准

速度与质量的最佳平衡,推荐大多数场景使用。

高端

最高质量输出,适合专业创作和重要内容发布。

立即试用媒体工作室 →