👁️ 197
👍 119
📅 2026-06-13 收录
🔄 2026-06-13 更新

正文内容

MiniMax 媒体生成

使用本技能,可通过单一命令界面生成 MiniMax 音频、图像和视频。

前置要求

  • Python 3
  • requests
  • MINIMAX_API_KEY 环境变量

如需了解系统特定的 API 密钥配置方法,请参阅 references/setup.md

统一命令

运行 scripts/minimax.py,并指定一种模式:audioimagevideo

python scripts/minimax.py {audio|image|video} [选项]

音频生成

从文本生成 MP3 文件:

python scripts/minimax.py audio \
  --text "你好,今天我们聊一下 MiniMax。" \
  --output /tmp/minimax-audio.mp3

常用选项:

  • --model speech-2.8-turbo:适用于更低延迟场景
  • --model speech-2.8-hd:适用于更高保真度场景
  • --voice-id:在支持时指定语音 ID

图像生成

将生成的图像保存至指定目录:

python scripts/minimax.py image \
  --prompt "一只穿西装的橘猫,电影感,柔光" \
  --output /tmp/minimax-images \
  --aspect-ratio 1:1

常用选项:

  • --model image-01
  • --model image-01-live:在支持时提供更强的风格控制能力
  • --n 2:请求生成多张图像
  • --image-file:在支持时用于图生图(image-to-image)工作流

输出文件命名为 output-0.jpegoutput-1.jpeg 等。

视频生成

生成一个视频文件:

python scripts/minimax.py video \
  --prompt "镜头缓慢推进,一只橘猫走过雨夜街道,霓虹灯反光" \
  --output /tmp/minimax-video.mp4

常用选项:

  • --model MiniMax-Hailuo-2.3
  • --first-frame-image:用于图生视频(image-to-video)
  • --last-frame-image:用于首尾帧视频(start/end-frame video)
  • --subject-reference '':用于主体参考(subject reference)工作流
  • --timeout 1800:设置轮询超时时间(单位:秒)

独立脚本

统一命令会委托给本技能中对应的独立脚本:

  • scripts/generate_audio.py
  • scripts/generate_image.py
  • scripts/generate_video.py

仅当需要更聚焦、模式专属的命令时,才建议直接调用这些脚本。

安全共享注意事项

  • 不得在技能包中包含真实 API 密钥。
  • 应提示用户在本地自行配置 MINIMAX_API_KEY 环境变量。
  • 所有生成的媒体文件应保存在技能目录之外,例如 /tmp 目录或项目专属的输出目录中。