一张图片，15秒爆款视频：一条Skills干掉了整个视频团队

你有没有想过，别人花3000块请人拍的带货视频，你一张手机拍的产品图就能搞定？

今天这篇文章，我手把手教你用Claude Code的一个隐藏技能，把**任意一张产品图片**变成**15秒竖版营销短视频**——全程不需要写一行代码，不需要会剪辑，不需要懂AI。

这不是PPT，这是真实可用的视频。

先看效果

随手拍一张产品照，丢给Claude Code，它会自动完成这些事：

- 识别你的产品是什么、品牌是什么、卖点是什么

- 写一份15秒的专业带货脚本（有开场钩子、卖点展示、价值主张、行动号召）

- 调用OpenAI的Sora 2把脚本变成真实视频

- 自动把横版图片转成竖版9:16（模糊背景填充，不裁切产品）

- 输出一个可以直接发抖音/小红书的mp4文件

整个过程你只需要做一件事：给它一张图片路径。

这到底是什么？

这是一个叫 `/sora2video` 的Claude Code技能。它把4个AI服务串成了一条自动化流水线：

| 环节 | 谁在干活 | 干什么 |

|------|---------|--------|

| 图片处理 | Pillow | 智能裁切/填充，确保9:16竖版 |

| 图片托管 | ImgBB | 把本地图片变成临时公开链接 |

| 商品分析 | 豆包大模型 | 看图识别产品，写带货脚本 |

| 视频生成 | Sora 2 | 根据脚本生成15秒视频 |

你不需要分别注册这4个服务。配好一次，终身可用。

从零开始：完整搭建指南

第一步：安装Claude Code

如果你还没装Claude Code，先搞定它。

打开终端（Windows用PowerShell，Mac用Terminal），输入：

macOS, Linux, WSL:

curl -fsSL claude.ai | bash

Windows PowerShell:

irm claude.ai | iex

装完后输入 `claude` 回车，按提示登录你的Anthropic账号。

> 前提：你的电脑需要有Node.js 18+。没有的话去 nodejs.org 下载安装。

第二步：安装Python依赖

这个技能的底层脚本是Python写的，需要装几个包：

```bash

pip install requests pillow aiohttp python-dotenv

```

> 前提：你的电脑需要有Python 3.8+。没有的话去 python.org 下载安装。

第三步：创建技能目录

```bash

mkdir -p ~/.claude/skills/sora2video-k

```

第四步：配置API密钥

这是最关键的一步。你需要获取3个API Key：

1) Sora 2 视频生成 API（通过kie.ai）

这是视频生成的核心。去 kie.ai 注册账号，获取API Key。

2) ImgBB 图片托管 API

去 api.imgbb.com 注册，获取免费API Key。这个用来把你本地图片变成临时公开链接（2小时后自动失效，不用担心隐私）。

3) 豆包大模型 API（火山引擎）

去火山引擎的方舟平台开通豆包模型，获取API Key。这个用来「看懂」你的产品图片并写出带货脚本。

拿到3个Key后，在技能目录下创建 `config.json`：

```json

{

"sora2_api": {

"base_url": api.kie.ai,

"api_key": "你的kie.ai API Key",

"model": "sora-2-pro-image-to-video"

"imgbb_api": {

"base_url": api.imgbb.com,

"api_key": "你的ImgBB API Key",

"expiration": 600

"doubao_api": {

"base_url": ark.cn-beijing.volces.com,

"api_key": "你的豆包 API Key",

"model": "doubao-seed-1-6-251015"

"video_settings": {

"default_duration": 15,

"default_aspect_ratio": "9:16",

"default_language": "中文",

"max_wait_time": 900,

"poll_interval": 30,

"max_image_width": 1024

}

```

第五步：获取技能文件

你需要把完整的技能代码放到 `~/.claude/skills/sora2video-k/` 目录下。包含以下文件结构：

```

sora2video-k/

├── SKILL.md # 技能说明（Claude读这个来理解怎么干活）

├── config.json # 你的API配置

├── requirements.txt # Python依赖声明

├── scripts/

│ ├── video_generator.py # 主程序：串联整个流程

│ ├── api_client.py # API调用层：和4个服务通信

│ └── image_processor.py # 图片处理：尺寸调整、竖版转换

└── references/

├── director-prompt.md # AI导演的提示词模板

└── video-styles.md # 5种视频风格参考

```

第六步：开始生成视频

一切就绪。打开Claude Code，输入：

```

/sora2video ./my-product.jpg

```

然后等着。Claude会实时汇报进度：

```

正在读取图片 ./my-product.jpg ...

✓ 图片格式验证通过 (1920x1080)

✓ 检测到横版图片，正在转换为9:16竖版...

✓ 图片已上传至ImgBB

正在分析商品并生成视频脚本...

✓ 识别到商品: XX品牌蓝牙耳机

✓ 核心卖点: 主动降噪、30小时续航、轻量设计

正在调用 Sora 2 生成视频...

✓ 任务已创建，等待生成...

[=====> ] 30% - processing

✓ 视频生成完成！

📹 视频链接: xxxxx

```

从输入到拿到视频，通常2-5分钟。

它写的脚本长什么样？

这是它给一款蓝牙耳机自动生成的脚本（中文版）：

```

[0-2s] 画面：一只耳机从暗处缓缓浮出，柔和的光线勾勒出外壳轮廓

旁白："在嘈杂的世界里，你需要一个安静的角落"

[2-7s] 画面：镜头推进至耳机特写，展示品牌Logo和材质细节

旁白："XX主动降噪，40dB深度静音"

[7-12s] 画面：年轻人戴着耳机在咖啡馆专注工作，周围喧嚣渐弱

旁白："30小时超长续航，一次充电用一周"

[12-15s] 画面：产品居中展示，背景微光流转

旁白："现在体验，开启你的沉浸时刻"

```

注意最后一句不是「立即购买」「限时优惠」这种硬广。这个技能内置了品牌安全机制——它会自动避开生硬的促销用语，用中性的引导话术代替。这样生成的视频不会被平台限流。

有几个坑，提前告诉你

1. 图片格式

只支持 JPG、PNG、WEBP。不要传 HEIC（iPhone默认格式）或 GIF。

2. 横版图片不要怕

很多人拍产品照是横版的。这个技能会自动把横版图转成竖版——不是粗暴裁切，而是在产品周围加上模糊背景填充，确保产品完整展示。

3. 生成时间

Sora 2生成视频需要时间。如果超过5分钟没出结果也不用急，系统会每30秒自动查一次状态，最长等15分钟。如果真的超时了，它会给你一个任务ID，你可以后续手动查。

4. 英文脚本

默认是中文脚本。如果你做外贸，加个参数就行：

```

/sora2video ./product.jpg --lang=en

```

英文版只输出画面描述，不带旁白文案——因为Sora 2本身是英文驱动的，直接用英文效果最好。

5种视频风格，覆盖所有品类

这个技能内置了5种视频风格模板：

| 风格 | 适合品类 | 特点 |

|------|---------|------|

| 经典带货 | 美妆、食品、日用品 | 产品特写+使用场景+效果展示 |

| 故事叙述 | 服装、饰品、礼品 | 情景剧式，有故事线和情感 |

| 快节奏 | 数码、运动、潮流 | 多角度快切，视觉冲击强 |

| 简约高级 | 奢侈品、设计师品牌 | 大量留白，强调品质和工艺 |

| 自然清新 | 有机食品、天然护肤 | 户外场景，清新健康氛围 |

AI会根据你的产品自动选择最匹配的风格。你不需要手动指定。

背后的技术架构（给好奇的人）

整个流水线分6步：

```

产品图片 → 图片预处理（竖版转换）→ 上传ImgBB → 豆包AI分析写脚本 → Sora 2生成视频 → 返回视频链接

```

每一步都有独立的Python模块负责：

- `image_processor.py` 负责图片验证、尺寸调整、9:16转换（用PIL的高斯模糊做背景填充）

- `api_client.py` 封装了4个API的调用逻辑（ImgBB、豆包、Sora 2、飞书）

- `video_generator.py` 是总调度，串联整个流程并处理异常

有一个巧妙的设计：kie.ai的任务状态接口有时候不稳定，代码里做了双重检查——既轮询官方接口，又直接探测视频文件的CDN地址。两条路只要有一条通就能拿到视频。

这东西能用在哪？

几个真实场景：

- 独立站卖家：产品图一拍，视频自动出。不用请摄影师，不用请剪辑师

- 小红书/抖音带货：批量生成产品视频，日更无压力

- 跨境电商：切换英文模式，直接做TikTok素材

- 品牌方测试：快速出视频Demo给客户看概念，通过了再投入正式制作

最后

这个技能本质上做了一件事：把4个AI服务串成流水线，让你用一句命令完成原来需要一个团队干的事。

它不完美——15秒的AI视频还做不到专业TVC的水准。但对于电商场景，它已经够用了。尤其是当你需要批量产出内容的时候，效率差距是数量级的。

如果你已经在用Claude Code，现在就试试。一张图片，一行命令，15秒视频。

---

本文介绍的是Claude Code的 `/sora2video` 技能。技能源码基于MIT协议开源。文中涉及的第三方API需自行注册获取密钥。