一张图片,15秒爆款视频:一条Skills干掉了整个视频团队

一张图片,15秒爆款视频:一条Skills干掉了整个视频团队

8分钟 ·
播放数10
·
评论数0

你有没有想过,别人花3000块请人拍的带货视频,你一张手机拍的产品图就能搞定?

今天这篇文章,我手把手教你用Claude Code的一个隐藏技能,把**任意一张产品图片**变成**15秒竖版营销短视频**——全程不需要写一行代码,不需要会剪辑,不需要懂AI。

这不是PPT,这是真实可用的视频。

先看效果

随手拍一张产品照,丢给Claude Code,它会自动完成这些事:

- 识别你的产品是什么、品牌是什么、卖点是什么

- 写一份15秒的专业带货脚本(有开场钩子、卖点展示、价值主张、行动号召)

- 调用OpenAI的Sora 2把脚本变成真实视频

- 自动把横版图片转成竖版9:16(模糊背景填充,不裁切产品)

- 输出一个可以直接发抖音/小红书的mp4文件

整个过程你只需要做一件事:给它一张图片路径。

这到底是什么?

这是一个叫 `/sora2video` 的Claude Code技能。它把4个AI服务串成了一条自动化流水线:

| 环节 | 谁在干活 | 干什么 |

|------|---------|--------|

| 图片处理 | Pillow | 智能裁切/填充,确保9:16竖版 |

| 图片托管 | ImgBB | 把本地图片变成临时公开链接 |

| 商品分析 | 豆包大模型 | 看图识别产品,写带货脚本 |

| 视频生成 | Sora 2 | 根据脚本生成15秒视频 |

你不需要分别注册这4个服务。配好一次,终身可用。

从零开始:完整搭建指南

第一步:安装Claude Code

如果你还没装Claude Code,先搞定它。

打开终端(Windows用PowerShell,Mac用Terminal),输入:

macOS, Linux, WSL:

curl -fsSL claude.ai | bash

Windows PowerShell:

irm claude.ai | iex

装完后输入 `claude` 回车,按提示登录你的Anthropic账号。

> 前提:你的电脑需要有Node.js 18+。没有的话去 nodejs.org 下载安装。

第二步:安装Python依赖

这个技能的底层脚本是Python写的,需要装几个包:

```bash

pip install requests pillow aiohttp python-dotenv

```

> 前提:你的电脑需要有Python 3.8+。没有的话去 python.org 下载安装。

第三步:创建技能目录

```bash

mkdir -p ~/.claude/skills/sora2video-k

```

第四步:配置API密钥

这是最关键的一步。你需要获取3个API Key:

1) Sora 2 视频生成 API(通过kie.ai)

这是视频生成的核心。去 kie.ai 注册账号,获取API Key。

2) ImgBB 图片托管 API

去 api.imgbb.com 注册,获取免费API Key。这个用来把你本地图片变成临时公开链接(2小时后自动失效,不用担心隐私)。

3) 豆包大模型 API(火山引擎)

去火山引擎的方舟平台开通豆包模型,获取API Key。这个用来「看懂」你的产品图片并写出带货脚本。

拿到3个Key后,在技能目录下创建 `config.json`:

```json

{

"sora2_api": {

"base_url": api.kie.ai,

"api_key": "你的kie.ai API Key",

"model": "sora-2-pro-image-to-video"

},

"imgbb_api": {

"base_url": api.imgbb.com,

"api_key": "你的ImgBB API Key",

"expiration": 600

},

"doubao_api": {

"base_url": ark.cn-beijing.volces.com,

"api_key": "你的豆包 API Key",

"model": "doubao-seed-1-6-251015"

},

"video_settings": {

"default_duration": 15,

"default_aspect_ratio": "9:16",

"default_language": "中文",

"max_wait_time": 900,

"poll_interval": 30,

"max_image_width": 1024

}

}

```

第五步:获取技能文件

你需要把完整的技能代码放到 `~/.claude/skills/sora2video-k/` 目录下。包含以下文件结构:

```

sora2video-k/

├── SKILL.md              # 技能说明(Claude读这个来理解怎么干活)

├── config.json           # 你的API配置

├── requirements.txt      # Python依赖声明

├── scripts/

│   ├── video_generator.py    # 主程序:串联整个流程

│   ├── api_client.py         # API调用层:和4个服务通信

│   └── image_processor.py    # 图片处理:尺寸调整、竖版转换

└── references/

├── director-prompt.md    # AI导演的提示词模板

└── video-styles.md       # 5种视频风格参考

```

第六步:开始生成视频

一切就绪。打开Claude Code,输入:

```

/sora2video ./my-product.jpg

```

然后等着。Claude会实时汇报进度:

```

正在读取图片 ./my-product.jpg ...

✓ 图片格式验证通过 (1920x1080)

✓ 检测到横版图片,正在转换为9:16竖版...

✓ 图片已上传至ImgBB

正在分析商品并生成视频脚本...

✓ 识别到商品: XX品牌蓝牙耳机

✓ 核心卖点: 主动降噪、30小时续航、轻量设计

正在调用 Sora 2 生成视频...

✓ 任务已创建,等待生成...

[=====>                    ] 30% - processing

✓ 视频生成完成!

📹 视频链接: xxxxx

```

从输入到拿到视频,通常2-5分钟。

它写的脚本长什么样?

这是它给一款蓝牙耳机自动生成的脚本(中文版):

```

[0-2s] 画面:一只耳机从暗处缓缓浮出,柔和的光线勾勒出外壳轮廓

旁白:"在嘈杂的世界里,你需要一个安静的角落"

[2-7s] 画面:镜头推进至耳机特写,展示品牌Logo和材质细节

旁白:"XX主动降噪,40dB深度静音"

[7-12s] 画面:年轻人戴着耳机在咖啡馆专注工作,周围喧嚣渐弱

旁白:"30小时超长续航,一次充电用一周"

[12-15s] 画面:产品居中展示,背景微光流转

旁白:"现在体验,开启你的沉浸时刻"

```

注意最后一句不是「立即购买」「限时优惠」这种硬广。这个技能内置了品牌安全机制——它会自动避开生硬的促销用语,用中性的引导话术代替。这样生成的视频不会被平台限流。

有几个坑,提前告诉你

1. 图片格式

只支持 JPG、PNG、WEBP。不要传 HEIC(iPhone默认格式)或 GIF。

2. 横版图片不要怕

很多人拍产品照是横版的。这个技能会自动把横版图转成竖版——不是粗暴裁切,而是在产品周围加上模糊背景填充,确保产品完整展示。

3. 生成时间

Sora 2生成视频需要时间。如果超过5分钟没出结果也不用急,系统会每30秒自动查一次状态,最长等15分钟。如果真的超时了,它会给你一个任务ID,你可以后续手动查。

4. 英文脚本

默认是中文脚本。如果你做外贸,加个参数就行:

```

/sora2video ./product.jpg --lang=en

```

英文版只输出画面描述,不带旁白文案——因为Sora 2本身是英文驱动的,直接用英文效果最好。

5种视频风格,覆盖所有品类

这个技能内置了5种视频风格模板:

| 风格 | 适合品类 | 特点 |

|------|---------|------|

| 经典带货 | 美妆、食品、日用品 | 产品特写+使用场景+效果展示 |

| 故事叙述 | 服装、饰品、礼品 | 情景剧式,有故事线和情感 |

| 快节奏 | 数码、运动、潮流 | 多角度快切,视觉冲击强 |

| 简约高级 | 奢侈品、设计师品牌 | 大量留白,强调品质和工艺 |

| 自然清新 | 有机食品、天然护肤 | 户外场景,清新健康氛围 |

AI会根据你的产品自动选择最匹配的风格。你不需要手动指定。

背后的技术架构(给好奇的人)

整个流水线分6步:

```

产品图片 → 图片预处理(竖版转换)→ 上传ImgBB → 豆包AI分析写脚本 → Sora 2生成视频 → 返回视频链接

```

每一步都有独立的Python模块负责:

- `image_processor.py` 负责图片验证、尺寸调整、9:16转换(用PIL的高斯模糊做背景填充)

- `api_client.py` 封装了4个API的调用逻辑(ImgBB、豆包、Sora 2、飞书)

- `video_generator.py` 是总调度,串联整个流程并处理异常

有一个巧妙的设计:kie.ai的任务状态接口有时候不稳定,代码里做了双重检查——既轮询官方接口,又直接探测视频文件的CDN地址。两条路只要有一条通就能拿到视频。

这东西能用在哪?

几个真实场景:

- 独立站卖家:产品图一拍,视频自动出。不用请摄影师,不用请剪辑师

- 小红书/抖音带货:批量生成产品视频,日更无压力

- 跨境电商:切换英文模式,直接做TikTok素材

- 品牌方测试:快速出视频Demo给客户看概念,通过了再投入正式制作

最后

这个技能本质上做了一件事:把4个AI服务串成流水线,让你用一句命令完成原来需要一个团队干的事。

它不完美——15秒的AI视频还做不到专业TVC的水准。但对于电商场景,它已经够用了。尤其是当你需要批量产出内容的时候,效率差距是数量级的。

如果你已经在用Claude Code,现在就试试。一张图片,一行命令,15秒视频。

---

本文介绍的是Claude Code的 `/sora2video` 技能。技能源码基于MIT协议开源。文中涉及的第三方API需自行注册获取密钥。