你有没有想过,别人花3000块请人拍的带货视频,你一张手机拍的产品图就能搞定?
今天这篇文章,我手把手教你用Claude Code的一个隐藏技能,把**任意一张产品图片**变成**15秒竖版营销短视频**——全程不需要写一行代码,不需要会剪辑,不需要懂AI。
这不是PPT,这是真实可用的视频。
先看效果
随手拍一张产品照,丢给Claude Code,它会自动完成这些事:
- 识别你的产品是什么、品牌是什么、卖点是什么
- 写一份15秒的专业带货脚本(有开场钩子、卖点展示、价值主张、行动号召)
- 调用OpenAI的Sora 2把脚本变成真实视频
- 自动把横版图片转成竖版9:16(模糊背景填充,不裁切产品)
- 输出一个可以直接发抖音/小红书的mp4文件
整个过程你只需要做一件事:给它一张图片路径。
这到底是什么?
这是一个叫 `/sora2video` 的Claude Code技能。它把4个AI服务串成了一条自动化流水线:
| 环节 | 谁在干活 | 干什么 |
|------|---------|--------|
| 图片处理 | Pillow | 智能裁切/填充,确保9:16竖版 |
| 图片托管 | ImgBB | 把本地图片变成临时公开链接 |
| 商品分析 | 豆包大模型 | 看图识别产品,写带货脚本 |
| 视频生成 | Sora 2 | 根据脚本生成15秒视频 |
你不需要分别注册这4个服务。配好一次,终身可用。
从零开始:完整搭建指南
第一步:安装Claude Code
如果你还没装Claude Code,先搞定它。
打开终端(Windows用PowerShell,Mac用Terminal),输入:
macOS, Linux, WSL:
curl -fsSL claude.ai | bash
Windows PowerShell:
irm claude.ai | iex
装完后输入 `claude` 回车,按提示登录你的Anthropic账号。
> 前提:你的电脑需要有Node.js 18+。没有的话去 nodejs.org 下载安装。
第二步:安装Python依赖
这个技能的底层脚本是Python写的,需要装几个包:
```bash
pip install requests pillow aiohttp python-dotenv
```
> 前提:你的电脑需要有Python 3.8+。没有的话去 python.org 下载安装。
第三步:创建技能目录
```bash
mkdir -p ~/.claude/skills/sora2video-k
```
第四步:配置API密钥
这是最关键的一步。你需要获取3个API Key:
1) Sora 2 视频生成 API(通过kie.ai)
这是视频生成的核心。去 kie.ai 注册账号,获取API Key。
2) ImgBB 图片托管 API
去 api.imgbb.com 注册,获取免费API Key。这个用来把你本地图片变成临时公开链接(2小时后自动失效,不用担心隐私)。
3) 豆包大模型 API(火山引擎)
去火山引擎的方舟平台开通豆包模型,获取API Key。这个用来「看懂」你的产品图片并写出带货脚本。
拿到3个Key后,在技能目录下创建 `config.json`:
```json
{
"sora2_api": {
"base_url": api.kie.ai,
"api_key": "你的kie.ai API Key",
"model": "sora-2-pro-image-to-video"
},
"imgbb_api": {
"base_url": api.imgbb.com,
"api_key": "你的ImgBB API Key",
"expiration": 600
},
"doubao_api": {
"base_url": ark.cn-beijing.volces.com,
"api_key": "你的豆包 API Key",
"model": "doubao-seed-1-6-251015"
},
"video_settings": {
"default_duration": 15,
"default_aspect_ratio": "9:16",
"default_language": "中文",
"max_wait_time": 900,
"poll_interval": 30,
"max_image_width": 1024
}
}
```
第五步:获取技能文件
你需要把完整的技能代码放到 `~/.claude/skills/sora2video-k/` 目录下。包含以下文件结构:
```
sora2video-k/
├── SKILL.md # 技能说明(Claude读这个来理解怎么干活)
├── config.json # 你的API配置
├── requirements.txt # Python依赖声明
├── scripts/
│ ├── video_generator.py # 主程序:串联整个流程
│ ├── api_client.py # API调用层:和4个服务通信
│ └── image_processor.py # 图片处理:尺寸调整、竖版转换
└── references/
├── director-prompt.md # AI导演的提示词模板
└── video-styles.md # 5种视频风格参考
```
第六步:开始生成视频
一切就绪。打开Claude Code,输入:
```
/sora2video ./my-product.jpg
```
然后等着。Claude会实时汇报进度:
```
正在读取图片 ./my-product.jpg ...
✓ 图片格式验证通过 (1920x1080)
✓ 检测到横版图片,正在转换为9:16竖版...
✓ 图片已上传至ImgBB
正在分析商品并生成视频脚本...
✓ 识别到商品: XX品牌蓝牙耳机
✓ 核心卖点: 主动降噪、30小时续航、轻量设计
正在调用 Sora 2 生成视频...
✓ 任务已创建,等待生成...
[=====> ] 30% - processing
✓ 视频生成完成!
📹 视频链接: xxxxx
```
从输入到拿到视频,通常2-5分钟。
它写的脚本长什么样?
这是它给一款蓝牙耳机自动生成的脚本(中文版):
```
[0-2s] 画面:一只耳机从暗处缓缓浮出,柔和的光线勾勒出外壳轮廓
旁白:"在嘈杂的世界里,你需要一个安静的角落"
[2-7s] 画面:镜头推进至耳机特写,展示品牌Logo和材质细节
旁白:"XX主动降噪,40dB深度静音"
[7-12s] 画面:年轻人戴着耳机在咖啡馆专注工作,周围喧嚣渐弱
旁白:"30小时超长续航,一次充电用一周"
[12-15s] 画面:产品居中展示,背景微光流转
旁白:"现在体验,开启你的沉浸时刻"
```
注意最后一句不是「立即购买」「限时优惠」这种硬广。这个技能内置了品牌安全机制——它会自动避开生硬的促销用语,用中性的引导话术代替。这样生成的视频不会被平台限流。
有几个坑,提前告诉你
1. 图片格式
只支持 JPG、PNG、WEBP。不要传 HEIC(iPhone默认格式)或 GIF。
2. 横版图片不要怕
很多人拍产品照是横版的。这个技能会自动把横版图转成竖版——不是粗暴裁切,而是在产品周围加上模糊背景填充,确保产品完整展示。
3. 生成时间
Sora 2生成视频需要时间。如果超过5分钟没出结果也不用急,系统会每30秒自动查一次状态,最长等15分钟。如果真的超时了,它会给你一个任务ID,你可以后续手动查。
4. 英文脚本
默认是中文脚本。如果你做外贸,加个参数就行:
```
/sora2video ./product.jpg --lang=en
```
英文版只输出画面描述,不带旁白文案——因为Sora 2本身是英文驱动的,直接用英文效果最好。
5种视频风格,覆盖所有品类
这个技能内置了5种视频风格模板:
| 风格 | 适合品类 | 特点 |
|------|---------|------|
| 经典带货 | 美妆、食品、日用品 | 产品特写+使用场景+效果展示 |
| 故事叙述 | 服装、饰品、礼品 | 情景剧式,有故事线和情感 |
| 快节奏 | 数码、运动、潮流 | 多角度快切,视觉冲击强 |
| 简约高级 | 奢侈品、设计师品牌 | 大量留白,强调品质和工艺 |
| 自然清新 | 有机食品、天然护肤 | 户外场景,清新健康氛围 |
AI会根据你的产品自动选择最匹配的风格。你不需要手动指定。
背后的技术架构(给好奇的人)
整个流水线分6步:
```
产品图片 → 图片预处理(竖版转换)→ 上传ImgBB → 豆包AI分析写脚本 → Sora 2生成视频 → 返回视频链接
```
每一步都有独立的Python模块负责:
- `image_processor.py` 负责图片验证、尺寸调整、9:16转换(用PIL的高斯模糊做背景填充)
- `api_client.py` 封装了4个API的调用逻辑(ImgBB、豆包、Sora 2、飞书)
- `video_generator.py` 是总调度,串联整个流程并处理异常
有一个巧妙的设计:kie.ai的任务状态接口有时候不稳定,代码里做了双重检查——既轮询官方接口,又直接探测视频文件的CDN地址。两条路只要有一条通就能拿到视频。
这东西能用在哪?
几个真实场景:
- 独立站卖家:产品图一拍,视频自动出。不用请摄影师,不用请剪辑师
- 小红书/抖音带货:批量生成产品视频,日更无压力
- 跨境电商:切换英文模式,直接做TikTok素材
- 品牌方测试:快速出视频Demo给客户看概念,通过了再投入正式制作
最后
这个技能本质上做了一件事:把4个AI服务串成流水线,让你用一句命令完成原来需要一个团队干的事。
它不完美——15秒的AI视频还做不到专业TVC的水准。但对于电商场景,它已经够用了。尤其是当你需要批量产出内容的时候,效率差距是数量级的。
如果你已经在用Claude Code,现在就试试。一张图片,一行命令,15秒视频。
---
本文介绍的是Claude Code的 `/sora2video` 技能。技能源码基于MIT协议开源。文中涉及的第三方API需自行注册获取密钥。
