Tomato AI:一句话,出大片 — 下一代 AI 视频生成平台
Tomato AI:一句话,出大片
从文本到视频,从图片到短片,从生成到剪辑 — 全流程、零门槛、无水印。本文带你走进 Tomato AI(cctocv.com)背后的产品设计与工程实践。
为什么我们需要又一个 AI 视频工具?
2025 年,AI 视频生成赛道已经拥挤不堪:Runway、Pika、可灵、即梦……每个平台都在卷模型、卷参数、卷时长。但创作者的痛点始终没变:
- 水印 — 免费版满屏 logo,商用要额外付费
- 排队 — 热门模型动辄等待 30 分钟以上
- 割裂 — 生成完还得下载、导入 Premiere/剪映再剪辑
- 门槛 — 英文界面、复杂参数、学习曲线陡峭
- 成本不透明 — 充了会员发现还得按次付费
Tomato AI 的答案是:把"生成 + 剪辑"做成一个产品,用积分别透明计费,用多模型聚合消除排队,用零水印承诺把作品还给你。
核心能力:一句话能做什么?
五大生成模式
打开 cctocv.com 首页,悬浮生成器提供了完整的创作入口:
| 模式 | 说明 | 适用场景 |
| 文生视频 (T2V) | 输入文字描述,直接生成视频 | 从零开始的创意 |
| 图生视频 (I2V) | 上传图片 + 文字,让静态画面动起来 | 产品展示、照片活化 |
| 参考视频 (Ref2V) | 上传参考素材,风格迁移生成新视频 | 风格统一系列创作 |
| 图生图 (I2I) | AI 图片生成,支持 1:1 / 3:2 / 2:3 | 封面、配图、素材 |
| 内置视频编辑器 | 时间轴、图层、特效、音频 — 全浏览器端运行 | 后期剪辑与合成 |
十+ 顶级模型,一个入口
Tomato AI 不是自研模型 — 它是一个模型聚合平台,把字节跳动旗下即梦、Seedance 2.0、Google Veo 3.1、OpenAI Sora 2、快手 Kling 3 等顶级模型统一接入:
- 即梦 3.0 1080P — 字节官方模型,10 积分/秒,支持首帧/尾帧控制
- Seedance 2.0 (Pippit) — 原生音画同步,20 积分/秒,支持多图参考
- Veo 3.1 / Sora 2 / Kling 3 — 国际一线模型按需调用
创作者不需要在多个平台之间切换账号、比较价格 — 一个积分池,所有模型通用。
@mention 智能引用系统
这是 Tomato AI 的一个细节亮点。在提示词输入框中,你可以用 @图片名 的方式引用已上传的参考图片:
一只机械蝴蝶在花丛中飞舞,翅膀由 @reference.png 的纹理构成,镜头跟随蝴蝶穿梭于 @garden.jpg 的花海中
系统会自动弹出候选下拉框,支持键盘上下选择,删除图片时自动清理提示词中的引用。这个交互让多图参考变得像聊天 @ 人一样自然。
五大杀手锏:模型能力展示
首页的"核心特性"模块用真实生成案例展示了平台的能力边界:
原生音画同步 (Native Audio-Video Joint Generation)
Seedance 2.0 等模型直接在生成视频的同时产出音频 — 对话、环境音、音乐一步到位,告别后期配音的割裂感。一个战地女兵咬汉堡的画面,咀嚼声和环境爆破声同步生成。
电影级导演操控 (Director-Level Control)
不是随机生成器,而是创作工具。运镜控制 — 航拍俯冲、跟随追车、环绕特写 — 都可以通过提示词精确控制。一条山路上的孤车,镜头从高空俯瞰到贴地跟随,全靠文字驱动。
单提示词多镜头叙事 (Multi-Shot Storyboarding)
一句话生成完整分镜短片。赛博朋克少女大战机械人的开场 — 多个镜头切换、动作连贯、叙事清晰,输入只有一段描述。
真实物理模拟 (Realistic Physics Simulation)
时间停止、动作碰撞、流体动力学 — 模型对真实世界物理规律的理解达到了令人惊叹的程度。骏马奔跑中突然"时间冻结",延迟后恢复冲刺,这种效果以前需要昂贵的后期特效。
闪电生成速度 (Lightning-Fast Generation)
渲染管线优化带来的极速体验。FPV 无人机穿越日本城堡的复杂场景,从提交到出片只需几分钟。
技术架构:如何撑起一个全流程创作平台
技术栈
前端:Next.js 16 (App Router) + React 19 + Tailwind CSS v4
状态:Zustand + React Context
认证:Firebase Auth (Google OAuth + 邮箱密码) → 后端 JWT
支付:PayPal SDK (一次性购买 + 月度订阅)
国际化:i18next (中/英/日/阿拉伯语)
编辑器:自研 GPU 渲染引擎 + IndexedDB 本地持久化
后端:Express + MySQL (sibling repo videoAaiB)
关键工程决策
1. 模型抽象层 — 统一接口,差异化解耦
不同模型的参数差异巨大:即梦支持首帧/尾帧控制,Seedance 支持多图参考和音画同步。代码用 MODEL_IMAGE_CAPACITY 和 MODEL_COSTS_PER_SEC 配置表把差异收敛到数据层:
const MODEL_IMAGE_CAPACITY = {
'jimeng_t2v_v30_1080p': 'single', // 单图参考
'pippit_iv2v_v20_cvtob_with_vinput': 'multi', // 多图参考
};
const MODEL_COSTS_PER_SEC = {
'jimeng_t2v_v30_1080p': 10, // 10 积分/秒
'pippit_iv2v_v20_cvtob_with_vinput': 20, // 20 积分/秒
};
UI 根据模型自动切换设置面板 — 即梦显示比例/时长/分辨率/声音/帧控制,Seedance 显示比例/时长。新增模型只需加一行配置。
2. 浏览器内视频编辑器 — opencut 移植
这是整个平台最重的技术投入。Tomato AI 内嵌了一个完整的视频编辑器(路径 /editor),它源自开源项目 opencut,经过深度定制移植到 Next.js:
- GPU 渲染引擎 — WebGL 加速,失败时自动降级
- 时间轴编辑 — 多轨道、多图层、精确到帧
- 特效系统 — 模糊等实时滤镜,基于 WGSL shader
- 本地持久化 — IndexedDB 存储项目文件,无需服务器
- URL 同步 —
syncEditorUrl直接操作window.history,不走路由系统
编辑器管理器架构清晰:playback、timeline、scenes、project、media、renderer、command(撤销/重做)、save、audio、selection、clipboard、diagnostics — 每个 manager 是独立类,通过 subscribe(onChange) 与 React 的 useEditor(selector) hook 协调。
3. 性能优化 — 视频懒加载
首页有大量展示视频,直接加载会拖垮性能。Tomato AI 用 IntersectionObserver 做了三级懒加载:
- 灵感案例视频:进入视口 200px 范围内才开始加载
- 特性展示视频:进入视口 400px 范围内预加载,鼠标 hover 时播放
- 背景视频:只预加载 metadata,poster 图先占位
4. 支付系统 — 双模式计费
PayPal 集成支持两种模式:
- 一次性购买 — Starter ($20) / Creator ($40) / Studio ($60),积分永久有效
- 月度订阅 — Free / Lite / Pro / Premium,PayPal Plan ID 自动区分沙箱和正式环境
订阅计划的 Plan ID 从环境变量读取,切换环境零代码改动。
5. 国际化 — 四语种覆盖
zh (中文) / en (英文) / ja (日文) / ar (阿拉伯文),非英语语言懒加载,减少首屏体积。编辑器内 27 个组件接入 i18n,Dashboard 和 Editor 无全局导航栏时自带语言切换按钮。
产品体验:从首屏到成片的完整旅程
首页 — 降低决策成本
打开 cctocv.com,你看到的是:
- 视频背景 Hero — 全屏 AI 生成视频做背景,瞬间建立"这就是 AI 能做的"认知
- 悬浮生成器 — 向下滚动时生成器收缩为底部小条,随时可展开,不打断浏览
- 五大特性展示 — 每个特性配真实生成视频,hover 播放,可直接"使用提示词"跳转生成
- 灵感案例画廊 — 7 个精选案例,点击"使用提示词"一键带入生成器
- 透明定价 — 一次性 vs 月付对比,年付省钱金额直接标出
- FAQ — 常见问题前置解答
Dashboard — 创作工作台
登录后进入 /dashboard,左侧导航分为:
- 首页 (Explore) — 探索推荐
- 文生视频 / 图生视频 / 参考视频 — 三种视频生成模式
- 图生图 — AI 图片生成
- 视频编辑器 — 进入内置编辑器
- 历史记录 — 所有生成记录
- 设置 — 账户管理
每种生成模式共享同一个 GeneratorCard 组件,通过 generationMode 切换行为,保证交互一致性。
编辑器 — 生成到剪辑的无缝衔接
这是区别于所有竞品的核心壁垒。在 Tomato AI,你不需要:
- 下载生成的视频
- 打开另一个剪辑软件
- 重新导入素材
生成完成后直接在浏览器内进入编辑器,时间轴拖拽、添加转场、调整音频、导出成品 — 全流程闭环。
商业模式:积分别,透明计费
积分体系
- 即梦 3.0:10 积分/秒视频
- Seedance 2.0:20 积分/秒视频(含原生音画同步)
- AI 图片:10 积分/张
积分在所有模型间通用,不设模型锁定。5 秒即梦视频 = 50 积分,15 秒 Seedance 视频 = 300 积分。
定价方案
| 方案 | 价格 | 积分 | 适合人群 |
| Free | $0 | 注册赠送 | 体验尝鲜 |
| Starter (一次性) | $20 | 1000 积分/180天 | 偶尔创作 |
| Creator (一次性) | $40 | 2000 积分/365天 | 稳定创作者 |
| Studio (一次性) | $60 | 3000 积分/365天 | 高频产出 |
| Lite (月付) | 低至 $0.08/视频 | 100 积分/月 | 轻度订阅 |
| Pro (月付) | 低至 $0.06/视频 | 330 积分/月 | 专业创作者 |
| Premium (月付) | 低至 $0.05/视频 | 800 积分/月 | 工作室级 |
所有方案均包含:全部模型访问、无水印、商业授权。
写在最后:AI 视频创作的民主化
Tomato AI 的愿景不是做又一个模型公司,而是做创作者和模型之间的桥梁:
- 模型厂商负责把质量做到极致
- Tomato AI 负责把体验做到极致 — 多模型聚合、透明计费、内置剪辑、零水印
当生成质量不再是壁垒(所有顶级模型都在快速进步),工作流效率就成了真正的差异化。从"一句话"到"一部短片",中间的距离越短,创作者的价值就越高。
一句话出片,几分钟交付,无水印商用 — 这就是 Tomato AI。
体验地址:cctocv.com
技术栈:Next.js 16 · React 19 · Tailwind v4 · Firebase · PayPal · IndexedDB · WebGL
支持语言:中文 / English / 日本語 / العربية