踩遍AIGC创业的各种坑

历史总是惊人的相似。2022年末，OpenAI发布了初代版本的ChatGPT。虽然当时的对话效果差强人意，但这前所未有的交互形式毫无意外的引起了全社会关注。随之而来的是对新一代科技变革的期待，担忧被技术取代的焦虑，以及层出不穷的大模型竞赛。

大约400天后的今天，又是在同样的年初，OpenAI发布了新鲜出炉的Sora。虽然此时很多人还在发愁返程的车票难买机票太贵，但过于惊艳的60秒1080P动画已经颠覆了大多数人对AI视频的认知，假期还没结束，一场又一场百人规模线上分享会，成为新年开工前的最佳热身活动。目之所及，似乎又一场影响广泛的变革又将来临。

此时此刻，恰如彼时彼刻。

曾经我们回顾历史，可以动辄以百年为度量单位；然而如今，区区百天时间，这个世界的变化就开始有些难以预测。似乎借助AI的力量，个体也能创造以往难以想象的作品：只要抄写提示词，剩下的事交给AI就行，人人都是超级个体，创业/赚外快近在咫尺。

事实果真如此吗？

大约300天前，在彻底厌倦推诿扯皮死气沉沉的办公室工作之后，我和伙伴们开启了AIGC的创业之路。身处在没有先例可循的路途之中，我们踩过坑，追随过主流，也有过困惑，直到找到一条相对适合我们的道路。

如果2024年初的Sora再次勾起了你做点事情的想法，这篇文章可能会给你带来一些启发，少走一些大概率没有结果的弯路。

第一个反常识的陷阱：你学习了很多提示词，不等于你就能用它来创业。

回想一下2023年，诞生了一个很时髦的岗位“提示词工程师”，曾经还有大厂CEO信誓旦旦的为这个职业做背书。但你仔细想想就知道这件事的漏洞所在：从外部看，既然是提示词，那就意味着必须要在某个AI产品的外部环境下使用，你是在别人的平台规则下做事，天然的博弈劣势；从内部看，如果提示词没用，那这个岗位就没有意义，如果提示词有用，这是属于公司的资产，任何人接手之后也能发挥作用……无论是外部还是内部，提示词工程师都没有议价权，既没有护城河，也无法从交付的服务售价中扩大扣除成本的毛利，没有被卸磨杀驴就已经是万幸之事。

那么，可以不用从提示词开始学起吗？答案是不行。

如果你连最基础的提示词交互方式都不会，用AI挣钱这事想都别想。作为团队带头人，或者公司CEO，你必须比团队里的任何人都熟悉提示词的用法和技巧，这就是典型的一把手工程。交给别人来做，要么不一定能用心，效果差强人意；要么做的非常好，然后别人转身单干去了。

所以，光靠提示词就够了吗？远远不够。

提示词的天花板很低，很多应用场景下光靠提示词远远达不到交付标准，更难以摆脱生成式AI的“幻觉”影响。

大语言模型的Fine-tuning，扩散模型的LoRA，以及未来视频模型的训练，你至少要有一个独门绝技。要做到这点并不简单，你需要投入清洗数据，做好标签，租用算力，反复调试。这些投入同样是有价值的，这是为了获得超额收益，以及避开低质量套壳产品低价竞争的必经之路。

论重要性，Fine-tuning=LoRA>>Prompt，如果你追求的是公司价值的跃迁，那么就应该重视前两者，如果你只是想挣点快钱，搞个Prompt教程就能开工。

第二个反常识的陷阱：AI暂时还不是一套端到端的解决方案，而是一个前缀很长的定制工具。

当今短视频如此发达，任何信息都能在一天之内传遍全世界。信息传播的门槛低了，分辨真伪的门槛高了。比如大语言模型出来之后宣传上亿工作岗位消失，比如某个生成式图像AI工具能替代设计师为甲方任劳任怨的出方案，比如Sora发布后仿佛电影行业第二天就要被改写……

如果你对AI的认知建立在媒体传播的信息之上，那么大概率你没法从这个信息中找到可以落地方向，更不用说用它来持续挣钱。生成式人工智能确实在效果上碾压了上一代AI产品，但它距离终结者世界观里的天网Skynet，还有好几个指数级的差距。在2024年这个时间点上，不要奢望任何一款AI产品能根据你提出的几句话需求，就哼哧哼哧把所有该做的工作搞定。

你要做的是细致拆分工作任务，每一个流程节点都尽可能细分，细到由谁来打开word/excel文档，写下一些什么内容，再将这些内容转交给谁……由某某人在流程的某个环节执行的某件事，先整理出这样冗长的前缀，然后才有可能用AIGC工具为这个环节带来一些改变。这就是为什么AI产品的落地必须是一把手工程，打工人没有足够的资源来调动和协调跨部门合作；你也别指望完全不懂设计，或者从没拍过电影电视剧的人，轻而易举就能超越原来在行业中摸爬滚打多年的从业者……如果你都无法具象化的业务逻辑，指望AI瞎猜帮你补全，是必然不会有满意结果的。

第三个反常识的陷阱：To C看着很热闹，但To B才是AIGC的用武之地。

你可能会问以ChatGPT为代表的大语言模型应用，以Midjourney为代表的生成式绘图应用，不就是向个人收费使用吗？

表面上看是这个样子没错，但我们先务必搞清楚一个概念：用户使用AI产品的真实目的是什么？

你会没事干跟GPT聊一下午天？你会出于对艺术的追求用MJ或者SD出一天图？你会为了兴趣爱好折腾Gen2/Pika/Runway的动画效果？明确目的，单纯的好奇心，会促使你试用一下这些工具，然后呢，用不了多久就会陷入迷茫，不知道打开这些AI应用的目的。能够促使你持续使用的动力，有且只有一个……那就是为了挣钱——无论是提供特定服务增加收入（开源），或者降低生产成本增加利润（节流），亦或者为了在公司里提高自己的地位升职加薪，结果都是为了挣钱。

这是与上一个技术浪潮，也就是移动互联网应用巨大的区别之处：没有人打开AI产品是为了刷短视频、玩游戏，或者社交聊天，哪怕是AI女友或者AI角色扮演，你的持续兴趣也不会超过短短几周。

To C只有少数的几种可能，比如以教育培训为主的知识付费、卖课。典型案例包括某音博主李某某，以及知识星球各种AI群。这实际上跟直播带货没什么区别，制造焦虑，吸引流量，然后筛选出想走捷近的用户。至于卖出去的到底是不是AI产品，这其实并不重要。哪怕知名如OpenAI，你以为它会靠每个月20刀的订阅费挣钱？抱歉，Chat只是广告，花钱如流水的API才是重头戏。有能力且有意愿接入API的，谁又不想包装成服务卖出去挣差价呢？

面对客户，你可以不一定要站在聚光灯下，但你一定要有令人难以割舍的魅力。

这篇文章我有意没使用任何一张图或视频点缀。这个时代充斥着太多急功近利的想法和一步登天的冲动，海量的信息和短视频用着相似的语气，重复着同一个故事。客观的来说，生成式AI的确已经在重塑着各种行业流程，而且这些变化趋势将会越来越显著。如果你真的很想在这个浪潮中分到一杯羹，最好是冷静下来，先让自己成为一个重度AI用户。读论文，用产品，动手加以改造，不是做成个案demo，而是能够工程化实现。然后再考虑你手上有哪些资源能够与产品结合。

生成式AI为我们带来的，是一种真实世界与数字世界之间新的映射关系，但它并不是真的将挣钱的门槛降到触手可及，更不要相信什么程序员统统下岗的鬼话。算力、算法、数据，三者之间互相掣肘的复杂关系，比起以前任意一种编程语言有过之而无不及。

困难就摆在这里，机会同样是肉眼可见，那种一点一滴把自己的产品搭建起来的感觉，不亲自动手做，再看100个案例也无法体会。

第一个反常识的陷阱：你学习了很多提示词，不等于你就能用它来创业。

第二个反常识的陷阱：AI暂时还不是一套端到端的解决方案，而是一个前缀很长的定制工具。

第三个反常识的陷阱：To C看着很热闹，但To B才是AIGC的用武之地。

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅