踩遍AIGC创业的各种坑
历史总是惊人的相似。2022年末,OpenAI发布了初代版本的ChatGPT。虽然当时的对话效果差强人意,但这前所未有的交互形式毫无意外的引起了全社会关注。随之而来的是对新一代科技变革的期待,担忧被技术取代的焦虑,以及层出不穷的大模型竞赛。
大约400天后的今天,又是在同样的年初,OpenAI发布了新鲜出炉的Sora。虽然此时很多人还在发愁返程的车票难买机票太贵,但过于惊艳的60秒1080P动画已经颠覆了大多数人对AI视频的认知,假期还没结束,一场又一场百人规模线上分享会,成为新年开工前的最佳热身活动。目之所及,似乎又一场影响广泛的变革又将来临。
此时此刻,恰如彼时彼刻。
曾经我们回顾历史,可以动辄以百年为度量单位;然而如今,区区百天时间,这个世界的变化就开始有些难以预测。似乎借助AI的力量,个体也能创造以往难以想象的作品:只要抄写提示词,剩下的事交给AI就行,人人都是超级个体,创业/赚外快近在咫尺。
事实果真如此吗?
大约300天前,在彻底厌倦推诿扯皮死气沉沉的办公室工作之后,我和伙伴们开启了AIGC的创业之路。身处在没有先例可循的路途之中,我们踩过坑,追随过主流,也有过困惑,直到找到一条相对适合我们的道路。
如果2024年初的Sora再次勾起了你做点事情的想法,这篇文章可能会给你带来一些启发,少走一些大概率没有结果的弯路。
第一个反常识的陷阱:你学习了很多提示词,不等于你就能用它来创业。
回想一下2023年,诞生了一个很时髦的岗位“提示词工程师”,曾经还有大厂CEO信誓旦旦的为这个职业做背书。但你仔细想想就知道这件事的漏洞所在:从外部看,既然是提示词,那就意味着必须要在某个AI产品的外部环境下使用,你是在别人的平台规则下做事,天然的博弈劣势;从内部看,如果提示词没用,那这个岗位就没有意义,如果提示词有用,这是属于公司的资产,任何人接手之后也能发挥作用……无论是外部还是内部,提示词工程师都没有议价权,既没有护城河,也无法从交付的服务售价中扩大扣除成本的毛利,没有被卸磨杀驴就已经是万幸之事。
那么,可以不用从提示词开始学起吗? 答案是不行。
如果你连最基础的提示词交互方式都不会,用AI挣钱这事想都别想。作为团队带头人,或者公司CEO,你必须比团队里的任何人都熟悉提示词的用法和技巧,这就是典型的一把手工程。交给别人来做,要么不一定能用心,效果差强人意;要么做的非常好,然后别人转身单干去了。
所以,光靠提示词就够了吗? 远远不够。
提示词的天花板很低,很多应用场景下光靠提示词远远达不到交付标准,更难以摆脱生成式AI的“幻觉”影响。
大语言模型的Fine-tuning,扩散模型的LoRA,以及未来视频模型的训练,你至少要有一个独门绝技。要做到这点并不简单,你需要投入清洗数据,做好标签,租用算力,反复调试。这些投入同样是有价值的,这是为了获得超额收益,以及避开低质量套壳产品低价竞争的必经之路。
论重要性,Fine-tuning=LoRA>>Prompt,如果你追求的是公司价值的跃迁,那么就应该重视前两者,如果你只是想挣点快钱,搞个Prompt教程就能开工。
第二个反常识的陷阱:AI暂时还不是一套端到端的解决方案,而是一个前缀很长的定制工具。
当今短视频如此发达,任何信息都能在一天之内传遍全世界。信息传播的门槛低了,分辨真伪的门槛高了。比如大语言模型出来之后宣传上亿工作岗位消失,比如某个生成式图像AI工具能替代设计师为甲方任劳任怨的出方案,比如Sora发布后仿佛电影行业第二天就要被改写……
如果你对AI的认知建立在媒体传播的信息之上,那么大概率你没法从这个信息中找到可以落地方向,更不用说用它来持续挣钱。生成式人工智能确实在效果上碾压了上一代AI产品,但它距离终结者世界观里的天网Skynet,还有好几个指数级的差距。在2024年这个时间点上,不要奢望任何一款AI产品能根据你提出的几句话需求,就哼哧哼哧把所有该做的工作搞定。
你要做的是细致拆分工作任务,每一个流程节点都尽可能细分,细到由谁来打开word/excel文档,写下一些什么内容,再将这些内容转交给谁……由某某人在流程的某个环节执行的某件事,先整理出这样冗长的前缀,然后才有可能用AIGC工具为这个环节带来一些改变。这就是为什么AI产品的落地必须是一把手工程,打工人没有足够的资源来调动和协调跨部门合作;你也别指望完全不懂设计,或者从没拍过电影电视剧的人,轻而易举就能超越原来在行业中摸爬滚打多年的从业者……如果你都无法具象化的业务逻辑,指望AI瞎猜帮你补全,是必然不会有满意结果的。
第三个反常识的陷阱:To C看着很热闹,但To B才是AIGC的用武之地。
你可能会问以ChatGPT为代表的大语言模型应用,以Midjourney为代表的生成式绘图应用,不就是向个人收费使用吗?
表面上看是这个样子没错,但我们先务必搞清楚一个概念:用户使用AI产品的真实目的是什么?
你会没事干跟GPT聊一下午天?你会出于对艺术的追求用MJ或者SD出一天图?你会为了兴趣爱好折腾Gen2/Pika/Runway的动画效果?明确目的,单纯的好奇心,会促使你试用一下这些工具,然后呢,用不了多久就会陷入迷茫,不知道打开这些AI应用的目的。能够促使你持续使用的动力,有且只有一个……那就是为了挣钱——无论是提供特定服务增加收入(开源),或者降低生产成本增加利润(节流),亦或者为了在公司里提高自己的地位升职加薪,结果都是为了挣钱。
这是与上一个技术浪潮,也就是移动互联网应用巨大的区别之处:没有人打开AI产品是为了刷短视频、玩游戏,或者社交聊天,哪怕是AI女友或者AI角色扮演,你的持续兴趣也不会超过短短几周。
To C只有少数的几种可能,比如以教育培训为主的知识付费、卖课。典型案例包括某音博主李某某,以及知识星球各种AI群。这实际上跟直播带货没什么区别,制造焦虑,吸引流量,然后筛选出想走捷近的用户。至于卖出去的到底是不是AI产品,这其实并不重要。哪怕知名如OpenAI,你以为它会靠每个月20刀的订阅费挣钱?抱歉,Chat只是广告,花钱如流水的API才是重头戏。有能力且有意愿接入API的,谁又不想包装成服务卖出去挣差价呢?
面对客户,你可以不一定要站在聚光灯下,但你一定要有令人难以割舍的魅力。
这篇文章我有意没使用任何一张图或视频点缀。这个时代充斥着太多急功近利的想法和一步登天的冲动,海量的信息和短视频用着相似的语气,重复着同一个故事。客观的来说,生成式AI的确已经在重塑着各种行业流程,而且这些变化趋势将会越来越显著。如果你真的很想在这个浪潮中分到一杯羹,最好是冷静下来,先让自己成为一个重度AI用户。读论文,用产品,动手加以改造,不是做成个案demo,而是能够工程化实现。然后再考虑你手上有哪些资源能够与产品结合。
生成式AI为我们带来的,是一种真实世界与数字世界之间新的映射关系,但它并不是真的将挣钱的门槛降到触手可及,更不要相信什么程序员统统下岗的鬼话。算力、算法、数据,三者之间互相掣肘的复杂关系,比起以前任意一种编程语言有过之而无不及。
困难就摆在这里,机会同样是肉眼可见,那种一点一滴把自己的产品搭建起来的感觉,不亲自动手做,再看100个案例也无法体会。