Y Combinator 近期公布了2023夏季营的部分入选公司,据YC总裁兼CEO Garry Tan透露,其中有超过三分之一的AI项目,多达一半的项目将AI作为其业务的组成部分。

Rebel Fund的数据库中显示,AlphaGo引起轰动后,YC的AI项目数量在2017年达到顶峰。接下来几年,AI项目数量出现下降,进入低谷期。2023年ChatGPT热潮来临后,AI项目比例又达到新的高峰。YC一直处于技术创新的前沿,其项目往往反映了创业的最新趋势。OpenAI CEO Sam Altman曾于2014至2019年担任YC总裁,期间YC投资方向从互联网应用转向了硬科技。我们从Y Combinator最新一期2023夏季营精选出与AI相关的部分项目,呈现硅谷最新的AI创新趋势与四个值得关注的创业思路。AI技术的发展正迎来转折点,未来十年的AI时代将与过往有很大的不同,人类已经来到通往AGI的路口。

在我们筛选出的50多个AI项目中,所占比例较高的项目标签有B2B、SaaS、开发者工具、生成式AI等。

从历年项目分类来看,YC一直非常重视B2B初创公司,项目数量在近年来也经历了起伏,但目前有所回升,AI新浪潮可能将加速这一趋势。

虽然中美的企业服务发展环境不同,但在国内也存在大量通过AI应用降本增效的机会。在AI淘金热中,铲子等工具的提供者拥有绝佳的机会。

从行业来看,数字健康、金融科技项目占比相对较多,这也是YC项目分布中过去十年增长最快的两个行业。

AI项目当中,我们从YC此次夏季营当中看到四个值得关注的创业思路:Agent应用、AI for Science、AI基础设施及开发工具、AI评估与合规产品

Agent应用

AI Agent应用自六月以来,成为AI方向最为火热的创业方向之一,这一方面来自于大模型找到明确落地的商业化要求,另一方面Open AI关于Agent的种种讨论也深刻地影响着海外国内的创业投资思考。

我们看到,在此次入营的AI Agent项目中,充满了各种垂直领域工作场景、具体细分工作环节的Agent应用,当前表现为小工具的形态。这些Agent的服务场景囊括了:会计审计、专利书写、阅读垂直领域论文、医疗问诊、法务合同书写、金融行业研究等等。

创业公司选择这些刚需场景,在早期能够快速抓住核心用户的痛点,以AI替代人工的效率和成本优势快速占领垂类市场。

同时,创业者需要考虑到,这些具体环节能否支撑其应用泛化为垂直行业的All-in-one解决方案。同时,作为AI驱动的企业服务工具,国内创业者面临的市场需求在一定程度上和国外仍有显著差异。

AI for Science

AI能够辅助科学家在不同的假设条件下,进行大量的验证和试错,显著提升科研效率,改变科学研究的范式。

大模型浪潮来临后,AI for Science出现更多的可能性。不同背景的科学家们打破学科界限,共同研究计算、生物、化学、材料等交叉领域的新课题,同时也给产业应用带来新一波的机会。例如,Osium AI致力于用AI加快先进且可持续材料的研发。

AI基础设施及开发工具

大模型解决了智能涌现的问题,如何应用的问题仍需要回答。涌现出的智能如何在每个公司/个人被高效调度、运行、使用,这是每个希望借助AI实现智能化升级公司需要回答的问题。

以YC为代表的美国创投界认为,服务于AI部署的各个环节、不同场景的开发工具,以及底层基础设施,能够回答上述问题。

通过了解这些基础设施和开发工具的设计思路,能够帮助我们在技术上更深刻地了解大模型如何运行。同时,这个问题的答案在中国是否相同,是否存在着类似于LLMOps的市场机会,也需要因地制宜的思考。

AI评估与合规

开源评价体系是大模型时代比较不同模型的必备工具,这类评价工具面临着两方面的挑战:如何确保自己的评价体系足够领先,及如何完成从评价工具到商业社区或进一步商业化的过程。

合规要求在不同地区都有着相应的政策监管、企业内控驱动,符合不同地区的数据条例、企业敏感信息的保护,都是模型部署过程中必须关注到的安全问题。

围绕上述四个方向,我们选择性地盘点了如下项目

Latentspace - 人工智能数据助手

使用Latentspace能更快、更智能地完成电子表格工作。Latentspace将语言模型与数据相结合,构建下一代人工智能助手。与Latentspace的数据助理交谈,可以获取即时数据答案,无需询问数据团队、编写SQL查询或等待。

数据科学、AI助手、数据可视化

VectorShift - 无代码LLM工作流程构建器

VectorShift是一个无代码平台,可让团队快速创建AI工作流程。大企业使用VectorShift构建内部工具来生成营销文案、提案和RFP响应。初创团队可以用其来自动化工作流程,例如编写个性化电子邮件和部署聊天机器人。

生成式AI、软件即服务、B2B

Structured - 使用 AI 分析日志

Structured是一种LLM工具,将复杂的系统日志数据转换为易于理解的洞察。Structured的系统会自动识别日志数据中人类难以或不可能看到的模式,交叉关联来自日志、指标和代码库等各种来源的数据,从而提高调试效率。

AI 助手、开发者工具

Olio Labs - 针对世界上最棘手疾病的联合疗法

Olio 实验室利用人工智能开发组合疗法,在计算平台快速进行测试,考虑体内数千种相互作用的蛋白质,而不是只针对一两种蛋白质。

AI、生物技术、疗法、药物发现

Inventive AI - 利用AI Agents自动执行销售任务

Inventive AI通过集成现有的内部知识库(例如CRM、产品文档、文章等)以及公共资源(例如社交媒体和公司网站),使销售团队能够使用智能 AI Agents自动执行内容创建和研究任务。

生成式AI、B2B、销售、自动化

SID.ai - 将AI应用快速接入客户数据库

SID 负责客户数据基础设施的摄取、阐释和存储,开发人员可以轻松地将 LLM 应用连接到客户的数据,通过 API 询问有关客户的信息。

AI、开发者工具、生成式AI、数据科学

Neum AI  -  针对大语言模型的ETL

Neum AI利用最新上下文提高 AI 应用的准确性,帮助公司在其大语言模型提示词中获得准确且最新的上下文,连接和管理来自Blob Storage、Notion 和 SQL 等不同数据源的上下文,并将其同步到向量存储中以进行搜索。

AI、开发者工具、B2B、数据工程

Osium AI - 用AI加快先进且可持续材料的研发

Osium AI 借助AI技术,用于材料特性预测、逆向设计和加速显微图像分析。这款AI驱动的软件具有简明的界面,任何没有数据科学背景的材料研发工程师都可以轻松使用。

AI、SaaS、可持续发展、气候、先进材料

Sweep - 处理技术问题的开发者助手

Sweep是一个AI助手,接收 Github 问题,计划如何解决问题,并通过拉取请求将代码写入/推送到 Github,Sweep还会处理用户对此拉取请求所做的评论。

开发者工具、生成式AI、生产率、AI助手

Quill AI - 金融研究助理

Quill AI让投资者仅通过询问即可从SEC文件中提取信息,并根据指令更快地筛选股票。

AI、金融科技、自动化、

Cascading AI - 自动化银行流程

银行和金融科技公司花费数十亿美元培训和雇用员工,来处理复杂的系统和不断增长的服务组合。Cascading AI的Agents通过导航现有系统、显示正确的信息,甚至与客户进行合规沟通,使团队效率提高10倍。

AI、B2B、AIOps、金融科技、 > 机器学习

Decoda Health - 自主医疗编码和计费

Decoda Health 利用AI读取电子健康记录系统,自动将账单代码分配给临床医生文档。诊所将节省30%的编码成本,索赔拒绝率减少20%,并将索赔处理时间从几天缩短到几秒钟。

AI、金融科技、数字健康、医疗保健信息技术

Shadeform - 统一跨云的ML基础设施,解决 GPU 短缺问题

客户可以通过Shadeform 的API 和平台,访问 GPU 工作负载,将其部署到任何GPU提供商,并保证推理和训练将以最佳成本按时运行。

AI、开发者工具、SaaS、B2B、云计算

kapa.ai - 面向开发人员产品的 ChatGPT

kapa.ai使面向开发人员的公司能够轻松地为其社区构建AI支持机器人,OpenAI、Airbyte和NextJS的团队使用了kapa.ai改善开发者体验并减少技术支持。

AI、开发者工具、生成式AI、客户支持

Tempo Labs - 利用AI将UI构建速度提高10倍

Tempo是一款AI和原型设计工具,可直接向代码库提供高质量的React代码,通过简单的提示词就能生成完整的视图,直观地完善和控制设计细节,可使用现有组件构建高质量的设计系统。

AI、开发者工具、B2B、设计工具

Flowise - 低代码 LLM 应用程序构建器

Flowise是一个用于构建定制化大语言模型流程的开源拖放工具。Flowise提供一个可视化界面,可以为用于QnA的大语言模型应用构建后端,对数据进行汇总和分析。

AI、聊天机器人、开源、无代码

Hegel AI - 用于评估大语言模型的开源工具

Hegel AI构建的开源工具可用于大语言模型、提示词的即时评估和持续测试,开发人员可以用Hegel AI来监控 GPT-4 的回归、审核模型的安全性以及评估矢量数据库的性能。

AI、开发者工具、机器学习、云计算、基础设施

Langdock:符合通用数据保护条例的ChatGPT

Langdock帮助企业以合规的方式使用Chat GPT,通过构建单独的应用层,使企业能启用或禁用大模型,帮助企业执行数据隐私和访问规则,管理使用ChatGPT的员工,分析他们的使用情况,并提高使用大语言模型的技能。

AI、SaaS、B2B、企业软件

Reworkd AI - AI Agents的开源 Zapier

Reworkd AI将企业与AI Agent自动化连接起来,凭借易于使用的无代码平台,Reworkd AI 帮助企业通过AI Agents加速其运营,自动化核心业务的工作流程,同时与现有技术栈无缝融合。

生成式AI、B2B、开源、自动化

Metoro - 利用 AI 更快地调试生产系统

Metoro 是一个 AI Agents,可以协助调试生产系统,可以显示相关指标和日志、执行根本原因分析并建议补救措施,能融入现有的可观察性堆栈,例如 DataDog、Grafana、Elastic 等。

开发者工具、生成式AI、开发运营、基础设施

Empirical Health - 利用AI提供优质的全科诊治服务

用户可以通过Empirical Health的应用程序获得有关心脏健康、体位性心动过速综合征、睡眠呼吸暂停以及其他基础医疗需求的诊治建议。

生成式AI、健康科技、远程医疗、卫生保健

Solve Intelligence - 用AI撰写专利文件

Solve Intelligence通过浏览器内的文档编辑器,使用户借助AI快速撰写高质量的专利文件,减少撰写专利文件的成本和时间。

生成式AI、B2B、法律、AI助手

Agentive - AI驱动的审计员copilot

Agentive 通过缩短审核时间来帮助审核员实现效率增长,审计员使用我们的copilot来分析财务记录、执行审计程序,并在几秒内起草文档,提高效率。

AI、金融科技

Kobalt Labs - 在最敏感的数据上安全地使用大语言模型

让GPT访问私有数据或执行数据库写入、API 调用、与用户聊天等操作是有风险的,Kobalt Labs 通过合规地匿名化 PII/PHI、持续检查敏感数据泄漏等,使公司能够安全地使用GPT或其他大模型,而不受到数据隐私问题的困扰。

生成式AI、健康科技、合规、网络安全

AutoInfra - 基础设施即语言

AutoInfra提供由大语言模型支持的聊天界面,用于控制、修改和监控云基础设施。

AI操作、开发者工具、云计算、基础设施

Cerelyze - 将工程师研究论文速度提高100倍的工具

Cerelyze能将科学论文中讨论的方法自动转换为Python代码,融合了针对科学内容的强大pdf解析器以及多个能理解语言和代码的大模型。

AI、开发者工具、SaaS、B2B

Flair Health  -  通过解锁个人生活方式数据来应对慢性疾病

Flair为临床医生构建平台,利用患者生活方式数据,通过个性化干预措施,治疗糖尿病和心脏病等慢性病的核心致病因素。Flair分析数百个生活方式的数据点,并创建适合患者的建议。

健康科技、B2B、数据科学、医疗保健信息技术

Arcimus - 创建、分享会议记录并从中获取要点

Arcimus是一个免费的人工智能机器人,可以加入用户的会议并做笔记,提供AI生成的会议记录,使用户专注于会议。

AI、B2B

ZTool - 只需几句话即可创建数据工具和脚本

ZTool是企业家、分析师和营销人员的专属开发者,用一句话描述需要的工具,ZTool 将创建代码、运行并显示输出,尤其关注CSV文件的内容,包括导出CSV、合并文件和丰富数据。未来,用户将可以编辑、构建并相互共享他们的工具库。

AI、自动化

Giga ML - 为企业提供本地部署的大语言模型

Giga ML是一个用于微调和部署开源大型语言模型的平台,具有高速推理、本地部署和兼容OpenAI API等功能。与GPT-4 API相比,Giga ML的平台成本降低了70%,输出交付速度提高了300%。

生成式AI

Cyclone - 文档即时编码

用户提供文档站点URL和示例项目的GitHub存储库后,Cyclone使用LLM来理解文档,将每个部分链接到示例项目中的代码片段,并提供嵌入了 Cyclone 编码的文档站点预览,快速让文档具有交互性。

AI、开发者工具、SaaS、B2B、生产率

Subsets - 订阅业务留存的AI copilot

Subsets通过基于AI的个性化留存计划,使吸引和留住订阅者变得更简单,可帮助头部订阅企业将客户生命周期价值提高20%,并将订阅者生命周期延长至6个月。

AI、机器学习、B2B、客户关系管理

Remy Security - AI驱动的安全设计审查

Remy帮助安全团队更快、更有效地进行安全设计审查,使用LLMs分析设计文档、生成对作者有针对性的意见和问题。

生成式AI、B2B、生产率、安全

CambioML——大企业机器学习科学家的“私人工程师”

CambioML正在构建一个用于端到端机器学习的开源库,该库提供用于数据收集、微调、评估和部署的代码和UI功能,创始人正在构建他们在亚马逊开发基础模型时所希望拥有的产品。

开源、基础设施、机器学习

atla - 法务团队的AI助手

Atla的AI助手可以总结法律文件,为公司法务团队提出的后续问题生成可靠的答案,无需按小时计费。

B2B、法律科技、AI助手

Taylor AI - 在几分钟内微调开源LLM

Taylor AI 使每家公司都能根据自己的私有数据调整开源LLM,帮助企业在短短几分钟内微调开源LLM,数据科学和工程团队可以专注于构建模型和产品,而不是建立复杂的技术基础设施

AI、数据科学

Epsilla - 速度提高 10 倍的开源矢量数据库

Epsilla 是一个开源矢量数据库,提供对数十亿向量、基于消费的数据库即服务(database-as-a-service)及API的低延迟搜索,使矢量搜索速度提高 10 倍。

AI、软件即服务、基础设施、数据库

Talc - LLM调试器

Talc使LLM系统的调试和测试变得容易,通过逐行重播会话、调整输入并为其设置规则,来调试大模型。

AI、开发者工具

Pincites - AI驱动的合同谈判

Pincites 使用最新的大型语言模型,帮助法律团队构建任何内部团队都可以使用的合同手册,只需上传模板,添加指引,即可根据语义来标记条款,不需要手动标记或模型训练,提高合同谈判的效率。

生成式AI、合规、法律科技、企业软件

Linc  - 物流领域的电子邮件copilot

Linc将EDI/API 集成的优势带给各种规模的物流供应商,解决物流数据通信问题。Linc位于电子邮件收件箱中,可立即将电子邮件、文档中的订单数据与ERP和运输管理系统的记录同步,完成所有数据转换的繁重工作。

AI、客户关系管理、数据工程、企业软件、自动化

Trainy - 识别分布式训练的瓶颈

Trainy 总结了大型分布式训练期间的分析信息,以便工程师准确了解什么限制了模型训练的速度,帮助工程师隔离性能瓶颈。

开发者工具、机器学习、SaaS、开源

CatX - 交易和风险转移的交易所

CatX 是灾难和参数风险的交易所,融合了快速、自动化的风险交易,为(再)保险公司、投资者和保障购买者提供复杂的风险和资本管理工具,并辅以先进的建模和分析,以减少当前风险转移流程的低效率。

机器学习、金融、分析、保险、投资

Roundtable - 自动化调查结果

Roundtable可在几秒钟内自动回复调查问卷,在精选的调研数据集上训练大语言模型,让企业立即收到高质量的数据,并快速回答任何关于调研群体的问题。

AI、B2B、市场调查

Health Harbor - 私人医疗机构的自动计费

私人诊所每周都会花几个小时与保险公司交谈,以确定费用范围。Health Harbor 使用人工智能为私人诊所自动计费,让人工智能代表私人诊所呼叫保险。

AI、SaaS、B2B、医疗保健信息技术、计费

AskLio - 采购团队的 AI-Copilot

AskLio使用人工智能帮助采购团队自动执行请求并指导员工,当大型企业的员工想购买物品时,采购常常需要数周时间,而AI将其缩短为数小时。

生成式AI、B2B、采购、企业软件

Wyvern AI - 通过更好的产品排名增加市场收入

Wyvern.ai是一个面向市场的机器学习平台, API可根据受欢迎程度、相关性和个性化等因素优化产品排名。并提供了一个框架,客户可以定制化的微调他们的产品排名模型。

机器学习、市场、搜索、基础设施、推荐系统

Unhaze- 找到最有可能达成的交易

Unhaze 通过多个来源挖掘数据,例如招聘、使用的技术、公司描述、网站等,并分析企业的历史交易,以发现最有可能转化的客户和购买信号,同时监控市场和目标客户,以便在正确的时间发现最佳机会。

AI、SaaS、B2B、销售量