人工智能,已经进入奥本海默时刻。现在,AI武器不断被用于军事用途,相关行业正在蓬勃发展。价值数十亿美元的AI军备竞赛,已经吸引了硅谷巨头和世界各地的国家。世界各地日益加剧的冲突,既是AI战争的加速器,也是试验场。各国军队都对AI有着极大的兴趣,而且,这一领域目前还缺乏监管。而美国军方,......    阅读全文

去年9月,Meta与雷朋推出第二代智能眼镜Ray-Ban Meta,与第一代相比,最大的更新是集成Meta AI大模型。用户可通过摄像头和内置麦克风与扬声器,使用Meta AI实现目标识别和对话问答等功能。据第三方消息,Ray-Ban Meta已售出超过百万台,成为科技界新贵网红产品,......    阅读全文

中山大学&字节智创数字人团队提出了一个名为MMTryon的虚拟试穿框架,可以通过输入多个服装图像及指定穿法的文本指令来生成高质量的组合试穿结果。比如选中一件大衣、一条裤子,再配一个包,用语言描述穿法,“啪”的一键就穿到了人像上:无论是真人图像又或是漫画人物,都能一键按照搭配试穿衣服: ......    阅读全文

本月初,微软发布最强 RAG 知识库开源方案 GraphRAG,项目上线即爆火,现在星标量已经达到 10.5 k。GraphRAG 使用 LLM 生成知识图谱,在对复杂信息进行文档分析时可显著提高问答性能,尤其是在处理私有数据时。GraphRAG 使用 LLM 生成知识图谱,在对复杂信......    阅读全文

近两年最热的赛道就是 AI 了,我们技术团队早在去年上半年就开始布局相关的技术研究,但现在一年多时间过去了,产品上却迟迟没有做任何与 AI 相关的功能。 是不是很奇怪? 主要的原因在于我没有解答清楚自己心中的一些问题,所以一直在观察、在研究、在分析…… 直到最近我才觉得 AI 产品可......    阅读全文

前段时间,我组织了一次AI搜索的线下闭门会:与会的同学包括了:360AI搜索、某大厂搜索、Gemini、ThinkAny、万知、Repotify、Miku、荣耀,基本占据了国内AI搜索的半壁江山吧,从中得到了很多的收获和思考,结合最近专门找了小邵深夜聊了一次,快速的整理出了本篇文章,提......    阅读全文

据彭博社报道,OpenAI 提出了一套支持「自定义」AI 进化等级的分类系统,以此来帮助人们更清晰地理解关于 AI 的安全和未来发展。OpenAI 发言人指出,该分级系统被划分为从能够与人类进行基本对话的人工智能(Level 1)开始,一直到能够独立完成组织任务的高级人工智能(Leve......    阅读全文

首席情报官(Wiseflow)是一个敏捷的信息挖掘工具,可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息,自动做标签归类并上传数据库。SiliconFlow官宣Qwen2-7B-Instruct、glm-4-9b-chat等数款LLM在线推理服务即日起免费,这意味着......    阅读全文

AI 崛起,能够自主规划并执行多个步骤的 Agents,正成为用户的接口,也成为开发者的核心着力点。近期美国风投 Madrona 合伙人 John Turow 发表了一篇行业洞察《The Rise of AI Agent Infrastructure》,分享了 agent 领域的观察和......    阅读全文

AI + 出海,是 2024 年最热门的创业选择。一大批中国创业者借助 AI 的风潮,开启了他们的大航海时代。这是一期播客「[OnBoard!]与「十字路口」的串台节目,因为我们注意到,已经有不少出海的 AI 公司赚到了第一桶金。因此,在这期播客,我们尝试提炼和总结这些公司的共性,希望......    阅读全文

在Semicon West 2024大会上,Aitomatic发布了首个SemiKong半导体行业设计的新模型,将革新半导体工艺和制造技术。SemiKong是由Aitomatic与FPT Software合作开发,在处理行业特定任务时,表现优于通用大模型,如GPT和 Llama 3。S......    阅读全文

这是一个很特别的 GitHub 项目。创建者收集整理了市面上有关「AI副业」的灵感,进行了分类整理,而且每个都给出了几个例子,来展示详细的操作步骤和注意事项~AI脚本视频赚钱:① 图片绘本故事、② 虚拟人口播、③ 小说漫画推文、④ 电影剧情解说、⑤ 热点选题技巧视频变幻赚钱:① 瞬息全......    阅读全文

Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI模型,拥有听、说、看的能力,并能模拟70种不同的情绪和风格进行交流。作为平替[GPT-4o]的开源模型,Moshi在普通笔记本上即可运行,具有低延迟特性,支持本地设备使用,保护用户隐私。Moshi的开......    阅读全文

近日,上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT(Segment Anything in radiology scans, driven by Text prompts),在3D医学图像(CT、MR、PET)上,基于文本提示实现对人体497种器官/病灶的通......    阅读全文

对于AI native公司应该关注Agent能够全链路端到端支撑公司业务SOP,尽可能的突破人对业务规模和效率的制约。**就打造AI Native公司来讲,最值得尝试的领域就是对于人员成本敏感的BPO(商务流程外包)业务,谁的成本低,谁就将在竞争中获得大的优势。下面就是一个概念性的设计......    阅读全文

进入到新的 AI 时代,商业模式和的定价策略有什么变化嘛?最近有两位大佬,根据公开榜单、外部融资信息、公开信息等筛选当下最流行的 40 款 AI 应用。如图所示。然后!把它们有关定价的所有信息,掰开了揉碎了研究,想找到挣钱的秘密:对于AI产品来说,什么定价策略更能吸引用户付费?未来有哪......    阅读全文

Linly-Talker是一款创新的数字人对话系统,它融合了最新的人工智能技术,包括大型语言模型(LLM)、自动语音识别(ASR)、文本到语音转换(TTS)和语音克隆技术。这个系统还通过Gradio平台提供了一个交互式的Web界面,允许用户上传图片与AI进行个性化的对话交流。基于上述技......    阅读全文

大概一年前,YC 合伙人 Aaron Epstein 录制了一期视频,讲解「Business Models and Pricing (商业模式和定价策略) 」。Aaron 从 YC 投资的 4000 多家初创企业里,筛选出价值最高的前 100 家公司 (如 Airbnb、Stripe、......    阅读全文

今天这篇文章是作者吴昊老师参与崔牛会主办的「SaaS+AI创新大赛」两场初赛评审的经历,以及在参与评审了29个toB软件融入AI大模型之后的产品,进行的思考总结。近日,我有幸得到崔牛会邀请,作为评委参与了两场 SaaS+AI 创新大赛的初赛,共评审了 29 个 AI 产品。在这篇文章中......    阅读全文

近年来,大模型(LLM)在处理文本数据,尤其是对文本数据的分析和理解方面取得了巨大成功,但金融市场的预测依赖于对时间序列数据的复杂分析,这要求模型不仅要理解历史数据,还要能够从中提取对未来有预测价值的信息。现有方法,如基于关键词或情感分析的预测模型,虽然能够提供一定程度的市场洞察,但往......    阅读全文