毫无疑问,人工智能在 2023 年掀起了波澜,在这里我们重点关注今年最重要的故事,这些故事将塑造这个开创性行业的未来:

在今年的人工智能进步领域,取得了显着的进展,改进了现有技术,而不是引入类似于前一年的 ChatGPT 或图像生成器的突破性创新。虽然没有令人惊叹的效果,而且真正的通用人工智能 (AGI) 还很遥远,但今年标志着之前的突破和即将到来的更强大的东西之间的中间阶段。为了展示这一演变,我们精心制作了一个视觉时间表,突出显示了塑造今年人工智能的最显着的人工智能进步:
02220150-2024-01-02T14:02:15.png
【2023年AI关键进展】

图像生成
Adobe Firefly:Adobe Firefly 和 Generative Fill 技术增强了视觉内容的多样性
Midjourney:Midjourney V.5 模型在图像生成的效率和分辨率上有所提升,V.6 版本则进一步增强了这些特性
DALL·E 3:基于 ChatGPT DALL·E 3简化了图像生成过程,减少了复杂提示词的需求
Shutterstock.AI:Shutterstock 集成了AI能力,允许用户将提示转化为可授权的图像

视频生成
Stability AI:推出了开源 Stable Video Diffusion 模型,有望在视频生成领域发挥重要作用
HeyGen:展示了用于视频的语音克隆、唇部运动调整和语言翻译的工具
Runway Gen-2:用户可以通过文本提示、图像或其他视频轻松生成视频
Pika 和 Pika 1.0:Pika 的初始版本吸引了大量用户,并在 Pika 1.0 中增加了多种风格的视频编辑能力
Meta Codec avatars:Meta Pixel Codec Avatars (PiCA) 模型为视频中的3D人脸提供了更逼真的远程存在体验

文本生成
Bard 和 Gemini:谷歌 Bard 和 Gemini 提升了聊天机器人的情感表达能力,Gemini 在多模态数据集上训练,成为 OpenAI ChatGPT 的有力竞争者
Grok:Elon Musk 的 xAI 推出 Grok,一个具有幽默感和实时知识更新能力的聊天机器人
OverflowAI:Stack Overflow 的 OverflowAI 通过AI驱动搜索提升知识策划
Llama 2:Meta Llama 2是下一代开源大型语言模型,优化了对话用例
GPT-4:OpenAI GPT-4 处理图像输入,支持实时网络浏览,扩展了插件支持
Mistral 7B:Mistral AI 发布挑战 GPT-4 的 Mistral 7B 大型语言模型
Mixtral 8x7B:Mistral AI 推出高质量稀疏混合物的 Mixtral 8x7B,强调模型开放性
Yi-34B llm:01.AI 发布开源神经网络 Yi-34B,性能优于参数计数更高的模型

其他进步
SAM:Meta AI 的 SAM 模型展示了无需额外训练的对象分割能力
DPO:DPO (Direct Preference Optimization) 方法用于微调大型无监督语言模型和文本到图像模型
Zephyr Direct Distillation of LM Alignment:Zephyr-7B 通过直接偏好优化 (dDPO) 提升了聊天模型的意图对齐
自主AI智能体:自主AI代理展示了向高级自主AI系统的转变
EvoDiff:微软的 EvoDiff 开源框架用于快速且经济的蛋白质生成
Stable Audio:Stability AI 的工具能从文本提示生成高质量音频剪辑
GPT Store, Copyright Shield, ChatGPT Bot Constructor:OpenAI 推出 GPT Store、Copyright Shield 和 ChatGPT Bot Constructor 等产品
Stability AI开源其LLM:Stability AI开源了其模型,包括 Stable Vicuna,首个使用人类反馈强化学习训练的聊天机器人

2023年AI领域的顶级合并
Stability AI 与 Init ML:Stability AI收购Init ML,整合先进技术到 ClipDrop 生态系统,开发 SDXL Turbo
Runway 与 Getty Images:合作推出视频生成模型 RGM,结合 Runway 的AI能力和 Getty Images 的内容库,改变内容创作流程
Snowflake 与 Neeva:Snowflake 收购 Neeva,后者以生成AI增强搜索体验著称,但关闭了订阅搜索引擎
Shutterstock 与 OpenAI:延长合作伙伴关系,OpenAI 利用 Shutterstock 数据丰富模型训练,Shutterstock 推出AI图像生成工具

2023年最重要的法律事件
欧洲AI法案:欧盟推出全球首部全面AI法规,按风险分类AI系统,实施延迟至2025年
美国版权局立场:拒绝为AI算法 Midjourney 创建的图像注册版权,确立先例;AI辅助作品可能获得版权保护

2023年引人注意的大讨论
企业对 ChatGPT 限制:多家金融机构因安全隐私问题限制 ChatGPT 使用,反映企业对AI应用的法律考虑
OpenAI低薪工人问题:时代杂志揭露 OpenAI 与 Sama 合作,引发工人待遇和内容审核心理健康影响的伦理问题
OpenAI领导层变动:Sam Altman 离职后迅速回归,引发关于变动原因和未来影响的广泛关注
Adobe 与 Figma收购案:Adobe 计划收购 Figma 遇监管障碍,最终因反垄断挑战放弃交易,支付 Figma 10 亿美元终止费
摄影师黑客攻击世界摄影奖:Boris Eldagsen 提交AI生成作品参赛,引发关于AI图像在摄影比赛中地位的辩论

原文:https://journal.everypixel.com/2023-the-year-of-ai