北京时间5月14日凌晨,OpenAI发布了最新的GPT-4o(o代表Omnimodel全能模型),可以处理文本、音频和图像任意组合作的输入,并生成对应的任意组合输出。特别是音频,它可以在短至232毫秒的时间内响应用户的语音输入,平均320毫秒的用时已经接近人类在日常对话中的反应时间。

GPT-4o能看、能听、能说会唱,还能带着情绪和人聊天、随时引吭高歌,和人类的对话丝滑得像个真人。让人惊呼:GPT-4o已经超越当下所有的语音助手,科幻电影中的“她”真的来了!OpenAI的CTO米拉·穆拉蒂现场宣布,GPT-4o免费向所有人开放,让其使用没有门槛。

用GPT-4o选股

17114157-2024-05-17T03:37:03.png
GPT-4o将两百多行选股指标自动改写成自动选股器、输出图表和数据归档。经过1轮细节修改后,声称“效率暴打GPT4”。
17114339-2024-05-17T03:38:20.png
17114543-2024-05-17T03:40:46.png

在3D建模方面,GPT-4o也同样表现出了令人印象深刻的能力。它能够将2D图像转化为3D模型,比如将OpenAI标志进行3D重建,效果流畅自然。
17114641-openai.gif