阿里巴巴集团智能计算研究院日前上线了一款新的 AI 图片-音频-视频模型技术EMO,官方称其为“一种富有表现力的音频驱动的肖像视频生成框架”。据悉,你只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的 AI 视频,以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。......
阅读全文
「作为一家 AI-First 的公司,我们已经走过了近八年的历程,进步的步伐只会不断加快。Gemini,这是 Google AI 新时代的开始」,Google CEO 桑达尔·皮查伊(Sundar Pichai)在为这个新模型亲自站台时表示,「这个模型开创的新时代代表了我们作为一家公司......
阅读全文
上海交大 & 上海 AI Lab 发布 Radiology Foundation Model (RadFM),开源 14B 多模态医疗基础模型,首次支持 2D/3D 放射影像输入。论文链接:https://arxiv.org/abs/2308.02463代码链接:https://git......
阅读全文