开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR'24长视频问答竞赛冠军
开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR'24长视频问答竞赛冠军基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型(Large Language Models,LLMs)的强大理解、生成和推理能力
来自主题: AI技术研报
11512 点击 2024-07-07 16:35
基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型(Large Language Models,LLMs)的强大理解、生成和推理能力
谷歌的Gemma 2刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了Gemma 2 9B/27B模型的中文通用对话、角色扮演、数学、工具使用等能力。
共同探讨AI大模型在终端产品上的应用及趋势。
历经3个月,首届AI奥数竞赛终于公布最终结果了!Gemma 7B只能达到3/50正确率的题目中,第一名的Numina模型居然刷出了29/50的成绩。
视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文/图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。
Meta 3D Gen:AI革命性突破,3D创作从此告别高成本与复杂工艺
AI基本盘,牢牢把握在苹果手里
Meta的文生3D模型或将给3D创作生态带来剧变。
“有太多不法分子在使用 AI 生成视频,关键是要阻止他们并保护社会。”
Sora 再不开放,这饭就真捂臭了。。