
久等了,DeepSeek开源视觉模型DeepSeek-VL2来了
久等了,DeepSeek开源视觉模型DeepSeek-VL2来了阔别九月,大家期待的 DeepSeek-VL2 终于来了!DeepSeek-MoE 架构配合动态切图,视觉能力再升级。从视觉定位到梗图解析,从 OCR 到故事生成,从 3B、16B 再到 27B,DeepSeek-VL2 正式开源。
阔别九月,大家期待的 DeepSeek-VL2 终于来了!DeepSeek-MoE 架构配合动态切图,视觉能力再升级。从视觉定位到梗图解析,从 OCR 到故事生成,从 3B、16B 再到 27B,DeepSeek-VL2 正式开源。
最近忙着追更OpenAI,总想着给奥特曼做些梗图,
你现在不需要Recraft和Midjourney了,用咱国产的星流吧,效果一点都不差!今天有个佬给我丢了个链接,说是一个效果对标Midjourneyv6.1和Recraft的文生图产品 然后还给我丢了张图,说是用我的身材和名字生成的
据 TechCrunch 报道,Speak 正在宣布一项里程碑式的融资,这进一步增强了它的进展:一轮 7800 万美元的 C 轮融资,使其估值跃升至 10 亿美元。
OpenAI 连续 12 天 “Shipmas”发布活动终于要发布让大家期待已久的视频生成模型 Sora,这再一次激起人们对图片生成、视频生成的关注。而AI Creativity 一直是我们非常关注的 GenAI 落地方向,图像生成和视频生成模型快速迭代,离商业可用越来越近。
在 Minecraft 中构造一个能完成各种长序列任务的智能体,颇有挑战性。现有的工作利用大语言模型 / 多模态大模型生成行动规划,以提升智能体执行长序列任务的能力。
刷屏小红书、抖音的AI生图工具,什么来头?
2024 年 12 月 1 月下午,奇绩创坛在北京中关村国际创新中心举办了 2024 年秋季创业营路演日,共有 60 家奇绩投资并加速的公司参与了路演。前沿创新信号:大模型(49 家),多模态(28 家),数据(24 家),具身智能(14 家),仿真(4 家)。
CRM作为企业软件中最大的板块之一,其价值毋庸置疑。传统CRM的本质是关系型数据库,在AI尤其是多模态技术的加成下,CRM从结构化数据向半结构化/非结构化数据的转变势在必行。
远在大洋彼岸的AI初创公司Recraft,一定想不到自己是这样在小红书火的。