
做语音识别现在还能融3000万美金?海外顶级VC押注AI-Native的语音交互,下一个操作系统级的机会!
做语音识别现在还能融3000万美金?海外顶级VC押注AI-Native的语音交互,下一个操作系统级的机会!你有没有想过,我们每天敲击键盘的这个动作,可能很快就会变成历史?150 年前发明的键盘,竟然仍然是我们与计算机交流的主要方式。
你有没有想过,我们每天敲击键盘的这个动作,可能很快就会变成历史?150 年前发明的键盘,竟然仍然是我们与计算机交流的主要方式。
今天,我们正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。
Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward
本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。谷歌表示,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
前有AlphaFold破解蛋白质之谜,今有AlphaGenome揭示DNA天书。谷歌DeepMind最新103页力作,用AI成功预测基因突变,一次即可读取100万个DNA碱基,精度无「模」能敌。
这两天啊,各地高考的成绩终于是陆续公布了。
中科院自动化所提出BridgeVLA模型,通过将3D输入投影为2D图像并利用2D热图进行动作预测,实现了高效且泛化的3D机器人操作学习。
大模型公司之外的玩家,怎么参与AGI?这家公司来打样了!一枚磁吸超薄「随身大脑」,录音转写翻译思考样样精通。别不信,这简直是我们见过的Agent最有用的玩法,无数海外用户已经夸爆了。
就在今天,AI医疗又诞生了一个超级独角兽! 据报道,自动化医疗笔记的 AI 初创公司 Abridge 获得了 3 亿美元的 E 轮融资,估值达到53亿美元(约合人民币380亿)。
在阿曼——一个仅有四百多万人口的国家,有近3万名老师,正通过一款AI工具制作教学视频。