我的大模型创业这一年:追过风口,跌过跟头
我的大模型创业这一年:追过风口,跌过跟头创业8次、数场黑客松、技术迭代的兴奋与失落,就是这一年。
搜索
创业8次、数场黑客松、技术迭代的兴奋与失落,就是这一年。
生成式AI这把火在资本市场越烧越旺。根据智东西统计,2023年新晋的生成式AI和大模型领域相关独角兽达23家,国内新晋独角兽有6家,分别是智谱AI、MiniMax、百川智能、零一万物、智元机器人,以及已被收购的光年之外。这些独角兽企业涉及大语言模型、AI视频生成、垂直行业应用研发商以及GPU云服务提供商。
大模型出现后,AI 实现全能个人助理的梦想似乎近在眼前,也有不少公司推出了相应的硬件/软件,比如此前我们介绍的 AI Pin 以及 Rewind。
GPT Store敲响了大模型的App Store时刻
OpenAI、Stability AI、Copilot 均遭起诉,大模型版权如何归属。
现在,为了实现相同的目标,我们有两个最著名的库,即 Haystack 和 LangChain,它们可以帮助我们创建基于大语言模型的端到端应用程序或流程。
Lightning Attention-2 是一种新型的线性注意力机制,让长序列的训练和推理成本与 1K 序列长度的一致。
对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型 AI 的一个光明的方向。
视觉模型,同样遵循「参数越多性能越强」的规律?刚刚,一项来自苹果公司的研究验证了这个猜想。
不得不说,现在拍写真真是“简单到放肆”了。真人不用出镜,不用费心凹姿势、搞发型,只需一张本人图像,等待几秒钟,就能获得7种完全不同风格:
用剪枝的方式加速AI训练,也能实现无损操作了,只要三行代码就能完成!今年的深度学习顶会ICLR上,新加坡国立大学尤洋教授团队的一项成果被收录为Oral论文。
1月17日,新一代大语言模型书⽣·浦语2.0(InternLM2)正式发布并开源。2种参数规格、3种模型版本,共计6个模型,全部免费可商用。
近日,据媒体报道,全球语言学习平台多邻国在去年底裁减了约10%的外部合同工,转而使用OpenAI的GPT-4等大模型来完成翻译工作和内容制作。该公司也是又一个把AI作为裁员理由的公司。
今天,谷歌DeepMind的AlphaGeometry模型登上了Nature!30道IMO几何题中,它能做出25道,已经接近人类金牌选手的水平!而GPT-4,却一道题都没做出来,直接挂了零蛋。
来自纽约大学和UC伯克利的研究团队成功捕捉到了多模态大模型在视觉理解方面存在的重大缺陷。针对这个问题,他们进一步提出了一个将DINOv2特征与CLIP特征结合的方法,有效地提升了多模态大模型的视觉功能。
Altman在达沃斯论坛上表示,AGI不远了,因为技术的发展是指数级的,但是人类不用过于担心会被AI所取代,而未来限制AI发展的关键因素是能源。
最近来自浙江大学ReLER实验室的研究人员提出SIFU模型,一种侧视图条件隐函数模型用于单张图片3D人体重建。模型通过引入人体侧视图作为先验条件,并结合扩散模型进行纹理增强,在几何与纹理重建测试中均达到SOTA,并且在真实世界中具有多种应用场景。
来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。
在 AI 应用的路线上,有赞和 Monica.im(简称 Monica)是两种截然不同的代表。
这个行当里,目前不用AI不会被替代,但注定会被时代抛下
经过2023年的高歌猛进后,进入2024年,越来越多AI赛道的参与者已经开始思考如何活下去。就在1月15日,微软方面正式推出了针对个人用户新的订阅服务Copilot Pro,其价格为每月20美元,适用于Windows PC、Web、App。并且微软方面宣称,下个月用户就可以在Android和iOS版的Microsoft 365里用上Copilot。
英特尔:撞上了“天花板”作为推出世界上第一款商用计算机微处理器的厂商,英特尔的技术能力在行业中长期领先。正是由于过往技术面长期领先和垄断式的市场地位,英特尔有了“挤牙膏”的躺平机会。
无需人类演示,即可自主应对复杂的几何学挑战。水平接近人类金牌选手,人工智能(AI)学会做国际数学奥林匹克竞赛难题了。
文章探讨了AI“创作”的作品版权归属问题,尤其关注大模型训练输入和创作输出两个环节的纠纷。作者提到了国内外的相关诉讼案例和不同国家对AI作品版权的态度。此外,科技公司在AI作品版权问题上的立场也存在差异。
Airbnb需要给资本市场讲一个更大的故事,而AI就是那个画出大饼的金手指。
中科院对“找Bug”下手了,一口气总结了N种方案!法宝就是大模型。
没想到啊,开源大模型家族里,居然挤进来一位特别的选手:来自央企,身份为运营商。
过去一年,我们 见证了 ChatGPT 引爆生成式 AI 。 既然 可以在云端花近百亿人民币创建一个万亿参数 的模型,那么, 如何让无数消费者使用它呢? 作为全球最大的科技硬件博览会,塞进大模型的终端设备 成为本届 CES 一大亮点。
该算法现已在GitHub上开源,相关论文公布在ARXIV。近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。