微软科学家自述确诊「AI疲劳症」!如何在快速发展的AI浪潮中保持清醒?
微软科学家自述确诊「AI疲劳症」!如何在快速发展的AI浪潮中保持清醒?在科技飞速发展的当下,AI如汹涌浪潮席卷而来。从认知过载到焦虑情绪,AI催生了一种新型的「疲劳症」。
在科技飞速发展的当下,AI如汹涌浪潮席卷而来。从认知过载到焦虑情绪,AI催生了一种新型的「疲劳症」。
如果2023年给大模型的关键词是席卷,那么在2024,这个关键词应该是渗透。最常用的软件、手机PC本身、甚至厨卫/电源开源,都在被AI重塑。主观感受中,这一年,AI更加强大,以前所未有的速度嵌入各行各业。
能说会看,还响应快、记性好、算得准——如此完美的AI,ta来了!商汤科技日日新融合大模型交互版(SenseNova-5o),今天正式对外提供实时音视频对话服务,限时免费使用。它是商汤“日日新”融合大模型的交互版本,拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助AI与人类更自然、更流畅地交流,让每次互动更加智能与贴心,帮助用户全面提升生活与工作体验。
2025年1月17日,国家超级计算机成都中心迎来了一场科技盛宴——全球首个亿级参数量地震波大模型“谛听”正式发布。这一里程碑式的成果,不仅标志着我国在地震学研究领域迈出了重要一步,更以其卓越的性能和广阔的应用前景,引发了全球科学界的广泛关注。
近年来,视觉大模型(Large Vision Language Models, LVLMs)领域经历了迅猛的发展,这些模型在图像理解、视觉对话以及其他跨模态任务中展现出了卓越的能力。然而,随着 LVLMs 复杂性和能力的增长,「幻觉现象」的挑战也日益凸显。
2024又是AI精彩纷呈的一年。LLM不再是AI舞台上唯一的主角。随着预训练技术遭遇瓶颈,GPT-5迟迟未能问世,从业者开始从不同角度寻找突破。以o1为标志,大模型正式迈入“Post-Training”时代;开源发展迅猛,Llama 3.1首次击败闭源模型;中国本土大模型DeepSeek V3,在GPT-4o发布仅7个月后,用 1/10算力实现了几乎同等水平。
近日,珞博智能(Robopoet)官方发布一则消息,前字节大模型解决方案架构师潘雨楠(Yuna)正式加入珞博,出任联合创始人兼首席技术官(CTO)。潘雨楠本科毕业于哈尔滨工业大学,又在香港大学取得计算机专业硕士学位,她的学术背景为其在科技领域的发展奠定了坚实基础。
大模型的记忆片段进行多次替换的时候,会导致模型输出的内容叠加不同记忆片段,出现混淆和错乱的问题。在我做 Crew.ai 知识库测试的时,替换多份知识库文档后,发现大模型已经疯了。
昨天,我们报道了一个行业猜想,说是 OpenAI 和 Anthropic 等前沿大模型公司可能已经训练出了下一代大模型,但由于它们的使用成本过高,所以短时间内根本不会被放出来。
对于 LLM,推理时 scaling 是有效的!这一点已经被近期的许多推理大模型证明:o1、o3、DeepSeek R1、QwQ、Step Reasoner mini……