马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B马斯克最近哭穷表示,xAI需要部署10万个H100才能训出Grok 3,影响全球的大模型算力荒怎么解?昨天开源的这款MoE大模型,只用了1/19算力、1/19激活参数,性能就直接全面对标Llama 3-70B!
搜索
马斯克最近哭穷表示,xAI需要部署10万个H100才能训出Grok 3,影响全球的大模型算力荒怎么解?昨天开源的这款MoE大模型,只用了1/19算力、1/19激活参数,性能就直接全面对标Llama 3-70B!
新的可能性和新的难点。 大模型天天有热点。最近,字节、阿里、百度、腾讯、科大讯飞等大模型厂商纷纷宣布调整旗下大模型产品的定价策略,大模型“价格战”正式打响。
“我们对今年有更好的预期。”2024年5月,成都明途科技有限公司(以下简称“明途科技”)的“明途WorkGPT”大模型通过《生成式人工智能服务管理暂行办法》备案审批。「明途科技」创始人、董事长兼总经理肖雪松表示:“此次通过生成式人工智能服务备案,进一步肯定了明途科技在人工智能技术领域的投入与创新成果,明途也将正式展开关于明途WorkGPT的宣发、运营。”
大模型每次一有突破,我们就会听到它又“摧毁了XX职业”“XX岗位要消失了”,也总能听到一些安慰,说不用担心,“AI会创造一些新职业”。
多模态大模型,也有自己的CoT思维链了! 厦门大学&腾讯优图团队提出一种名为“领唱员(Cantor)”的决策感知多模态思维链架构,无需额外训练,性能大幅提升。
AGI发展观点多元,技术风险需警惕管理。
马斯克搞大模型又融到60亿美元(约435亿元)! 这是xAI最大的一轮融资,目前估值已来到240亿美元(约1738亿元),一举超过Anthropic,成为OpenAI之下第二位。 借着这个势头,老马也亲自下场发起招聘广告: 如果你相信我们理解宇宙的使命,需要最大限度地严格追求真理,而不考虑受欢迎程度或政治正确性,欢迎加入xAI。
人人都知大模型时代具身智能大有可为。 但这座连接起大模型和现实物理世界的桥梁,究竟应该如何搭建? 逐际动力联合创始人兼首席运营官张力,在中国AIGC产业峰会上给出思考: AI代替人去决策,人形机器人代替人去劳动。
更适配中文的语音大模型来了—— 来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。 号称最难方言、“魔鬼的语言”的温州话,也不在话下。
随着大语言模型(LLM)的快速发展,其在文本生成、翻译、总结等任务中的应用日益广泛。如微软前段时间发布的Copilot+PC允许使用者利用生成式AI进行团队内部实时协同合作,通过内嵌大模型应用,文本内容可能会在多个专业团队内部快速流转,对此,为保证内容的高度专业性和传达效率,同时平衡内容追溯、保证文本质量的LLM水印方法显得极为重要。