AI资讯新闻榜单内容搜索-思维链

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 思维链
阿里大模型员工也自曝了996作息表

阿里大模型员工也自曝了996作息表

阿里大模型员工也自曝了996作息表

思维链作者、从谷歌跳槽OpenAI的Jason Wei前脚刚自曝996作息表,国内的“卷王”们就按耐不住了。

来自主题: AI资讯
9157 点击    2024-02-22 15:07
GPT-4推理能力暴涨32%,谷歌新型思维链效果超CoT,计算成本可降至1/40

GPT-4推理能力暴涨32%,谷歌新型思维链效果超CoT,计算成本可降至1/40

GPT-4推理能力暴涨32%,谷歌新型思维链效果超CoT,计算成本可降至1/40

谷歌&南加大推出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。

来自主题: AI技术研报
3870 点击    2024-02-08 19:44
「think step by step」还不够,让模型「think more steps」更有用

「think step by step」还不够,让模型「think more steps」更有用

「think step by step」还不够,让模型「think more steps」更有用

本文对思维链的推理步长进行了控制变量实验,发现推理步长和答案的准确性是线性相关的,这种影响机制甚至超越了问题本身所产生的差异。

来自主题: AI技术研报
2370 点击    2024-01-25 13:53
若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技推出九天机器人大脑,大模型总参数规模达130亿

若愚科技与哈工深联合研发了语言大模型基座---立知和多模态大模型基座---九天,总参数规模达130亿,训练数据超1500B tokens, 能完成多任务、多轮对话、中英翻译、思维链、工具使用等多种类型的指令数据

来自主题: AI资讯
2260 点击    2023-12-26 08:47
思维链提出者Jason Wei:关于大模型的6个直觉

思维链提出者Jason Wei:关于大模型的6个直觉

思维链提出者Jason Wei:关于大模型的6个直觉

大模型究竟从下一个词预测任务中学到了什么呢?还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。

来自主题: AI资讯
6164 点击    2023-12-07 17:07