大模型第159页 - 盛世豪门

大语言模型：推理能力不足，挑战严峻 - 准确率波动大，问题难度影响大

【大语言模型的数学推理能力受质疑，研究揭示多项问题】近年来，大语言模型在各任务中的表现引关注，核心问题是其是否具逻辑推理能力。日前，苹果公司的ImanMirzadeh及团队提出GSM-Symbolic新基准，对多模型评估。结果显示，问题数值或名字变化时，模型表现波动显著，难度提升时表现迅速下降。研究认为，大语言模型缺乏真正逻辑推理能力，简单变化能致准...

admin 2024-10-13 13 大模型

中国移动发布九天善智多模态基座大模型，推出30款自研行业大模型

新浪科技讯10月13日晚间消息，在近日的中国移动全球合作伙伴大会主论坛上，中国移动发布九天善智多模态基座大模型，并推出30款自研行业大模型。

admin 2024-10-13 7 大模型

大模型，拯救教培企业？

来源|伯虎财经（bohuFN）作者|楷楷

admin 2024-10-13 17 大模型

《通用大模型评测标准》发布

钛媒体App10月13日消息，10月12日，在2024中国移动全球合作伙伴大会期间，中国移动携手工信部中国电子技术标准化研究院、中国电信、国家电网、中国石油、科大讯飞等产业各方共同发布了大模型评测体系建设的新成果——《通用大模型评测标准》，为产业界遴选优质AI大模型提供重要参考依据。据介绍，此次发布的评测标准基于“2-4-6”框架：“2”代表两类评测视角...

admin 2024-10-13 12 大模型