SuperCLUE_标签_第一娱乐网

生活

商汤商量获SuperCLUE9月评测总榜子榜双第一，AI智能体方向受瞩目

2023.10.15

近日，中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单，商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent（AI智能体）子榜中，SenseChat 3.0 同样排名第一，领先所有国内中文大模型以及GPT-3.5 和 Claude 2，表现仅次于GPT-4，展示了商汤在大模型领域创新发展及释放生产力的优势，以及在探索AGI道路上的

生活

谁最“聪明”：大模型为何需要测评

2023.08.21

近日由北京商报社、深蓝媒体智库主办的“大模型见真章”AI主题沙龙上，360智脑产品资深专家葛灿辉在做“360智脑认知型通用大模型”的产品分享时，引用了三个测评结果，其中一个来自第三方评估机构SuperCLUE。听到这个引用，台下元语智能联合创始人兼COO朱雷笑了笑。朱雷的另一个身份，便是SuperCLUE联合发起人。葛灿辉显然不知道这一层关联。国产大模型竞赛如火如荼，好像每一个大模型都很牛，但具体