商汤商量获SuperCLUE9月评测总榜子榜双第一,AI智能体方向受瞩目

商汤商量获SuperCLUE9月评测总榜子榜双第一,AI智能体方向受瞩目

近日,中文通用大模型综合性评测基准SuperCLUE发布9月总排行榜和各个分类任务榜单,商汤商量SenseChat 3.0 位列中文大模型总榜排名第一。在新增的AI Agent(AI智能体)子榜中,SenseChat 3.0 同样排名第一,领先所有国内中文大模型以及GPT-3.5 和 Claude 2,表现仅次于GPT-4,展示了商汤在大模型领域创新发展及释放生产力的优势,以及在探索AGI道路上的

谁最“聪明”:大模型为何需要测评

谁最“聪明”:大模型为何需要测评

近日由北京商报社、深蓝媒体智库主办的“大模型见真章”AI主题沙龙上,360智脑产品资深专家葛灿辉在做“360智脑认知型通用大模型”的产品分享时,引用了三个测评结果,其中一个来自第三方评估机构SuperCLUE。听到这个引用,台下元语智能联合创始人兼COO朱雷笑了笑。朱雷的另一个身份,便是SuperCLUE联合发起人。葛灿辉显然不知道这一层关联。国产大模型竞赛如火如荼,好像每一个大模型都很牛,但具体