shot_标签_第一娱乐网

云从科技从容大模型在benchmark COCO上刷新世界纪录大幅降低AI应用成本

2023.10.19

近日，云从科技从容大模型在视觉领域再次取得重要进展，基于视觉基础大模型的目标检测器在检测领域著名benchmark COCO数据集上从微软研究院（MSR）、上海人工智能实验室、智源人工智能研究院等多家知名企业与研究机构脱颖而出，刷新了世界纪录。云从科技从容大模型在COCO测试集上平均精度（以下简称mAP，mean Average Precision）达到0.662，位列榜单第一（见下图）。在验证集

半年多过去了，ChatGPT的排名快“垫底”了?

2023.09.09

出品|三言Pro今天，笔者无意中刷到一张图片。据该图片显示，OpenAI的GPT-4在11个大模型中（第一名序号为0），已经排到了最后。还有网友配上了“GPT4：我的冤屈怎么诉？”的字样。这不禁让人好奇，今年年初，ChatGPT爆火以后，其他公司才开始提大模型的概念。这才半年多，GPT就已经“垫底”了？于是，笔者想看看GPT排名到底咋样了。测试时间不同测试团队不同GPT-4排第十一从前文中图片上显

作业帮发布教育领域银河大模型：支持AI解题、多语言AI问答

2023.09.05

快科技9月4日消息，作业帮最近在2023中国国际服务贸易交易会上正式发布了自研银河大模型。据了解，银河大模型支持AI解题、多语言AI问答等能力，号称精通诗词字句和课文常识；并支持AI写作功能，可用于提高写作技巧、优化写作结构，并提供文章润色、语法纠错和创意启发等场景。在测评基准上，作业帮银河大模型表现卓越，以平均分73.7分位居C-Eval榜首。同时在CMMLU榜单Five-shot和Zero-s

程一笑督阵快手推“快意”杀入大模型战

2023.08.21

《科创板日报》8月21日讯（记者张洋洋）快手“老铁”们离AGI又近了一步。今日，快手方面向《科创板日报》记者确认，快手的大模型“快意”（KwaiYii）已经开始内测，包括为业务团队提供标准API和定制化项目合作方案等。快手方面此前并未对“快意”大模型具体信息进行过多阐述，该大模型更多是因出现在AI综合中文评估基准CMMLU的榜单中，而引发市场关注和讨论。根据CMMLU页面的介绍，“快意”为快手

CMMLU中文向排名第一！快手自研AI也来了

2023.08.21

近一段时间，国内生成式人工智能模型的推出可谓是你方唱罢我登台，好不热闹。快科技8月21日消息，近日，快手的自研大模型“快意”（KuaiYii）已经出现在了AI综合中文评估基准CMMLU的榜单中。截至本文成稿，该模型的13B版本KwaiYii-13B同时位列five-shot和zero-shot项目下的中文向第一名，在人文学科、中国特定主题等方面较强，平均分超61分。而根据快意在GitHub页面给出

小米大模型，该“交卷”了

2023.08.14

距4月14日雷军官宣杀入大模型不到4个月，小米大模型终于首次曝光，并交出了一份初步成绩单。多方消息显示，小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。根据GitHub项目页给出的信息，MiLM-6B（下称：小米大模型）是由小米开发的一个大规模预训练语言模型，参数规模为64亿。相关页面显示，小米大模型在C-Eval榜单中排名第9、同参数量级排名第1，在CMMLU中文向大模型排名