云从科技从容大模型在benchmark COCO上刷新世界纪录 大幅降低AI应用成本

云从科技从容大模型在benchmark COCO上刷新世界纪录 大幅降低AI应用成本

近日,云从科技从容大模型在视觉领域再次取得重要进展,基于视觉基础大模型的目标检测器在检测领域著名benchmark COCO数据集上从微软研究院(MSR)、上海人工智能实验室、智源人工智能研究院等多家知名企业与研究机构脱颖而出,刷新了世界纪录。云从科技从容大模型在COCO测试集上平均精度(以下简称mAP,mean Average Precision)达到0.662,位列榜单第一(见下图)。在验证集

半年多过去了,ChatGPT的排名快“垫底”了?

半年多过去了,ChatGPT的排名快“垫底”了?

出品|三言Pro今天,笔者无意中刷到一张图片。据该图片显示,OpenAI的GPT-4在11个大模型中(第一名序号为0),已经排到了最后。还有网友配上了“GPT4:我的冤屈怎么诉?”的字样。这不禁让人好奇,今年年初,ChatGPT爆火以后,其他公司才开始提大模型的概念。这才半年多,GPT就已经“垫底”了?于是,笔者想看看GPT排名到底咋样了。测试时间不同测试团队不同GPT-4排第十一从前文中图片上显

作业帮发布教育领域银河大模型:支持AI解题、多语言AI问答

作业帮发布教育领域银河大模型:支持AI解题、多语言AI问答

快科技9月4日消息,作业帮最近在2023中国国际服务贸易交易会上正式发布了自研银河大模型。据了解,银河大模型支持AI解题、多语言AI问答等能力,号称精通诗词字句和课文常识;并支持AI写作功能,可用于提高写作技巧、优化写作结构,并提供文章润色、语法纠错和创意启发等场景。在测评基准上,作业帮银河大模型表现卓越,以平均分73.7分位居C-Eval榜首。同时在CMMLU榜单Five-shot和Zero-s

程一笑督阵 快手推“快意”杀入大模型战

程一笑督阵 快手推“快意”杀入大模型战

《科创板日报》8月21日讯(记者 张洋洋) 快手“老铁”们离AGI又近了一步。今日,快手方面向《科创板日报》记者确认,快手的大模型“快意”(KwaiYii)已经开始内测,包括为业务团队提供标准API和定制化项目合作方案等。快手方面此前并未对“快意”大模型具体信息进行过多阐述,该大模型更多是因出现在AI综合中文评估基准CMMLU的榜单中,而引发市场关注和讨论。根据CMMLU页面的介绍,“快意”为快手

CMMLU中文向排名第一!快手自研AI也来了

CMMLU中文向排名第一!快手自研AI也来了

近一段时间,国内生成式人工智能模型的推出可谓是你方唱罢我登台,好不热闹。快科技8月21日消息,近日,快手的自研大模型“快意”(KuaiYii)已经出现在了AI综合中文评估基准CMMLU的榜单中。截至本文成稿,该模型的13B版本KwaiYii-13B同时位列five-shot和zero-shot项目下的中文向第一名,在人文学科、中国特定主题等方面较强,平均分超61分。而根据快意在GitHub页面给出

小米大模型,该“交卷”了

小米大模型,该“交卷”了

距4月14日雷军官宣杀入大模型不到4个月,小米大模型终于首次曝光,并交出了一份初步成绩单。多方消息显示,小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。根据GitHub项目页给出的信息,MiLM-6B(下称:小米大模型)是由小米开发的一个大规模预训练语言模型,参数规模为64亿。相关页面显示,小米大模型在C-Eval榜单中排名第9、同参数量级排名第1,在CMMLU中文向大模型排名