小米AI大模型MiLM-6B：64亿参数，C-Eval总榜排名第10_生活

小米AI大模型MiLM-6B：64亿参数，C-Eval总榜排名第10

2023.08.14 21:40
0.04k

出品 | OSC开源社区（ID：oschina2013)

小米 AI 大模型 MiLM-6B 首次曝光。

MiLM-6B 是由小米开发的一个大规模预训练语言模型，参数规模为 64 亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。

根据 C-Eval 给出的信息，MiLM-6B 模型在具体各科目成绩上，在 STEM（科学、技术、工程和数学教育）全部 20 个科目中，计量师、物理、化学、生物等多个项目获得了较高的准确率。

据悉，MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度，不过在 “法学、数学、编程、概率论、离散数学” 等涉及 “抽象思维” 的科目中，还有一定进步空间。

在 10 个 “社会科学” 测试科目中，除 “教育学和地理” 外，该模型在其他 8 个科目中都获得了较为理想的准确率。在人文科学的 11 个科目中，MiLM-6B 则在 “历史与法律” 基础上有着不错的准确率表现。

虽然小米 AI 大模型 MiLM-6B 当下才首次曝光，不过完成度已经较高，在未来该模型可能会被用于小米旗下 “小爱同学” 等虚拟助理服务中。

相关链接：https://github.com/XiaoMi/MiLM-6B

END

MySQL VS PostgreSQL 谁是世界第一？

这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得关注✔ 标星⭐ 哦

标签: 科目 MiLM Eval 模型 AI CMMLU 开源小米离散数学准确率数学 OSC 曝光 6B 上均 STEM ID

免责声明:凡本网站发布的文章、图片、音频、视频等内容所表述的观点和立场不代表本网站的观点和立场，若对该观点或立场有疑义或异议，请及时用电子邮件或电话通知我们，以迅速采取适当措施，避免给双方造成不必要的经济损失。凡本网站发布的所有文章、图片、音频、视频文件等资料的版权归版权所有人所有，本站采用的非本站原创文章及图片等内容无法一一和版权者联系，如果本网所选内容的文章作者及编辑认为其作品不宜上网供大家浏览，或不应无偿使用，请及时用电子邮件或电话通知我们，以迅速采取适当措施，避免给双方造成不必要的经济损失。