10人俩月搞出大模型!一年16篇顶会论文加持:市面上做得好的都没开源

10人俩月搞出大模型!一年16篇顶会论文加持:市面上做得好的都没开源

衡宇 发自 凹非寺量子位 | 公众号 QbitAI一家今年5月份成立在深圳的公司,团队至今不到10人。他们要做的却不是小事:挑战AGI。底气在哪?一看过往履历,二看现在赛道的成绩。这几个人近一年中,累计在CVPR、ICML、ECCV等顶会上发表16篇大模型相关论文,其中一篇还拿下了顶会ACL 2023的最佳论文提名。创业后的成绩如何?成立两个月后,所训模型杀入C-Eval榜单前三,中文能力击败Ch

AI驱动阿里新一代管理层?

AI驱动阿里新一代管理层?

阿里巴巴顺利完成管理职务交接。9月10日,阿里巴巴集团原执行副主席、现董事会主席蔡崇信发布全员信,表示已在当日按计划完成集团管理职务交接,由他接替张勇担任集团董事会主席职务,吴泳铭出任集团首席执行官。9月11日,阿里巴巴集团又宣布吴泳铭还将接替张勇出任阿里云智能集团代理董事长兼CEO。9月12日,吴泳铭发布全员信,宣布确立两大战略重心:用户为先、AI驱动。在此基础上,阿里巴巴将对三类业务加大战略性

大模型的春天,与百度的答卷

大模型的春天,与百度的答卷

2023年,国内大模型领域人声鼎沸。不过外行看热闹,内行看门道,面对大模型的诱惑,许多创业者持谨慎态度,比如零假设科技CEO顾飞。“大概三个月前,我们还是不太信任国内大模型。但是差不多在两个月之前,我们又试了一次百度的大模型,比想象要好很多。”顾飞回忆道。零假设科技主要是为医疗专业人士,提供自动化的医学内容检索、分析和生成工具。此前,医学领域的产品的准确性和易用性很难两全,大模型出现后,顾飞看到了

创业公司,如何做好AI?

创业公司,如何做好AI?

内容来源:2023年7月8日,杭州AIGC 赋能商业 & 视频号峰会。分享嘉宾:新加坡国立大学中文EMBA校友,Castbox创始人。高级笔记达人 | 天朗明月责编 | 金木研第 7690 篇深度好文:11015 字 | 23分钟阅读商业思维笔记君说:本次会议主要介绍了创业公司如何应用最新的AI模型,包括生成式AI技术和应用方向。其中,可控

5T算力BPU x 14亿参数LLM,地平线旭日3成功部署大语言模型

5T算力BPU x 14亿参数LLM,地平线旭日3成功部署大语言模型

摘要:近日,地平线成功在旭日3中的BPU®计算单元上,部署运行参数规模高达14亿的大语言模型(Large Language Model , LLM)。这不仅是业界在端侧成功部署大模型的一次突破性实践,更验证了BPU®对先进神经网络算法的高效支持,为大模型在端侧实现产品级应用拓展了更广阔的想象空间。近日,地平线成功在旭日3中的BPU®计算单元上,部署运行参数规模高达14亿的大语言模型(Large L

张勇卸任,攒下10亿美金

张勇卸任,攒下10亿美金

题图来源:视觉中国记者丨何己派 编辑丨鄢子为新人登场。9月12日,阿里CEO吴泳铭发布上任后首份全员信。旧人离去。两日前,阿里宣布,张勇辞职,卸任阿里云董事长和CEO。事发突然,若按两个月多前的公告,他卸下集团董事局主席、CEO职位后,要all in阿里云。一度身兼四职的张勇,如今仅剩“阿里合伙人”一个头衔。“业务不行,就得换人换思路,不管之前有多大的功劳苦劳。”海豚智库电商战略分析师李成东向《2

英伟达GH200首次亮相AI性能基准评测,比H100性能提升17%

英伟达GH200首次亮相AI性能基准评测,比H100性能提升17%

划重点:当地时间9月11日,推出不到两个月的英伟达GH200 Grace Hopper超级芯片首次亮相MLPerf行业基准测试。在此次测试中,具有更高的内存带宽和更大的内存容量的GH200与H100 GPU相比,性能高出17%。Grace Hopper与DGX H100 SXM在MLPerf推理数据中心性能结果的比较。来源:英伟达在新闻发布会上,英伟达人工智能总监戴夫·萨尔瓦托(Dave Salv

大模型“全家桶”升级,企业怎么“啃”?

大模型“全家桶”升级,企业怎么“啃”?

每经记者:石普宁    每经编辑:唐元半年前,也许你身边只有“技术大牛”在研究大模型,而现在,经历了一波担心被AI替代的打工人,已经学会与之“共存”,并让自己更靠近大模型。而这种靠近的基础,在于企业的“百模大战”已来到一定的层级。上个月底,多家公司表示旗下的国产大模型产品向全社会开放。而这距离国内较早的大模型产品公开发布还不到半年,大模型发展速度有着迅雷不及