深网|百川智能发布闭源大模型,王小川:公司估值将破10亿美元

深网|百川智能发布闭源大模型,王小川:公司估值将破10亿美元

腾讯新闻作者| 叶蓁王小川组建的百川智能今日宣布发布公司旗下第三款大模型产品——Baichuan-53B。据王小川介绍,Baichuan-53B定位闭源大模型,目前在写作、文本创作能力方面,已经达到行业最好的水平。据悉,百川智能已经发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。百川智能称,Baic

OpenAI危险了

OpenAI危险了

出品 | 虎嗅科技组作者 | 齐健编辑 | 廖影头图 | 《复仇者联盟3·无限战争》剧照8月7日,国内又一家AI创业公司发布了自己的开源且免费可商用的AI大模型:XVERSE-13B。这家名为元象XVERSE的公司,由前腾讯副总裁、腾讯AI lab创始人姚星创立。自从Meta在7月发布了开源可免费商用的LLaMA 2系列大模型,AI大模型

Meta硬刚OpenAI,国产“小模型”官宣开源,“百模大战”走向何方?

Meta硬刚OpenAI,国产“小模型”官宣开源,“百模大战”走向何方?

今年以来,全球互联网大厂掀起“百模大战”,微软、谷歌、百度、阿里等接连下场。经过半年多的竞争,科技巨头们围绕大模型生态正迎来新一轮道路之争:面对参数“天花板”,大模型的未来走向封闭还是开放?开源模型可在家用电脑运行8月3日,国内AI开发者社区“魔搭”(ModelScope)上架两款开源模型Qwen-7B和Qwen-7B-Chat,分别为阿里云通义千问的70亿参数通用模型和对话模型,两款模型均开源、

风辞远的科技茶屋:来自未来的信号枪

风辞远的科技茶屋:来自未来的信号枪

很久之前,有位朋友问我,现在科技资讯这么发达了,你们还写啊写做什么呢?我是这么看的。最终能够凝结为资讯的那个新闻点,其实是一系列事情最终得出的结果,而这个结果又会带来更多新的结果。其中这些“得出”与“带来”的过程,都是藏在资讯之后的,是隐身的、暧昧的。如果我们仅仅希望知道个大概,对科技内容的预期仅仅是三五知己闲谈时当个佐料,那么发达的资讯当然足够。但如果你希望以科技为学业、为事业,使之成为自己能够

开源大模型领域最重要的玩家们,在关心/担心什么

开源大模型领域最重要的玩家们,在关心/担心什么

开源模型与闭源模型,正成为两股并行的力量。从 2 月份 Meta 发布的 Llama,到 3 月份斯坦福大学微调 Llama 后发布的 Alpaca,再到 5 月份出现的 Falcon,世界各地的开源模型在「内卷」中快速进步。7 月 18 日,Llama2 的出现,更是直接让大模型的竞争格局变天了。开源模型作为大模型领域的「地板」,Llama2 开源且有条件地开放了商业使用后,很多「水平有限」的大

大模型应用,必须警惕“速成幻觉”

大模型应用,必须警惕“速成幻觉”

我们知道,大模型会编造不正确的答案,产生“幻觉”。其实,在应用层面,还存在一个更隐蔽的“幻觉”,就是创业公司忽略了大模型落地所需要的长周期、重基建和工程化难度,带来的“速成幻觉”。随着“百模大战”拉开序幕,大模型过剩带来的市场挤压,也给整个大模型生态带来了行业洗牌的风险。越来越多的人有了共识,基础通用大模型竞争激烈,注定是少数人的游戏。创业公司随时可能倒掉,造成项目烂尾。具备技术、产品和行业优势的

大模型,开源干不掉闭源

大模型,开源干不掉闭源

开源大模型对闭源大模型的冲击,变得非常猛烈。今年3月,Meta发布了Llama(羊驼),很快成为AI社区内最强大的开源大模型,也是许多模型的基座模型。有人戏称,当前的大模型集群,就是一堆各种花色的“羊驼”。而就在前些天,Meta又推出了免费可商用版本的“羊驼2号”——Llama2,据说性能比肩GPT-3.5。这在整个大模型圈都是非常炸裂的。我们知道,各个互联网、科技公司都在竞相训练、推出自己的大模

开源,会是对手打败 ChatGPT 的绝招吗?

开源,会是对手打败 ChatGPT 的绝招吗?

周二,Meta 发布了最新一代的开源大语言模型 Llama 2。与 Meta 在 2 月发布的第一代大模型 Llama 1 相比,Llama 2 在许多方面得到提升,比如训练数据比 Llama 1 多了 40%、训练所用的 token 翻了一倍,增加至 2 万亿、上下文长度限制也翻了一倍……总而言之,就是 Llama 变得更强了。不过,使整个行业震惊的不是 Llama 2 的强大——当然,它足够强