微调_标签_第一娱乐网

生活

用暂停token重新训练大模型，AI学会三思而后行

2023.10.15

梦晨发自凹非寺量子位 | 公众号 QbitAI让ChatGPT给出答案之前多想想步骤，就能提高准确率。那么能不能省去提示词，直接把这种能力内化在大模型里呢？CMU与谷歌团队的新研究，在训练大模型时加入暂停token来实现这一点。实验中，8项评测成绩提升，其中SQuAD的EM得分提高18%，CommonSenseQA提高8%，GSM8k中的推理任务也提高1%。研究者Jack Hack表示，自己不

生活

·“很多人认为大模型是工程问题，但事实上并不是。大模型里存在很多科学问题，比如智能涌现、复杂推理、知识融合以及学习策略等等。”·“大模型的平民化”，即最终要让应用大模型的每个人都觉得成本可以接受，包括微调、预训练、推理部署。复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏在外滩大会见解论坛。“现在的大模型比较耗资源，但总体而言它的资源消耗都集中在预训练阶段。除了算力需求大之外，很多人认为

生活

OpenAI：LLM能感知自己在被测试，为了通过会隐藏信息欺骗人类｜附应对措施

2023.09.09

新智元报道  编辑：润【新智元导读】OpenAI，纽大，牛津大学等研究人员发现，LLM能够感知自身所处的情景。研究人员通过实验可以提前预知和观察这种感知能力。AI发展到现在，到底是否具有了意识？按照这个研究中的说法，AI现在还不具备意识，但是已经有了意识的雏形。在未来的某一天，可能AI真的能像生物一样进化出全面的感知能力。然而，OpenAI和NYU，牛津大学的研究人员的一项新研

生活

1800亿参数，世界顶级开源大模型Falcon官宣！碾压LLaMA 2，性能直逼GPT-4

2023.09.09

新智元报道  编辑：桃子【新智元导读】一经发布，地表最强开源模型Falcon 180B直接霸榜HF。3.5万亿token训练，性能直接碾压Llama 2。一夜之间，世界最强开源大模型Falcon 180B引爆全网！1800亿参数，Falcon在3.5万亿token完成训练，直接登顶Hugging Face排行榜。基准测试中，Falcon 180B在推理、编码、熟练度和

生活

“OpenAI春晚”定档11月6日！“ChatGPT之父”预告将公布最新成果

2023.09.09

财联社9月7日讯（编辑赵昊）当地时间周三（9月6日），美国人工智能公司OpenAI在官网宣布，其将于2023年11月6日在旧金山举行公司的首届开发者大会“OpenAI DevDay”。据新闻稿介绍，“为期一天的活动将让来自全球各地的数百名开发人员与OpenAI团队聚集在一起，一同预览新工具并交流想法。现场与会者还可以参加由OpenAI技术人员主持的小组会议。”新闻稿补充称，现场参加活动的报名将在

生活

华为ADS 2.0实测！问界M5智驾版小巷穿梭：铁铲都能识别！

2023.09.08

华为ADS 2.0实测！问界M5智驾版小巷穿梭：铁铲都能识别！快科技9月7日消息，说起高阶辅助驾驶，目前国内位于头部的非华为和小鹏莫属，二者的能力互有伯仲，驾驶性格也有不同。搭载了高阶辅助驾驶系统的车辆也已量产上市，其中前者代表就是问界M5智驾版，用的是华为最新的ADS 2.0系统。那么它的实测表现到底如何呢？近日，有B站用户“浩哥Howell”展示了一些名场面。从拍摄的视频看，这台M5智驾版使用

生活

OpenAI开放大模型微调功能！上传自己数据就可定制GPT-3.5Turbo

2023.08.23

白交发自凹非寺量子位 | 公众号 QbitAI现在，GPT-3.5 Turbo支持自定义微调了！只需上传自己的数据，就可以运行专属的定制大模型。开发者狂喜！不少人惊呼：Awesome！早期测试表明，经过微调的GPT-3.5 Turbo版本在某些任务中甚至可以超越GPT-4。更新之余，OpenAI还直接明示了定价计划，微调费用主要分为初始训练费用和使用费用。一个具有10万tokens训练数据集的

生活

GPT-3.5 Turbo 推出微调功能，可打造专属的 ChatGPT 聊天机器人

2023.08.23

IT之家 8 月 23 日消息， OpenAI 在官网宣布，推出 GPT-3.5Turbo 微调功能并更新 API，使企业、开发人员可以使用自己的数据，结合业务用例构建专属 ChatGPT。OpenAI 声称，这样定制的模型可以在某些任务上达到或超过 GPT-4 的能力。该公司还表示，GPT-4 的微调功能将于今年秋天推出。OpenAI 公司在博客文章中写道：“自 GPT-3.