研究发现 ChatGPT 可在七分钟内开发出软件,平均成本不到 1 美元

研究发现 ChatGPT 可在七分钟内开发出软件,平均成本不到 1 美元

IT之家 9 月 12 日消息,一项新的研究表明,像 OpenAI 的 ChatGPT 这样的人工智能聊天机器人可以以快速、经济高效的方式运营一家软件公司,同时将人为干预降至最低。在最近的研究中,来自布朗大学和多所中国大学的研究团队进行了一个实验,探究是否可以用 ChatGPT 的 3.5 版本的语言模型来驱动的人工智能机器人,在没有事先训练的情况下完成软件开发过程。为了测试这一点,研究者创建了一

大模型为啥这么慢,原来是想多了:新方向是和人一样的思维算法

大模型为啥这么慢,原来是想多了:新方向是和人一样的思维算法

机器之心报道编辑:Panda组合人类推理之精妙与算法方法之精准,思维算法可助力 LLM 解决复杂问题。人类直觉是一种常被 AI 研究者忽视的能力,但其精妙程度连我们自身也没有彻底理解。弗吉尼亚理工大学和微软的一个研究团队在近日的一篇论文中提出了思维算法(AoT),其组合了直觉能力与算法方法的条理性,从而能在保证 LLM 性能的同时极大节省成本。大型语言模型近来发展速度很快,其在解决一般问题、生成代

10万美元+26天,一个低成本千亿参数LLM就诞生了

10万美元+26天,一个低成本千亿参数LLM就诞生了

机器之心报道编辑:Panda W训练一个 GPT 那样的千亿参数规模的大型语言模型需要多少钱和时间?北京智源人工智能研究院和中国科学院计算技术研究所等多所机构近日的一项研究发现可以用 10 万美元在 26 天内训练出一个有 1010 亿参数的 LLM;不仅如此,他们还在这项研究中提出了一种用于评估 LLM 的智商(IQ)的基准,可基于事实性知识之外的四个新方面对 LLM 的智能水平进行更为全面的评

GPT-4:我写的代码你敢用吗?研究表明其API误用率超过62%

GPT-4:我写的代码你敢用吗?研究表明其API误用率超过62%

机器之心报道编辑:Panda W现在,已经有不少软件开发者在开发软件时让大型语言模型当助手了,但最新的一项研究发出了警示:使用 LLM 反馈的代码时一定要慎重!根据这项研究新提出的评估框架 RobustAPI,如果不在 prompt 中提供演示示例,GPT-4 的 Java API 误用率超过 62%;而即使提供一个正确的演示示例,整体 API 误用率也接近 50%。语言建模的新时代已经到来,大型

判断人工智能是否有意识:科学家提出14条​标准 | 环球科学要闻

判断人工智能是否有意识:科学家提出14条​标准 | 环球科学要闻

· 人工智能·判断人工智能是否有意识:科学家提出14条标准当下或以后的人工智能是否拥有意识,是一个公众和科学界都日益关注的话题。近日,一个由19位计算机科学家、神经科学家和哲学家组成的研究团队在一篇预印本论文(未经同行评审)中,基于一些人类意识理论,提出了14项标准以判断人工智能是否有意识。在该论文中,研究者通过目前最可靠的一些神经科学理论评估现有的人工智能系统——包括循环处理理论(re

DeepMind新研究:ReST让大模型与人类偏好对齐,比在线RLHF更有效

DeepMind新研究:ReST让大模型与人类偏好对齐,比在线RLHF更有效

机器之心报道编辑:陈萍、小舟本文提出了一种新的RLHF算法ReST,极大地提高了翻译质量。这几个月以来,我们已经见证了大型语言模型(LLM)在生成高质量文本和解决众多语言任务方面出色的能力。然而,LLM 又面临这样一个困境,即产生的输出很大程度上与人类偏好并不一致。如果没有适当的对齐,语言模型可能输出不安全的内容。此外,对齐 LLM 还有助于改善下游任务。有研究者提出基于人类反馈的强化学习 (RL

AI能为科学研究做什么

AI能为科学研究做什么

陈永伟/文从蛋白质的结构说起在生命过程中,蛋白质扮演着十分重要的角色。一方面,它是生物体的构造师,小到一个细胞,大到各种器官,都需要由蛋白质来构造。另一方面,它还是很多生命活动的重要参与者,无论是在生物体内进行物质传输、对各种生化过程进行催化,还是对来自体外的侵袭进行抵抗,都离不开蛋白质的参与。目前,人类已知的蛋白质达到了两亿多种,每一种蛋白质的三维结构都不相同,而它们的功能差异就是由这些不同的结

智能体的「一方有难八方支援」,一种分布式AI计算新范式诞生了

智能体的「一方有难八方支援」,一种分布式AI计算新范式诞生了

机器之心报道编辑:蛋酱、杜伟最近大型语言模型(LLM)的成功促使越来越多的人探索通过它解决各种复杂的任务,其中 LLM 增强的自主 agent(LAA)尤为引人瞩目。LLA 将 LLM 的智能扩展到了顺序动作执行中,在通过收集观察结果与环境交互并解决复杂任务方面展现出了优越性能。这类代表性工作有 BabyAGI、AutoGPT3、ReAct、Langchain 等。但这些探索可能还不够,主要在以下