懂制造业的大模型来了:创新奇智发布AInno-15B,产品矩阵首亮相

机器之心报道

作者:泽南

国内最大的「AI + 制造」玩家,把大模型应用带到了新高度。

上个星期,国内科技领域因为首批大模型公众服务落地而火爆。在大模型的工业应用一侧,也有重磅事件发生。

9 月 1 日,在北京举行的发布会上,创新奇智正式推出了「奇智孔明」工业大模型的整个产品矩阵。在活动中,一系列面向工业的生成式 AI 产品首次亮相,其中的不少已经具有了相当的实用性。

创新奇智发布了超过 150 亿参数量的工业大模型 AInno-15B,这是一款具有行业化、轻量化、多模态等特点,比以往「更懂制造业」的行业大模型。

围绕新款大模型,创新奇智构建了一系列应用,目标是在工业生产的各个环节实现基于生成式 AI 的自动化,包括「ChatRobot」生成式工业机器人任务编排应用、「ChatBI」生成式企业私域数据分析应用、「ChatDoc」生成式企业私域知识问答应用等,面向工场物流、数据分析、智造实训等领域。

实际落地效果,直接现场演示

在发布会现场,奇智孔明进行了一系列实际项目的演示。

首先是「ChatDoc」,它展示了大模型在专业领域的文本生成能力。打开奇智孔明的应用空间,我们就可以看到 Alnno-15B 大模型驱动的对话框。我们可以像使用 ChatGPT 一样直接询问构建实训平台的问题,从答案中来看它是有行业 know how 的,但仍然不够专业。

给大模型上传一份制造实训相关的数据文档,引擎可以自动进行处理。模型再训练后重新进行部署,我们就可以快速构建出一个 ChatDoc 应用。

再问一遍刚才的问题,输出的内容就专业、具体得多了,AI 不到一分钟就具备了制造实训的领域知识。

除此之外,大模型 ChatDoc 的应用也可以只用一行代码加入其他平台中,你也可以直接在对话框中上传其他专业文档,让大模型持续学习知识。

在工业环境中,大模型还在扮演生产管理者的角色。

面对大量、复杂的生产数据,我们只需要使用自然语言向「ChatBI」进行提问,大模型就能搜索数据,自动生成 SQL 语句归纳信息进行判断进行文字总结,并生成图表再进行可视化。

在这里,奇智孔明通过指令优化、专用数据训练等手段减少了大模型幻觉问题,让 text to SQL 输出的内容达到了生产力的标准。

接着,如果我们询问计划完成情况,AI 可以自动进行详尽的分析,生成表格和可视化展示。我们注意到其中的生产环节出现了一些问题,继续追问「SUV 每天的产量情况」,大模型生成了表格和分析,以折线图展示。

那么,为什么产量没有达标?ChatBI 会基于大模型思维链理解你的问题,在数据库中自动查询,再对结果进行分析生成回应,它从生产机械故障、零部件供应再到员工出勤等方面分析了问题,给出了一长段有理有据的答案。

现在大模型的前沿发展方向是「具身智能」,创新奇智还展示了使用「ChatRobot」让大模型控制工业机器人完成任务的方法。现场有一个机械臂,直接跟 ChatRobot 说:给我来一杯咖啡。

它就可以指挥工业机械臂在货架上寻找咖啡,自行设计路线把货物送到讲台上递给主持人。

「大模型在工业应用中的任务是充分理解人类意图后,将其生成为机器可执行的程序,最终完成复杂任务。目前,自动化产线的设备要经过联调、试产、陪产才能投入使用,未来的工业产线会进化到更高的自动化程度,」张发恩表示。「如果有一个大模型作为控制器把整个产线驱动起来,那么产线投入生产的速度就能快速提升。新的服务形式或许可以称为 LLM as a Controller。」

工业大模型,跑步进入应用阶段

创新奇智展示的能力,让我们看到了生成式 AI 重塑所有应用的未来是什么样子。

8 月 31 日,多家科技公司的大模型首批通过《生成式人工智能服务管理暂行办法》备案获得上线许可。文心一言等应用上线之后迅速登上了应用商店的榜首,人们纷纷开始尝试大模型的消费级应用。

在工业端,智能化升级同样是企业发展的必然需求,但大模型的应用一直存在数据隐私保护、行业知识、技术门槛等挑战。

技术发展之外,人们一直在试图解决应用层面的问题。8 月 23 日,OpenAI 提出了 GPT-3.5 Turbo,新工具发布后,企业客户可以通过对 GPT 大模型进行微调构建适用于自身业务的自定义模型,并自主地大规模运行它们。

新提出的可微调模型在保证大模型能力的同时,数据完全归客户所有,这一做法保证了客户数据的安全性和隐私性。

面对大模型落地的挑战,创新奇智的解决思路是:聚焦工业,在业内优秀开源大模型的基础上不断优化,构建适用于工业垂类的大模型,同时利用长期积累的工业数据知识进行增量训练。

今年 4 月,创新奇智宣布推出以工业预训练大模型为核心的 AIGC 引擎「奇智孔明」(AInnoGC),为多个细分行业带来了基于私域数据的 AI 生成能力。

相比几个月前,奇智孔明目前已经进入了更加接近于实用的阶段。在以制造业为主的垂类场景上,面向商业化需求进行了大量改进。

Alnno-15B 针对垂直行业数据进行了预训练并进行了知识蒸馏、SFT(一问一答的指令对齐)、RLHF(基于人类的反馈的强化学习)等优化,提供了指令数据、模型精调、模型服务、提示工程等功能与服务,可以助力企业打造专属大模型并加速生成式 AI 应用开发、调试、部署、落地。

「Alnno-15B 的 150 亿参数量是经过不断摸索、迭代多个版本设计出来的。我们尝试过多个不同参数量,在今天看来 15B 有最优的综合效果,它专注于工业知识的归纳生成能力,在部署时不需要耗费大量算力,同时对于知识的记忆、推理、自动化任务编排效果都还不错。长久来看,单位算力成本会降低,公司也在预研更大参数规模的工业大模型,以便进一步提升 AInnoGC 在工业领域的能力。」张发恩介绍道。

Alnno-15B 的具体性能如何呢?根据中国信通院《大规模预训练模型和应用评估方法:模型应用》的标准符合性验证中,在 39 个能力项测试中,该模型有 31 项是满分。

构建好大模型后,围绕其开发的工业平台被称为服务引擎,创新奇智提出了各类工业应用,其中也包括指令数据微调工具、模型部署、模型精调工具、提示工程工具等,可帮助企业基于自身需求对模型进行继续优化。

与此同时,创新奇智的大模型引擎具备了支持大规模并行计算,高可用的特性。

Alnno-15B 当前支持的多模态生成式 AI 应用包括:

ChatDoc:是一款面向企业服务的文本生成工具,可进行私域部署,具有智能总结、分析、答案溯源等能力,做到了简单易用。

ChatBI:是生成式企业私域数据分析应用,可以快速理解意图并关联大量关系数据库中的内容进行可视化展示,综合表现优于 GPT-3.5。

ChatRobot:是生成式工业机器人任务编排应用,可以用自然语言进行交互,让大模型自动编写代码驱动机器人执行任务。

自此,创新奇智构建了一套完整的可私有化部署模型、引擎和应用体系。

打造 AI 智能化产品矩阵

「我们正在不断验证,大模型在企业服务方向上是有前途的,」创新奇智 CTO 张发恩表示。

创新奇智已构建了包含感知智能「MMOC 人工智能技术平台」和生成式 AI「AInnoGC 工业大模型技术平台」的技术双塔,能够为客户提供完整的 AI 技术能力。其中,MMOC 平台提供传统的 AI1.0 技术能力,端到端支持 AI 解决方案创新、研发和交付,工业大模型支持文本 / 视觉 / 多模态内容生成,驱动 AI 2.0 应用和解决方案落地。

未来,该公司的技术栈还将沿着两大方向继续向前发展。

创新奇智一直深耕制造业领域。在国内 43 个工业大类中,其业务已覆盖了 8 个,包括钢铁冶金、面板半导体、3C 高科技、工程建筑、汽车装备、能源电力、食品饮料、新材料和智造实训。上周发布的中期业绩显示,创新奇智在 2023 上半年「AI + 制造」业务板块收入达 6.11 亿元,同比增长 81.3%,制造业营收占比提升至 66.1%。

而在 AI 领域的最前沿方向生成式 AI 上,基于 奇智孔明 AInnoGC 平台,创新奇智今年上半年已经完成了一些项目的交付。。

长期的实践和探索,让创新奇智在制造业 AI 的产品落地能力不断提升。

未来,创新奇智还将把生成式 AI 的应用范围拓展到更多领域,还有更多的场景,等待大模型来重构。