在人工智能领域,AGI(Artificial General Intelligence,人工通用智能)无疑是极具有挑战性和吸引力的。在此浪潮之下,天泽智云也在系统性研究与布局工业AI,联合创始人李杰教授作为IAI全球带头人更是从战略高度思考未来与发展趋势,围绕工业AI的新可能为主题联动内部战略研讨,本文是李杰教授与团队的内部研讨过程,以文字形式展现供业界探讨参考。
——天泽智云联合创始人李杰(Jay Lee)教授与团队漫谈ChatGPT类通用智能对工业智能的启示
核心提要:
(资料图片)
1.通用的问答追求的或许是“海洋的可能性”,所以ChatGPT提供的答案目前看精密度不高,是“能用”(possible use),并不是“好用”(good use);而工业里更多需要“一条船的使用性”,ChatGPT在工业里目前或许只适合做“初选”。
2.工业需要的是能优化操作的生成式精密预训练模型OperationGPPT(Operation GenerativePrecision Pre-trained Transferable model),而不是生成式的预训练模型,其目的是要收敛到让运营管理的绩效不断提升,而非发散地问答。
3.操作的精密预训练模型OperationGPPT应该有三个特色:目的性,逻辑性,因果性。
4.ChatGPT值得借鉴的一个思路是,可以在工业里构建Connected AI(连接的智能)来协同作业,从而更快收敛到全局最优,来提质增效。
5.李杰教授在马里兰大学工业人工智能中心(Center for Industrial Artificial Intelligence,IAI Center)的最新研究动向:AI Data Foundry(工业智能数据工坊),工业智能作为一种通用量测(metrology)工具的实现,以及“One-day AI”。
这是一场来自内部的战略研讨和技术交流...
美国马里兰大学Clark Distinguished Professor
工业人工智能中心(IAI Center)创始主任
世界经济论坛全球未来先进制造与生产委员会成员
美国制造商协会(NAM)制造执行领导委员会理事会成员
MTConnect董事会成员
麦肯锡高级顾问
李教授,不知道您对于当前AGI(通用人工智能)在工业中的应用前景如何看呢?
AGI的应用主要还是针对有海量数据的、重复性的场景。ChatGPT给的答案只是是一个“初选”,不代表是一个“对选”。ChatGPT的问题是它的精密度不高。你自己去使用,会发现他很多错误,搜索三次,三次答案不一样。所以,它对我们来讲是一种帮你做初选的东西。工业界我们不希望太多的发散,希望收敛,ChatGPT基本上还是发散比较多,因为他答案会让你意外(surprise),是吧?但我们在工业界,答案不需要意外(surprise)。
那是不是说明,在工业界里面单纯强调生成式AI,其实这个思路本身就值得去再商榷呢?
对,因为它本身是预训练(pre-trained)的,所以你一定要有一些先验关系标签(prior relationshiplabel)。但是,在这种开源领域(open-sourceddomain)里面,比如搜索引擎(search engine),信息有很多冗余和噪声(garbage),所以它能够给你的答案会有很多可能性,反而对你没有帮助。生成式AI的根本问题,我觉得是一个“可用”跟“有用”的问题。ChatGPT提供的答案是可用,但不见得有用。
第二个,比如你(要ChatGPT)作一首诗,你一定不知道它会作什么诗,它是一个意外(surprise)。我们工业界,你不希望是意外(surprise),你希望是更聚焦更准。因为我们领域知识(domain)已经大概知道会有几个可能性,只是希望模型给我们做最准一点。我们会希望,越是专家,可能性越少,专家要给出更肯定的答案——“就这样就对了”。
不过不知道在美国有没有选择拥抱这类技术的工业的、制造业的公司,他们是怎么去应用这类技术,只是用它问答的能力吗?
因为ChatGPT这类应用是一个生成式的人工智能平台(generative AI platform),所以你可以用在几乎任何东西,只要是能够一直重复使用,重复相关性的组配,但是,不代表它有用。生成式的(generative)不代表配的是对的,而是说你越配越多的可能性,是“能用”(possibleuse),并不是“好用”(good use)。可是在工业界我们更要的是精密的生成式预训练模型(Generative Precision Pre-trained Transferable model),是“GPPT”,而不是“GPT”。这是我个人的看法了。
本质上还是海量资料的整合、总结。
对。比如我们一个学生,他用ChatGPT做作业,我们一看就看出来,为什么?因为他讲的都对,但不是我上课教的,没有用我上课的资料。我上课的资料不在ChatGPT里面。ChatGPT提供的是海洋式的可能性,但是工业我要的只是一条船的“使用性”。
这就是为什么说,工业智能如果通用化,不应单纯是一个语言的生成式模型,它应该是一个操作的精密模型。操作的生成式预训练模型(OperationGPPT)应该有三个特色:第一个是它的目的性,要产能最大,维护成本最低,这是优化的目标函数(objective function);第二个,它有它的逻辑性:什么时候该做什么,随工况(regime)变化而变化,它一定有是由某种操作逻辑决定的;第三个,很重要的,它有因果性,好跟坏、大跟小、高跟低,它一定有因果关系。
所以说,一个是ChatGPT,一个是OperationGPPT。对比起来(编者按:如下表所示),ChatGPT是发散的,然后工业是收敛的;ChatGPT通用的可能性是很多的,而对我们工业界,领域专有的精密性要高,等等。
表1AGI生成式预训练模型ChatGPT与IAI操作优化的精密模型OperationGPPT特性对比
ChatGPT | OperationGPPT |
发散的 | 收敛的 |
提供可能性 | 聚焦使用性 |
通用 | 精密 |
明白。确实,工业领域不同的目标和要求,决定了工业领域的通用智能形态和研究的方向也会有不同。另外,不知道李教授您在马里兰大学的工业智能中心(Center for Industrial Artificial Intelligence,IAI Center)现在有什么新的研究动向?
我们现在在学校做三个东西。
一个就是我们的“工业AI Data Foundry(工业智能数据工坊)”,我建了一个数据群,75组到100组的数据,包括以前的PHM(故障预测与健康管理)的数据竞赛(Data Challenge)的数据,我们希望训练学生用这些数据来增加工业AI的分析能力。比如说,我从齿轮做到发动机、做到医疗、做到半导体,学生做完信心就会增加。传统的人工智能科学(AIscience)只希望做一些数据量很大的问题,但真正工业界的AI不见得是数据量很大的问题。你要做有用的事情。
第二个,我要把工业智能建模的速度增快。我希望把工业AI变成一个量测(metrology)的观念,将工业AI变成一个很强的量测工具,可以用来量机器好坏、量制程好坏、量人健不健康,等等,让工业AI变成一个响应服务趋近模型(response service approximation),“RSA”。RSA是个元模型(meta-model),也是一个代理模型(surrogate model),它可以被用来量测输入和输出(input and output),去替代需要用很昂贵的仪器、算法计算的场景。所以,一个是新的定义,一个是新的做法。
第三个,我希望以后我们开发工业AI,能在一天之内开发完毕,叫 “One-day AI(一日智能)”,这是我的一个梦想。
其实刚刚说的,如何能快速构建模型,也是我们的模力工场产品现在努力演进完善的一个方向。其他不知道李教授您还有补充吗?
事实上,ChatGPT的观念可以用在这里:因为现在的AI模型是分散的,每个应用可能都有一个AI模型,它们之间没有串通在一起。参考ChatGPT的观念,以后这些模型完全可以是一个“Connected AI(连接的智能)”。ConnectedAI的好处是,它可能有很强的收敛性,要“快”跟“准”。
现在每个AI都是独立的一个智慧孤岛,它们之间没有连在一起。所以要ConnectedAI很重要,不是说只是更多的AI,更多的AI不见得有用的,而是要能够协同(coordinated)和合作的。譬如工厂里面有刀具的AI、冲压过程(stamping)的AI、工业机器人(robot)的AI,每个对象可能都有AI,但是基本上最后的目的还是一个质量问题、效率问题。
关键词: