文/图 李钢 庄灏
在技术不断迭新、信息爆炸的时代,种类繁多的数据如潮水般涌来,我们如何高效利用工具“乘风破浪”,才不被海量数据所湮没?近日,国际质量科学院院士、香港工程师学会会士宗福季教授(见上图)作客珠江科学大讲堂第52讲,围绕“工业4.0、大数据、质量创新”作了专题科普报告。
大数据的作用越来越重要
宗福季说,在高容量、高速度、多种类的大数据中,做到实时捕捉信号,及时过滤噪声,掌握辨别信号和噪声能力的是分析大数据、应用大数据,是大数据环境下质量创新的关键。
随着质量和大数据的融合,大数据在质量管理尤其是宏观质量管理中将发挥着越来越重要的作用,当前质量管理已全面进入宏观管理,实行质量行政监督正在向聚焦系统性安全管控和防范的方面转变。抽查监测、风险预警、诚信管理等新老监管手段的有效性都越来越依赖于对质量大数据的收集、整理、分析的科学性,凭借质量大数据来实现科学管理将是未来的趋势,这需要通过大数据在消费者、企业、市场、政府之间建立连接的桥梁,采集大数据、分析大数据、应用大数据,进而提升质量管理水平。
工业生产面临不少数据难题
生产工序复杂,生产过程参数过多,数据量庞大,模型维度高,不同数据源的信息需要整合……这些都是工业生产中采集、分析数据所面临的挑战。
宗福季举例说明目前存在的业界问题:国内某航空企业制造的飞机惯性导航系统产品,由于制造和装配过程参数与产品质量水平的映射关系不明,无法精准预测产品最终装配后质量,导致最终装配的良品率无法提高,出现质量事故时无法立即追踪环节,也无法立即界定影响范围。
某半导体工业中数据驱动的制造过程监控,监控对象是玻璃面板的物理气相沉积成膜过程,由于数据过于繁多,虽然有海量实时数据,依然无法识别重要过程参数,难以对过程进行调控或提升,只能依赖最终检测,出现质量事故时也无法立即追踪哪个环节出了问题。
制衣工业也面临着分析数据的难题,某制衣工厂虽有完整的ERP系统和RFID系统,但是工序复杂、不同数据源需要整合导致建模难度高,制造前线供需、工时、报价的计划及管理,依然无法仅用系统数据预测建模,主要依赖人为判断。
要拥有提升质量的创新工具
宗福季认为,其实,采集数据、分析数据并不意味着问题的完全解决,帮助客户完成决策才是最终目的,为了实现数据的实际应用需要拥有提升质量的创新工具。
一为突破式创新,运用创意解决问题,首先要求要有同理心,需要以人为本的设计,通过观察、采访,发现用户深层次的需求,对问题重新做深入的定义,需要发散思维,提出众多解决方案,将一个好的创意点子用具体的原型来呈现,将原型通过情景模拟来测试可用性。
二为渐进式创新,运用统计思维解决问题不是从无到有,而是从好到更好,它不是从零开始,而是有数据作基础来创新,它是根据定义、测量、分析、改善、控制这个流程来做,它以严谨的数据驱动和以客户为中心的方法,采用系统方法提高绩效和减少对客户至关重要的缺陷。
工业大数据分析有层级之分
工业大数据分析实际上有层级之分。宗福季介绍说,在层级一中,只使用经验,不考虑数据。以京都的百年老店为例,他们代代相传,运用自己的经验,发扬工匠精神,将一个东西做到极致,也做得很好;层级二中,收集数据,只用纯数字呈现数据;层级三中,收集并整理数据,使用图表来展示数据,因为人们对于数字不太敏感,而将数据可视化能清晰明了地展示数据,更易被人接受;层级四中,收集调查数据并使用描述性统计量,描述性统计即是计算数据的均值、方差但没有对数据进行分析;层级五中,收集采样数据并使用描述性统计量;层级六中,收集采样数据并使用统计推断、预测。
“真正的分析,必须要做到统计推论和统计预测,要建立模型,要能够预测未来的事情,或者是描述推论,它里面的确定性、不确定性,都要进行分析,所以,描述性统计跟统计推论还是不同级别的事情。”宗福季强调。
随着大数据时代到来,采集数据的传感器价格越来越便宜,快速采集数据不成难事,如何使用实时的传感器数据并描述性地总结、可视化是工业大数据的第七层级,目前大部分的公司还停留在第七层级。
“第八层级是使用实时的传感器数据并建立统计模型,进行推断、预测并用于决策,这是大家都希望实现的。”
分析数据才能 更好地决策
宗福季认为,大数据是信息量丰富的资源,同时,分析数据才能指导人们更好地决策。
他指出,传统工具存在不足之处,比如基于采样,得到的是部分产品的信息,只能反映局部生产过程;缺少统一的数据与信息平台,质量数据难以共享与追踪;工具自动化程度低,依赖质量人员的大量参与与主观判断。所以,运用数据分析技术统计学习与机器学习很有必要,采集数据并建模,分析哪些特定的预测因子(X)实际影响了回应(Y),属于正相关还是负相关关系,简单的线性关系还是复杂关系。
如今,大数据发展迅猛,传感器数据到位,系统整合成为可能,系统整合之后才能进行分析,而这些分析又可以借助机器学习。
“以前做不到数据实时的收集,现在可以做得到。在数据分析、质量提升、质量控制等方面现在都有提升,以前可能只是停留在学术论文层面,现在技术到位了,以前的学术研究到实践应用时间周期比较长,而现在这个时间变得比较短了,一些学术研究可以很快得到应用。”
宗福季介绍,香港科技大学通过质量与数据分析实验提供技术支持,比如说数据融合、迁移学习、过程监控。数据融合指的是不同精度检测数据的融合,方针数据与实验数据的融合。迁移学习是指不同形状的三维打印产品误差的迁移建模,比如香港各个地铁站客流量的迁移预测。过程监控是指大规模复杂数据的统计监控与诊断,基于变量选择技术的高维数据统计监控、多元类别数据的统计过程控制。
“我今天讲的大数据是放在工业大数据的框架下,医疗大数据跟工业大数据非常不一样,工业大数据一定大有可为,但其实现在应用得不是很深。”宗福季认为。
其实收集数据前需要进行某种分析,虽然存储数据很便宜,可是不是因为便宜就把它存起来,尤其是工业大数据,你要有某种目的性,什么东西有用,什么东西有关,你才用,因为这涉及投资,所以你必须要在前期做一些分析才做,有目的性,还要做一些规划。宗福季建议,对于相对复杂的建模操作,企业主管应该学习掌握相关的专业知识或者找专门的技术人才负责。