1.引言
隨著原材料、能源價(jià)格上升以及市場(chǎng)競(jìng)爭(zhēng)日益激烈,企業(yè)對(duì)于其產(chǎn)品質(zhì)量的要求越來(lái)越高。質(zhì)量控制的傳統(tǒng)方法是對(duì)產(chǎn)品進(jìn)行人工檢驗(yàn),這種方法耗時(shí)耗力,并且含有由主觀因素引起的不確定性。同時(shí),由于是事后的離線檢驗(yàn),當(dāng)發(fā)現(xiàn)產(chǎn)品質(zhì)量出現(xiàn)問(wèn)題后再對(duì)生產(chǎn)過(guò)程進(jìn)行調(diào)整時(shí),已經(jīng)造成了大量的生產(chǎn)浪費(fèi)。
統(tǒng)計(jì)質(zhì)量控制(Statistical Quality Control)是過(guò)去二十年來(lái)在國(guó)內(nèi)外企業(yè)廣泛采用的另一種較為先進(jìn)的質(zhì)量控制方法,它是用頻率分布、控制圖、顯著性檢驗(yàn)等統(tǒng)計(jì)技術(shù)進(jìn)行質(zhì)量控制,其特點(diǎn)是找出影響工序的關(guān)鍵因素,采取措施進(jìn)行生產(chǎn)控制,減少產(chǎn)品質(zhì)量波動(dòng),達(dá)到提高產(chǎn)品質(zhì)量的目的[1]。但是由于制造質(zhì)量的分散和無(wú)序從而大大降低了統(tǒng)計(jì)分析的可實(shí)施性和可靠性[2]等原因,在企業(yè)的實(shí)際質(zhì)量活動(dòng)中應(yīng)用還存在困難。
生產(chǎn)質(zhì)量控制是利用生產(chǎn)過(guò)程的動(dòng)態(tài)信息進(jìn)行質(zhì)量預(yù)測(cè)和質(zhì)量控制。由于其實(shí)時(shí)性和較高的準(zhǔn)確性,可以預(yù)估質(zhì)量問(wèn)題,從而降低企業(yè)的生產(chǎn)成本和經(jīng)濟(jì)損失。生產(chǎn)質(zhì)量控制的基礎(chǔ)是生產(chǎn)過(guò)程的質(zhì)量預(yù)測(cè),因?yàn)橹挥袑?duì)未來(lái)質(zhì)量參數(shù)進(jìn)行估計(jì),才能在產(chǎn)品質(zhì)量發(fā)生問(wèn)題前提前調(diào)整生產(chǎn)過(guò)程,真正達(dá)到提高產(chǎn)品質(zhì)量的目的。進(jìn)行質(zhì)量預(yù)測(cè)的手段是建立生產(chǎn)過(guò)程的質(zhì)量模型,即以各種決定產(chǎn)品質(zhì)量的變量為輸入,以產(chǎn)品各質(zhì)量指標(biāo)為輸出的數(shù)學(xué)模型[3]。但由于影響因素較多而導(dǎo)致機(jī)理建模困難等原因,質(zhì)量模型的建立比一般用于自動(dòng)控制的對(duì)象建模更為困難。
數(shù)據(jù)挖掘是一類(lèi)從大量數(shù)據(jù)中自動(dòng)尋找規(guī)律的方法,在過(guò)去二十年中得到了大量的研究。數(shù)據(jù)挖掘方法的特點(diǎn)是能從大量的數(shù)據(jù)中自動(dòng)分析并提取未知的、潛在有用的知識(shí),因此可用于建立復(fù)雜系統(tǒng)的行為建模和行為預(yù)測(cè)。傳統(tǒng)的數(shù)據(jù)挖掘應(yīng)用通常只處理靜態(tài)的數(shù)據(jù),即不包含時(shí)間信息的數(shù)據(jù)。但當(dāng)將數(shù)據(jù)挖掘方法用于建立生產(chǎn)過(guò)程的質(zhì)量模型時(shí),由于傳感器對(duì)生產(chǎn)過(guò)程不斷采樣的原因,獲得的生產(chǎn)歷史數(shù)據(jù)通常都是時(shí)間序列,即歷史數(shù)據(jù)是和時(shí)間相關(guān)的一系列值,因此通常用于處理靜態(tài)數(shù)據(jù)的數(shù)據(jù)挖掘方法不能直接應(yīng)用于生產(chǎn)過(guò)程質(zhì)量預(yù)測(cè)模型的挖掘。
我們將從海量時(shí)間序列數(shù)據(jù)中尋找規(guī)律的數(shù)據(jù)挖掘方法稱(chēng)為動(dòng)態(tài)數(shù)據(jù)挖掘。將動(dòng)態(tài)數(shù)據(jù)挖掘的方法應(yīng)用于生產(chǎn)質(zhì)量控制時(shí),主要的目標(biāo)有兩個(gè):(1)通過(guò)對(duì)生產(chǎn)過(guò)程歷史記錄的數(shù)據(jù)挖掘,建立產(chǎn)品質(zhì)量預(yù)測(cè)模型,并運(yùn)用于生產(chǎn)過(guò)程,進(jìn)行實(shí)時(shí)質(zhì)量預(yù)測(cè);(2)在產(chǎn)品質(zhì)量出現(xiàn)問(wèn)題后,利用對(duì)歷史數(shù)據(jù)的挖掘分析生產(chǎn)工藝對(duì)產(chǎn)品質(zhì)量的影響,找出隱藏的生產(chǎn)規(guī)律,為企業(yè)改進(jìn)工藝提供決策支持。
本文以鋼鐵生產(chǎn)過(guò)程為背景,闡述用于生產(chǎn)質(zhì)量控制的動(dòng)態(tài)數(shù)據(jù)挖掘方法。并以寶鋼的連鑄生產(chǎn)過(guò)程為例,介紹了這種方法在實(shí)際中的應(yīng)用。
2.問(wèn)題描述
我們將面向質(zhì)量控制的動(dòng)態(tài)數(shù)據(jù)挖掘定義為以下過(guò)程:
設(shè)生產(chǎn)過(guò)程P具有n個(gè)可測(cè)的工藝參數(shù)x1,x2,L,xn。不失一般性設(shè)這些工藝參數(shù)均為時(shí)間的函數(shù),且其取值可以是以下3種數(shù)據(jù)類(lèi)型之一:
(1)數(shù)值型,即該工藝參數(shù)的測(cè)量值為一實(shí)數(shù)(如高爐的爐頂溫度或壓力參數(shù))或整數(shù)(如軋制的道數(shù));
(2)枚舉型,即該工藝參數(shù)的測(cè)量值為給定集合中的一個(gè)元素(如熱軋鋼板的鋼種);
(3)邏輯型,即該工藝參數(shù)的測(cè)量值可表達(dá)為“是”或“否”二者之一(如某種原料成分是否存在)。
設(shè)上述任一工藝參數(shù)xi從t時(shí)刻開(kāi)始的測(cè)量值已知,且可表達(dá)為周期為△ti的ni個(gè)采樣值的時(shí)間序列,即:
xi(t)={xi(t+△ti),xi(t+2△ti),...,xi(t+ni△ti)} (1)
其中任一采樣值可能帶有分布已知或未知的測(cè)量噪聲。
再設(shè)生產(chǎn)過(guò)程P具有m個(gè)可測(cè)的產(chǎn)品質(zhì)量指標(biāo)y1,y2,L,ym。不失一般性設(shè)這些質(zhì)量指標(biāo)均為時(shí)間的函數(shù),且其取值與上述工藝參數(shù)類(lèi)似,可以是數(shù)值型、枚舉型、邏輯型等3種數(shù)據(jù)類(lèi)型之一。
設(shè)上述任一產(chǎn)品質(zhì)量指標(biāo)yj從t時(shí)刻開(kāi)始的測(cè)量值已知,且可表達(dá)為周期為△Tj的mj個(gè)采樣值的時(shí)間序列,即:
yj(t)={yj(t+△Tj),yj(t+2△Tj),...,yj(t+mj△Tj)} (2)
本文所研究的面向質(zhì)量控制的動(dòng)態(tài)數(shù)據(jù)挖掘可表達(dá)為以下兩種類(lèi)型問(wèn)題的求解過(guò)程:
2.1 質(zhì)量預(yù)測(cè)問(wèn)題
給定工藝參數(shù)x1,x2,...xn從t時(shí)刻開(kāi)始的測(cè)量值時(shí)間序列歷史記錄,和產(chǎn)品質(zhì)量指標(biāo)y1,y2,L,ym從t時(shí)刻開(kāi)始的測(cè)量值時(shí)間序列歷史記錄
,求解質(zhì)量預(yù)測(cè)模型
(3)
其中為工藝參數(shù)
在t時(shí)刻的測(cè)量值向量,
為質(zhì)量指標(biāo)
在t時(shí)刻的估計(jì)值向量。
因此,數(shù)據(jù)挖掘的目標(biāo)是根據(jù)工藝參數(shù)和質(zhì)量指標(biāo)的測(cè)量值時(shí)間序列歷史記錄和
建立質(zhì)量預(yù)測(cè)模型。該模型可以在線使用,也可以離線使用。在線使用時(shí),根據(jù)工藝參數(shù)
的測(cè)量值可實(shí)時(shí)預(yù)測(cè)生產(chǎn)過(guò)程質(zhì)量指標(biāo),從而進(jìn)行質(zhì)量控制。離線使用時(shí),可以根據(jù)工藝參數(shù)
的設(shè)計(jì)值進(jìn)行工藝設(shè)計(jì)驗(yàn)證,即將新的工藝參數(shù)設(shè)計(jì)值輸入質(zhì)量模型,驗(yàn)證是否會(huì)導(dǎo)致質(zhì)量問(wèn)題。
2.2 質(zhì)量分析問(wèn)題
給定工藝參數(shù)從t時(shí)刻開(kāi)始的測(cè)量值時(shí)間序列歷史記錄
,和產(chǎn)品質(zhì)量指標(biāo)
從t時(shí)刻開(kāi)始的測(cè)量值時(shí)間序列歷史記錄
,求解質(zhì)量關(guān)聯(lián)模型:
(4)
其中是質(zhì)量指標(biāo)yj在出現(xiàn)問(wèn)題的
時(shí)刻的測(cè)量值,
是邏輯值,表示工藝參數(shù)
是否與質(zhì)量指標(biāo)yj出現(xiàn)問(wèn)題有關(guān)。
因此,數(shù)據(jù)挖掘的目標(biāo)是根據(jù)工藝參數(shù)和質(zhì)量指標(biāo)的測(cè)量值時(shí)間序列歷史記錄和
建立質(zhì)量關(guān)聯(lián)模型。質(zhì)量分析是一種離線應(yīng)用。在發(fā)生質(zhì)量事故后,根據(jù)質(zhì)量指標(biāo)yj在出現(xiàn)問(wèn)題的
時(shí)刻的測(cè)量值
,可以判斷哪幾個(gè)工藝參數(shù)
和質(zhì)量問(wèn)題有關(guān),為分析事故發(fā)生原因從而改進(jìn)生產(chǎn)工藝提供決策支持。
3. 面向質(zhì)量控制的動(dòng)態(tài)數(shù)據(jù)挖掘方法
3.1 數(shù)據(jù)歸整(Data coordination)
與靜態(tài)數(shù)據(jù)的挖掘不同,對(duì)多個(gè)時(shí)間序列進(jìn)行動(dòng)態(tài)數(shù)據(jù)挖掘時(shí),需要解決的第一個(gè)問(wèn)題是數(shù)據(jù)歸整。所謂數(shù)據(jù)歸整,指的是將多個(gè)時(shí)間序列的數(shù)據(jù)進(jìn)行調(diào)整,使它們符合時(shí)間、空間上的相關(guān)性,因?yàn)閷?duì)某一挖掘結(jié)果有影響的可能是不同時(shí)間序列在不同時(shí)刻的值。
以鋼鐵生產(chǎn)過(guò)程為例,其內(nèi)部的生產(chǎn)流程可以分為連續(xù)型過(guò)程(如連續(xù)退火過(guò)程)和批量型過(guò)程(如高爐煉鐵過(guò)程)兩大類(lèi)。連續(xù)型生產(chǎn)過(guò)程的特點(diǎn)是:原料連續(xù)經(jīng)過(guò)生產(chǎn)線各工藝裝置處理后成為產(chǎn)品,各工藝裝置操作參數(shù)的設(shè)計(jì)值為定值。以熱鍍鋅連續(xù)退火過(guò)程為例,帶鋼依次進(jìn)入連續(xù)退火機(jī)組的預(yù)熱段、均熱段、緩冷段和快冷段,各段的設(shè)定溫度均為定值。
批量型生產(chǎn)過(guò)程的特點(diǎn)是:?jiǎn)闻a(chǎn)品在同一工藝裝置中,一般要經(jīng)歷多個(gè)加工處理時(shí)段,因此通常其各個(gè)操作參數(shù)的設(shè)計(jì)值在生產(chǎn)過(guò)程的不同時(shí)段取不同的值。以轉(zhuǎn)爐煉鋼過(guò)程為例,鐵水在轉(zhuǎn)爐中經(jīng)過(guò)吹氧、排渣、加炭等階段,每個(gè)階段都有不同的工藝參數(shù)設(shè)計(jì)值。
由于上述兩類(lèi)生產(chǎn)過(guò)程的不同特點(diǎn),在數(shù)據(jù)歸整時(shí)必須采用不同的處理方法。下面分別加以闡述。
3.1.1 批量型過(guò)程的數(shù)據(jù)歸整
對(duì)于批量型生產(chǎn)過(guò)程,由于單批產(chǎn)品的質(zhì)量檢驗(yàn)是在該批產(chǎn)品生產(chǎn)完成后進(jìn)行,所以可以取單批產(chǎn)品整個(gè)生產(chǎn)過(guò)程中完整的工藝參數(shù)測(cè)量值時(shí)間序列和質(zhì)量指標(biāo)測(cè)量值時(shí)間序列作為動(dòng)態(tài)數(shù)據(jù)挖掘所需的樣本。
為方便描述,假設(shè)批量型過(guò)程 的產(chǎn)品質(zhì)量指標(biāo) 的采樣周期均為 ,任一產(chǎn)品質(zhì)量指標(biāo) 從 時(shí)刻開(kāi)始的測(cè)量值已知,且可表達(dá)為周期為 的 個(gè)采樣值的時(shí)間序列,即:
(5)
產(chǎn)品質(zhì)量檢驗(yàn)在時(shí)刻完成,則取
作為動(dòng)態(tài)數(shù)據(jù)挖掘所需的
個(gè)樣本,其中
其中 [ ]為向下取整函數(shù)。
3.1.2 連續(xù)型過(guò)程的數(shù)據(jù)歸整
對(duì)于連續(xù)型生產(chǎn)過(guò)程,應(yīng)該將不同工藝參數(shù)在不同時(shí)刻對(duì)參與質(zhì)量抽樣檢驗(yàn)的“局部產(chǎn)品”的測(cè)量值與質(zhì)量檢驗(yàn)結(jié)果一起組成樣本,也即將工藝參數(shù)的測(cè)量值時(shí)間序列中,對(duì)某個(gè)質(zhì)量檢驗(yàn)結(jié)果有影響的一段時(shí)間序列提取出來(lái),和質(zhì)量指標(biāo)測(cè)量值一起組成樣本。
為方便描述,假設(shè)連續(xù)型過(guò)程P的產(chǎn)品質(zhì)量指標(biāo)的采樣周期均為△T,任一產(chǎn)品質(zhì)量指標(biāo)yj從t時(shí)刻開(kāi)始的測(cè)量值已知,且可表達(dá)為周期為△T的
個(gè)采樣值的時(shí)間序列,即:
(10)
產(chǎn)品質(zhì)量檢驗(yàn)在時(shí)刻完成。各工藝參數(shù)
的測(cè)量點(diǎn)可能安裝在生產(chǎn)線的同一區(qū)域或者不同區(qū)域,參與質(zhì)量抽樣檢驗(yàn)的第k個(gè)“局部產(chǎn)品”經(jīng)歷xi測(cè)量點(diǎn)所在的區(qū)域的時(shí)間為
,其中
。
則取作為動(dòng)態(tài)數(shù)據(jù)挖掘所需的
個(gè)樣本,其中
其中 [ ]為向下取整函數(shù)。]
3.2 時(shí)間序列的模式提取
3.2.1 質(zhì)量不良原因的模式假設(shè)
通常生產(chǎn)質(zhì)量不良的原因可分為兩類(lèi),即工藝參數(shù)設(shè)計(jì)時(shí)有錯(cuò)誤;或在生產(chǎn)過(guò)程中工藝參數(shù)未能控制在設(shè)計(jì)值。本文提出的動(dòng)態(tài)數(shù)據(jù)挖掘方法在用于生產(chǎn)質(zhì)量控制時(shí),基于以下關(guān)鍵性假設(shè):
假設(shè):(質(zhì)量不良原因的模式假設(shè))
設(shè)生產(chǎn)質(zhì)量不良的原因可以通過(guò)生產(chǎn)過(guò)程中工藝參數(shù)的時(shí)間序列實(shí)測(cè)樣本反映出來(lái)。工藝參數(shù)的時(shí)間序列中某些特征的改變,引起生產(chǎn)質(zhì)量的變化,而這些時(shí)間序列的特征,可以用模式來(lái)描述。
例如,在連鑄生產(chǎn)工藝中,鑄坯拉速不穩(wěn)定時(shí),容易出現(xiàn)縱向裂紋[4][5]。根據(jù)此先驗(yàn)知識(shí),可以將鑄坯拉速測(cè)量值時(shí)間序列的方差作為影響鑄坯縱向裂紋質(zhì)量事故的一個(gè)模式。為了解鑄坯拉速測(cè)量值時(shí)間序列的方差與鑄坯縱向裂紋質(zhì)量事故之間的定量關(guān)系,可以采用數(shù)據(jù)挖掘方法從海量的鑄坯拉速測(cè)量值生產(chǎn)歷史數(shù)據(jù)中去尋找。
根據(jù)上述質(zhì)量不良原因的模式假設(shè),在進(jìn)行質(zhì)量預(yù)測(cè)模型的建模或質(zhì)量事故原因的分析時(shí),要進(jìn)行時(shí)間序列的模式提取,即將時(shí)間序列樣本集合轉(zhuǎn)換為特征模式樣本集合。
3.2.2 時(shí)間序列的模式提取方法
時(shí)間序列的模式提取可以看成一個(gè)從時(shí)間序列到模式集合的變換過(guò)程,即從時(shí)間序列中抽取有價(jià)值的模式。在經(jīng)典的時(shí)間序列分析理論中,已給出了一類(lèi)模式提取的方法:根據(jù)時(shí)間序列建立ARMA模型。該方法把時(shí)間序列空間映射到ARMA模型中的參數(shù)空間,也稱(chēng)為時(shí)間序列的ARMA特征空間。但是ARMA特征沒(méi)有物理意義,難以根據(jù)它來(lái)改進(jìn)產(chǎn)品質(zhì)量。
為了使模式提取具有物理意義,有三類(lèi)可供選擇的方法:
(1)根據(jù)理論分析和實(shí)際經(jīng)驗(yàn),構(gòu)造與產(chǎn)品質(zhì)量有關(guān)的模式類(lèi)。例如根據(jù)經(jīng)驗(yàn),冷連軋過(guò)程中帶鋼溫度先單調(diào)上升后單調(diào)下降的情況可能引起斷帶,因此將它作為帶鋼溫度時(shí)間序列的一種模式。
(2)對(duì)于沒(méi)有任何先驗(yàn)知識(shí)的情況,可以窮舉構(gòu)造所有可能的有物理意義的模式。例如時(shí)間序列的均值、方差、最大值、最小值、中間值、局部極值出現(xiàn)頻率、單調(diào)性、凹凸性、與標(biāo)準(zhǔn)值的偏差、時(shí)間累計(jì)等等。
(3)對(duì)于只有部分先驗(yàn)知識(shí)的情況,可以結(jié)合前兩種方法。
時(shí)間序列模式提取的一般步驟如下:
(1)給定用于各工藝參數(shù)測(cè)量值時(shí)間序列模式提取的模式集合,以
表示,其中 為某個(gè)工藝參數(shù)
要提取的一種模式;
(2)給定待提取模式的時(shí)間序列
(3)根據(jù)各模式提取的計(jì)算方法,對(duì)上述時(shí)間序列進(jìn)行模式提取,即計(jì)算:
(15)
其中mi為時(shí)間序列在模式si下的模式提取結(jié)果,即模式評(píng)價(jià)值;
為模式si的計(jì)算算式。模式評(píng)價(jià)值mi的數(shù)據(jù)類(lèi)型根據(jù)模式的不同可能為數(shù)值型、枚舉型或邏輯型。;
(3)將樣本中的時(shí)間序列
進(jìn)行模式提取,提取的結(jié)果是將
測(cè)量值時(shí)間序列轉(zhuǎn)換為模式提取結(jié)果
,從而將樣本轉(zhuǎn)化為
從上述過(guò)程可以看出,經(jīng)過(guò)模式提取,已經(jīng)將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換成了不顯含時(shí)間因素的模式評(píng)價(jià)值序列。
3.3 面向質(zhì)量控制的動(dòng)態(tài)數(shù)據(jù)挖掘過(guò)程
當(dāng)給定一系列生產(chǎn)歷史數(shù)據(jù)時(shí)間序列后,對(duì)于如第2節(jié)所定義的兩類(lèi)質(zhì)量控制數(shù)據(jù)挖掘問(wèn)題,部分的數(shù)據(jù)挖掘過(guò)程是相同的,但也有一部分并不相同,比如使用的挖掘算法以及對(duì)結(jié)果的處理等。下面分別進(jìn)行討論。
3.3.1 求解質(zhì)量預(yù)測(cè)問(wèn)題的動(dòng)態(tài)數(shù)據(jù)挖掘過(guò)程
求解質(zhì)量預(yù)測(cè)問(wèn)題的動(dòng)態(tài)數(shù)據(jù)挖掘過(guò)程,首先要為挖掘準(zhǔn)備可用的數(shù)據(jù),然后選擇合適的方法進(jìn)行質(zhì)量預(yù)測(cè)模型的訓(xùn)練和測(cè)試,最后輸出模型。具體步驟如下:
(1)確定m個(gè)可測(cè)的產(chǎn)品質(zhì)量指標(biāo)
;
(2)根據(jù)理論分析和實(shí)際經(jīng)驗(yàn),確定可能影響質(zhì)量指標(biāo)的因素。根據(jù)這些因素,確定參加挖掘n個(gè)可測(cè)的工藝參數(shù),以及工藝參數(shù)測(cè)量值時(shí)間序列模式提取的模式集合
;
(3)使用第3.1節(jié)中介紹的方法對(duì)工藝參數(shù)時(shí)間序列進(jìn)行數(shù)據(jù)歸整,得到
個(gè)樣本
;
(4)對(duì)樣本所包含的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,包括去處野值、數(shù)據(jù)平滑等過(guò)程;
(5)使用第3.2.2節(jié)中的方法,對(duì)樣本中的時(shí)間序列 進(jìn)行模式提取,得到模式評(píng)價(jià)值序列 ,從而將樣本轉(zhuǎn)化為
;
(6)將樣本分為訓(xùn)練樣本集和測(cè)試樣本集,使用數(shù)據(jù)挖掘方法建立質(zhì)量預(yù)測(cè)模型;
(7)使用測(cè)試樣本集對(duì)挖掘結(jié)果進(jìn)行測(cè)試;
(8)輸出質(zhì)量預(yù)測(cè)模型。
3.3.2 求解質(zhì)量分析問(wèn)題的動(dòng)態(tài)數(shù)據(jù)挖掘過(guò)程
求解質(zhì)量分析問(wèn)題的動(dòng)態(tài)數(shù)據(jù)挖掘過(guò)程,首先要為挖掘準(zhǔn)備可用的數(shù)據(jù),然后選擇合適的方法進(jìn)行關(guān)聯(lián)分析,最后輸出關(guān)聯(lián)規(guī)則。具體步驟如下:
(1)~(6)同第3.3.1節(jié)中的步驟,獲得數(shù)據(jù)挖掘所需的樣本數(shù)據(jù)
;
(7)使用動(dòng)態(tài)數(shù)據(jù)挖掘中的關(guān)聯(lián)分析方法,求解質(zhì)量關(guān)聯(lián)模型;
(8)輸出質(zhì)量關(guān)聯(lián)模型。
4.應(yīng)用實(shí)例
運(yùn)用上述理論與方法,作者在上海寶信軟件股份有限公司與浙江大學(xué)工業(yè)控制技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的冶金企業(yè)生產(chǎn)質(zhì)量分析數(shù)據(jù)挖掘平臺(tái)DMPlatform上,以寶鋼一煉鋼1900直弧型板坯連鑄機(jī)生產(chǎn)過(guò)程鑄坯縱裂質(zhì)量控制為背景進(jìn)行了動(dòng)態(tài)數(shù)據(jù)挖掘試驗(yàn)。
縱裂是連鑄板坯常見(jiàn)的表面缺陷之一,輕微的縱裂紋經(jīng)板坯精整后對(duì)下工序不會(huì)產(chǎn)生影響,嚴(yán)重的縱裂紋會(huì)使整塊板坯報(bào)廢,甚至在連鑄生產(chǎn)過(guò)程中引起縱裂漏鋼,給設(shè)備和生產(chǎn)帶來(lái)嚴(yán)重的危害。關(guān)于縱裂產(chǎn)生的原因有過(guò)很多研究,國(guó)內(nèi)外很多文獻(xiàn)中都有所報(bào)道。歸納起來(lái)主要有:鋼水的成分、連鑄的工藝操作參數(shù)、保護(hù)渣等方面,不同的工廠、不同的連鑄機(jī)在不同的階段,由于條件不同,每個(gè)因素對(duì)鑄坯縱裂影響的程度也在變化[4][5]。
動(dòng)態(tài)數(shù)據(jù)挖掘用于進(jìn)行質(zhì)量預(yù)測(cè)試驗(yàn),即數(shù)據(jù)挖掘的目的是建立質(zhì)量預(yù)測(cè)模型。定義質(zhì)量指標(biāo)為鑄坯縱向裂紋,考慮的數(shù)據(jù)類(lèi)型為邏輯值,即只考慮鑄坯樣本有或無(wú)縱向裂紋。在生產(chǎn)中通過(guò)切片硫印的方式獲取該質(zhì)量指標(biāo)的檢驗(yàn)值,采樣周期為1小時(shí)。參與數(shù)據(jù)挖掘的工藝參數(shù)共有24個(gè),最短的采樣周期為5秒(如結(jié)晶器循環(huán)冷卻水和二冷段冷卻水的溫度),最長(zhǎng)的采樣周期為1分鐘(如鑄坯表面溫度)。根據(jù)已知的連鑄理論和經(jīng)驗(yàn)知識(shí),如:錳硫比增大或者硫含量降低,裂紋減少;拉速越不穩(wěn)定,越容易出現(xiàn)縱向裂紋等,確定了對(duì)各個(gè)工藝參數(shù)時(shí)間序列需要提取的具有物理意義的模式,如表1所示。
表1、參與數(shù)據(jù)挖掘的連鑄生產(chǎn)工藝參數(shù)及提取的模式
連鑄是連續(xù)型生產(chǎn)過(guò)程,采用3.1中的方法從生產(chǎn)歷史數(shù)據(jù)中抽取樣本,共采集了60批鑄坯的生產(chǎn)歷史紀(jì)錄,每批數(shù)據(jù)記錄的時(shí)間跨度為鑄坯切片質(zhì)量硫印檢驗(yàn)前1小時(shí)。因此24個(gè)工藝參數(shù)時(shí)間序列的最大長(zhǎng)度為86400個(gè)采樣數(shù)據(jù),總數(shù)據(jù)量約為200萬(wàn)個(gè)數(shù)據(jù)。然后對(duì)原始數(shù)據(jù)進(jìn)行去處野值、數(shù)據(jù)平滑等預(yù)處理,接著根據(jù)表1對(duì)所有樣本提取特征模式,利用樸素Bayes分類(lèi)建立質(zhì)量預(yù)測(cè)模型。圖1給出了在DMPlatform軟件平臺(tái)上進(jìn)行組態(tài)的數(shù)據(jù)挖掘流程。
采用5組工藝參數(shù)實(shí)測(cè)值對(duì)獲得的連鑄鑄坯質(zhì)量預(yù)測(cè)模型進(jìn)行了檢驗(yàn),預(yù)測(cè)準(zhǔn)確性為80%。由于連鑄板坯縱裂的形成原因非常復(fù)雜,根據(jù)經(jīng)驗(yàn)很難預(yù)測(cè)和控制,因此80%的質(zhì)量預(yù)測(cè)精度對(duì)于鑄坯質(zhì)量控制有很大的幫助。
圖1. DMPlatform軟件平臺(tái)上進(jìn)行組態(tài)的連鑄鑄坯質(zhì)量預(yù)測(cè)數(shù)據(jù)挖掘流程
5.結(jié)論
生產(chǎn)質(zhì)量控制是利用生產(chǎn)過(guò)程的動(dòng)態(tài)信息進(jìn)行質(zhì)量預(yù)測(cè)和質(zhì)量控制。將動(dòng)態(tài)數(shù)據(jù)挖掘的方法應(yīng)用于質(zhì)量控制時(shí),主要解決兩個(gè)問(wèn)題:(1)質(zhì)量預(yù)測(cè)問(wèn)題,即通過(guò)對(duì)生產(chǎn)過(guò)程歷史記錄的數(shù)據(jù)挖掘,建立產(chǎn)品質(zhì)量預(yù)測(cè)模型;(2)質(zhì)量分析問(wèn)題,即在產(chǎn)品質(zhì)量出現(xiàn)問(wèn)題后,利用對(duì)歷史數(shù)據(jù)的挖掘分析生產(chǎn)工藝對(duì)產(chǎn)品質(zhì)量的影響,找出隱藏的生產(chǎn)規(guī)律,為企業(yè)改進(jìn)工藝提供決策支持。
由于生產(chǎn)歷史數(shù)據(jù)通常都是時(shí)間序列,因此用于處理靜態(tài)數(shù)據(jù)的數(shù)據(jù)挖掘方法不能直接應(yīng)用于鋼鐵生產(chǎn)過(guò)程。本文給出了動(dòng)態(tài)數(shù)據(jù)挖掘用于生產(chǎn)過(guò)程質(zhì)量控制的一般方法。將此方法運(yùn)用于寶鋼一煉鋼1900直弧型板坯連鑄機(jī)生產(chǎn)過(guò)程鑄坯縱裂質(zhì)量控制,在上海寶信軟件股份有限公司與浙江大學(xué)工業(yè)控制技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的冶金企業(yè)生產(chǎn)質(zhì)量分析數(shù)據(jù)挖掘平臺(tái)DMPlatform上進(jìn)行試驗(yàn),質(zhì)量預(yù)測(cè)準(zhǔn)確性達(dá)到80%。
[參考文獻(xiàn)]
[1]劉海英. 基于計(jì)算機(jī)技術(shù)的工序質(zhì)量控制系統(tǒng)研究.中國(guó)機(jī)械工程,14(13):1118-1121,2003
[2]劉明周,任蘭,張銘鑫. 產(chǎn)品質(zhì)量統(tǒng)計(jì)過(guò)程中的制造質(zhì)量數(shù)據(jù)管理方法研究.計(jì)算機(jī)集成制造系統(tǒng),11(2),280-283,2005
[3]萬(wàn)百五. 工業(yè)生產(chǎn)的產(chǎn)品質(zhì)量模型和質(zhì)量控制模型及其應(yīng)用.自動(dòng)化學(xué)報(bào),28(6),1019-1024,2002
[4]熊毅剛. 板坯連鑄.冶金工業(yè)出版社,1994
[5]曹廣疇. 現(xiàn)代板坯連鑄.冶金工業(yè)出版社,1994