作者:國工智能項目部—林鋒
前言
面對市場競爭的日益激烈,制造企業(yè)想要得到客戶的認可,不得不從價格優(yōu)勢轉(zhuǎn)向高質(zhì)量的產(chǎn)品優(yōu)勢。產(chǎn)品質(zhì)量的高低已經(jīng)關(guān)系到企業(yè)核心競爭力的重要一環(huán)。如何有效地管理和利用這些從企業(yè)生產(chǎn)和經(jīng)營中產(chǎn)生的龐雜的質(zhì)量數(shù)據(jù),是企業(yè)迫切需要解決的問題。
將數(shù)據(jù)挖掘技術(shù)應用于生產(chǎn)過程質(zhì)量管理中,挖掘出生產(chǎn)過程中影響質(zhì)量的關(guān)鍵因素及其內(nèi)在聯(lián)系,有針對性地采取預防措施,從而提高產(chǎn)品質(zhì)量,為企業(yè)持續(xù)改善質(zhì)量提供決策支持。在實際工作中,為了避免漏掉某些重要因素,往往在一開始選取指標的時候盡可能考慮所有的相關(guān)因素,而這樣做的結(jié)果,則是變量過多,變量間的相關(guān)度較高,給統(tǒng)計分析與建模帶來極大不便,因此人們希望能夠研究變量間的相似關(guān)系,按照變量的相似關(guān)系把他們聚合成若干類,進而找出影響系統(tǒng)的主要因素,引入了變量聚類方法。
含義
根據(jù)不同變量之間相關(guān)程度高低進行分類。研究中,若變量較多且相關(guān)較強時,可以使用變量聚類法把變量聚為幾個大類,同一類變量之間有較強相關(guān)性,不同類變量之間相關(guān)程度低,并可以從同類變量中找出一典型性變量作為代表,最終減少變量個數(shù)達到降維目的。
案例
有10種500毫升啤酒的成分和價格等數(shù)據(jù),試用變量聚類對變量進行聚類以達到縮減變量的目的,篩選出預測變量。數(shù)據(jù)的變量包括熱量、鈉含量、酒精含量、價格、麥芽濃度。
分析過程
從數(shù)據(jù)大腦中的組件面板查找變量聚類組件,拖到到工作面板,配置數(shù)據(jù)源以及變量聚類組件參數(shù),點擊運行。
分析結(jié)果
如何篩選聚類變量?現(xiàn)在我們有5個變量用來對啤酒分類,是否有必要將5個變量都納入作為分類變量呢?熱量、鈉含量、酒精含量,麥芽濃度這4個指標是要通過化驗員的辛苦努力來測定,而且還有花費不少成本,如果都納入分析的話,豈不太麻煩太浪費?所以,有必要對5個變量進行聚類處理。
從結(jié)果樹狀圖中可以看出酒精含量與麥芽濃度兩個變量距離為0.0683,二者之間相關(guān)系數(shù)最大(相關(guān)系數(shù)等于1 - 距離)選其一即可,沒有必要都作為預測變量,導致成本增加。至于酒精含量和麥芽濃度選擇哪一個作為典型指標來代替原來的兩個變量,可以根據(jù)專業(yè)知識或測定的難易程度決定。(與因子分析不同,是完全踢掉其中一個變量以達到降維的目的。)這里選用酒精含量,至此,確定出用于預測的變量為:酒精含量,鈉含量,熱量,價格。
與國工銷售預測系統(tǒng)相融合
在國工銷售預測系統(tǒng)中,對預測因素的整理就用到了變量聚類的算法。通過變量聚類算法對影響因素的歸納整理確定最終影響系統(tǒng)的主要因素,降低預測的成本。
適用范圍
變量聚類可以用來:分析特征相關(guān)性 ,對指標進行分類等。
精餾回收工藝是醫(yī)藥化工行業(yè)中的最為重要的典型單元操作之一,在原料藥、精細化工、輕工業(yè)等各個領(lǐng)域都有極其廣泛的應用。由于精餾過程的復雜性,精餾工藝過程的終點現(xiàn)階段仍需要生產(chǎn)工人每隔一定時間取樣送實驗室檢測,通過氣相色譜測定含量,卡爾費休滴定法
中秋節(jié)是中國傳統(tǒng)節(jié)日之一,也是一年中最重要、最盛大的節(jié)日之一。在這一天,以明亮的月亮和家人團聚為特點,承載著人們無盡的思念和美好的祝福。 國慶、中秋兩節(jié)遇, 合家團圓精神俱。 團團圓圓過中秋, 歡歡喜喜
2023年8月28日,國工智能與鎂伽科技舉行戰(zhàn)略合作簽約儀式,國工智能董事長柳彥宏與鎂伽科技創(chuàng)始人兼首席執(zhí)行官黃瑜清先生代表雙方簽訂正式戰(zhàn)略合作協(xié)議,標志著AI輔助化工研發(fā)領(lǐng)先者、智能自動化實驗室引領(lǐng)者開啟強強聯(lián)合發(fā)展之路。&n
創(chuàng)新是一個民族進步的靈魂,是一個國家興旺發(fā)達的不竭動力,也是中華民族最深沉的民族稟賦。在激烈的國際競爭中,惟創(chuàng)新者進,惟創(chuàng)新者強,惟創(chuàng)新者勝。 5月27日