作者:國(guó)工智能實(shí)施團(tuán)隊(duì)—曹靜
前言
科技橫飛的時(shí)代,大部分實(shí)驗(yàn)室管理系統(tǒng)(LIMS)都擁有數(shù)十上百的分析儀器設(shè)備,一臺(tái)儀器檢測(cè)數(shù)十個(gè)項(xiàng)目,實(shí)驗(yàn)室的溫度、濕度、壓強(qiáng)與實(shí)驗(yàn)結(jié)果的相關(guān)性越來越受人們的關(guān)注。國(guó)工智能實(shí)驗(yàn)室管理系統(tǒng)融合了國(guó)工智能數(shù)據(jù)大腦平臺(tái),平臺(tái)內(nèi)提供上百中統(tǒng)計(jì)學(xué)相關(guān)算法及機(jī)器學(xué)習(xí)算法,對(duì)實(shí)驗(yàn)室的數(shù)據(jù)進(jìn)行分析、挖掘,提高企業(yè)產(chǎn)品附加值及行業(yè)競(jìng)爭(zhēng)力。本次案例就因子分析與實(shí)驗(yàn)室LIMS系統(tǒng)相融合進(jìn)行探討及應(yīng)用舉例。
含義
因子分析是指根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同組的變量不相關(guān)或相關(guān)性較低,每組變量代表一個(gè)基本結(jié)構(gòu)—即公共因子。使用因子分析可通過評(píng)估變量之間的相關(guān)來評(píng)估數(shù)據(jù)的結(jié)構(gòu),使用此分析可以將每個(gè)原始變量建模為這些底層因子的線性函數(shù)。
案例
某企業(yè)LIMS實(shí)驗(yàn)室想了解溫度、濕度、壓強(qiáng)、實(shí)驗(yàn)結(jié)果這四個(gè)因子之間的相關(guān)性,在不同的溫度、濕度、壓強(qiáng)下對(duì)同一個(gè)樣品進(jìn)行測(cè)試,得到7次實(shí)驗(yàn)結(jié)果如表1所示,試分析不同的溫度、濕度、壓強(qiáng)、實(shí)驗(yàn)結(jié)果的相關(guān)性大小。
溫度 |
濕度 |
壓強(qiáng) |
實(shí)驗(yàn)結(jié)果 |
20 |
58 |
70 |
40.32 |
22 |
54 |
75 |
39.16 |
24 |
50 |
80 |
37.25 |
26 |
46 |
85 |
36.01 |
28 |
44 |
90 |
34.74 |
30 |
40 |
95 |
34.03 |
32 |
36 |
100 |
33.89 |
表1 不同溫度、濕度、壓強(qiáng)得到的實(shí)驗(yàn)結(jié)果
要驗(yàn)證溫度、濕度、壓強(qiáng)、實(shí)驗(yàn)結(jié)果這四個(gè)因子之間是否存在相關(guān)性及相關(guān)性大小,因此可以采用因子分析進(jìn)行檢驗(yàn)。
分析過程
使用國(guó)工數(shù)據(jù)大腦組件對(duì)國(guó)工實(shí)驗(yàn)室系統(tǒng)數(shù)據(jù)進(jìn)行讀取,直接訪問數(shù)據(jù)庫(kù)獲取數(shù)據(jù)集。
圖1 RDBMS讀取組件
使用集成好算法的因子分析組件進(jìn)行數(shù)據(jù)的因子分析處理,對(duì)組件參數(shù)進(jìn)行設(shè)置,變量字段配置為溫度、濕度、壓強(qiáng)、實(shí)驗(yàn)結(jié)果,因?yàn)楣灿?/span>4個(gè)變量,所以要提取的因子數(shù)配置為2,單擊運(yùn)行,從調(diào)試面板中查看分析結(jié)果。
圖2 因子分析組件及參數(shù)配置
圖3 結(jié)果分析
檢查載荷模式,以確定對(duì)每個(gè)變量影響最強(qiáng)的因子。接近于-1或1的載荷表明因子對(duì)變量的影響非常強(qiáng)。接近0的載荷表明因子對(duì)變量的影響很弱。有些變量可能對(duì)多個(gè)因子施加高載荷。
非旋轉(zhuǎn)因子載荷通常很難解釋,因子旋轉(zhuǎn)簡(jiǎn)化了載荷結(jié)構(gòu),并且使因子載荷更容易解釋。使用旋轉(zhuǎn)的因子載荷,可以得出如下結(jié)論:
濕度(0.998)和結(jié)果值(0.986)在因子1上具有較大的正載荷,溫度(0.999)、濕度(0.998)、壓強(qiáng)(0.999)和結(jié)果值(1)在因子3上具有較大的正載荷,所以這兩個(gè)因子共同解釋數(shù)據(jù)變異的0.999或99.9%。
與LIMS系統(tǒng)相融合
國(guó)工數(shù)據(jù)大腦平臺(tái)可直接獲取實(shí)驗(yàn)室LIMS系統(tǒng)中的實(shí)驗(yàn)數(shù)據(jù),直接將實(shí)驗(yàn)數(shù)據(jù)對(duì)接到創(chuàng)建好的因子分析模型中,根據(jù)得出的結(jié)果分析溫度、濕度、壓強(qiáng)、實(shí)驗(yàn)結(jié)果在因子1和因子2的相關(guān)性。
參數(shù)說明
因子載荷:表示因子對(duì)變量的解釋程度。載荷范圍可以為-1到1,國(guó)工數(shù)據(jù)大腦因子分析組件會(huì)計(jì)算非旋轉(zhuǎn)因子載荷和旋轉(zhuǎn)因子載荷。
變量:分析研究對(duì)象的變量。
要提取的因子數(shù):因子數(shù)必須至少為1且不得超過總變量數(shù),為了取得最佳結(jié)構(gòu),數(shù)據(jù)中的每3個(gè)變量擁有的因子不得超過一個(gè)。例如,有12個(gè)變量,則最多提前4個(gè)因子。
方差貢獻(xiàn)率:使用方差貢獻(xiàn)率(%Var)可確定因子解釋的方差量。保留解釋可接受方差水平的因子。
方差(特征值):如果使用主分量提供因子,則方差等于特征值??墒褂锰卣髦档拇笮〈_定因子數(shù)。保留具有最大特征值的因子。
適用范圍
不同的變量選擇因子數(shù)之后,分析因子對(duì)變量的是否有影響。
精餾回收工藝是醫(yī)藥化工行業(yè)中的最為重要的典型單元操作之一,在原料藥、精細(xì)化工、輕工業(yè)等各個(gè)領(lǐng)域都有極其廣泛的應(yīng)用。由于精餾過程的復(fù)雜性,精餾工藝過程的終點(diǎn)現(xiàn)階段仍需要生產(chǎn)工人每隔一定時(shí)間取樣送實(shí)驗(yàn)室檢測(cè),通過氣相色譜測(cè)定含量,卡爾費(fèi)休滴定法
中秋節(jié)是中國(guó)傳統(tǒng)節(jié)日之一,也是一年中最重要、最盛大的節(jié)日之一。在這一天,以明亮的月亮和家人團(tuán)聚為特點(diǎn),承載著人們無盡的思念和美好的祝福。 國(guó)慶、中秋兩節(jié)遇, 合家團(tuán)圓精神俱。 團(tuán)團(tuán)圓圓過中秋, 歡歡喜喜
2023年8月28日,國(guó)工智能與鎂伽科技舉行戰(zhàn)略合作簽約儀式,國(guó)工智能董事長(zhǎng)柳彥宏與鎂伽科技創(chuàng)始人兼首席執(zhí)行官黃瑜清先生代表雙方簽訂正式戰(zhàn)略合作協(xié)議,標(biāo)志著AI輔助化工研發(fā)領(lǐng)先者、智能自動(dòng)化實(shí)驗(yàn)室引領(lǐng)者開啟強(qiáng)強(qiáng)聯(lián)合發(fā)展之路。&n
創(chuàng)新是一個(gè)民族進(jìn)步的靈魂,是一個(gè)國(guó)家興旺發(fā)達(dá)的不竭動(dòng)力,也是中華民族最深沉的民族稟賦。在激烈的國(guó)際競(jìng)爭(zhēng)中,惟創(chuàng)新者進(jìn),惟創(chuàng)新者強(qiáng),惟創(chuàng)新者勝。 5月27日