基于模糊聚類的電子信息資源整合方法
摘要:由于進(jìn)行電子信息資源整合的過程中,沒有進(jìn)行資源轉(zhuǎn)換降維處理,導(dǎo)致資源整合效率低,為此提出基于模糊聚類的電子信息資源整合方法。通過模糊ORM技術(shù)抽取電子信息資源,采用等效轉(zhuǎn)換降維的方法對(duì)抽取的電子信息資源進(jìn)行轉(zhuǎn)換降維處理,根據(jù)處理結(jié)果,結(jié)合模糊聚類分析,構(gòu)建EAD電子信息資源整合模型,采用模糊聚類分析的方式,將所屬的信息資源依據(jù)特征或者屬性劃分為不同額定整合區(qū)域,計(jì)算整合隸屬度,布設(shè)信息資源的整合層級(jí)。最終的測(cè)試結(jié)果表明:與傳統(tǒng)的LAM信息資源整合測(cè)試組及傳統(tǒng)改進(jìn)ORM信息資源整合測(cè)試組相對(duì)比,所設(shè)計(jì)的模糊聚類信息資源整合測(cè)試組最終得出的響應(yīng)時(shí)間相對(duì)較短,電子信息資源整合效率較高,所提方法具有實(shí)際的應(yīng)用價(jià)值。
本文引用地址:http://cafeforensic.com/article/202308/449387.htm關(guān)鍵詞:模糊聚類;電子信息;信息匯總;資源整合;數(shù)據(jù)控制
電子信息資源是以數(shù)字化形式( 即二進(jìn)制代碼0,1)把文字、圖象、聲音、動(dòng)畫等多種形式的信息存儲(chǔ)在光、磁等非印刷型介質(zhì)上,并以光信號(hào)、電信號(hào)的形式傳輸,通過響應(yīng)的計(jì)算機(jī)和其他外部設(shè)備再現(xiàn)出來的信息資源。電子信息資源整合主要是針對(duì)于龐大的數(shù)據(jù)信息群,構(gòu)建的一種特殊的數(shù)據(jù)匯總方法[1]。近年來,隨著計(jì)算機(jī)以及網(wǎng)絡(luò)技術(shù)的成熟普及,數(shù)據(jù)資源急劇增長(zhǎng),逐漸成為資源處理的主流。通常情況下,數(shù)字資源自身具有復(fù)雜性、異構(gòu)性、海量性以及多元性等特征,這在一定程度上也增加了信息資源整合的速度以及效率,增加元數(shù)據(jù)的可靠性,給未來信息發(fā)展奠定更為堅(jiān)實(shí)的基礎(chǔ)[2]。
模糊聚類,實(shí)際上指的是一種按模糊界限以及基本要求對(duì)事物進(jìn)行分類的數(shù)學(xué)方法[3]。本質(zhì)上是客觀的劃分,并采用數(shù)理統(tǒng)計(jì)的方式,獲取最終處理結(jié)果。模糊聚類為信息整合處理提供了極大的便利條件,進(jìn)一步確保數(shù)據(jù)計(jì)算的精準(zhǔn)度,同時(shí),關(guān)聯(lián)系統(tǒng)聚類法和逐步聚類法等方法,形成一個(gè)可無限延伸與擴(kuò)展的資源整合體系,優(yōu)化需要整合的信息資源,避免出現(xiàn)信息孤島這一類問題,推動(dòng)信息整合相關(guān)企業(yè)邁入一個(gè)新的發(fā)展階段。因此,本文提出一種基于模糊聚類的電子信息資源整合方法。考慮到最終測(cè)試結(jié)果的精準(zhǔn)性與可靠性,本文會(huì)在較為真實(shí)的背景下進(jìn)行實(shí)驗(yàn)測(cè)試,并驗(yàn)證本文方法能夠安全、高效的進(jìn)行信息資源整合。
1 模糊聚類下電子信息資源整合方法
1.1 基于模糊ORM技術(shù)的電子信息資源抽取
在對(duì)模糊聚類下電子信息資源整合方法設(shè)計(jì)之前,需要先采用模糊ORM 技術(shù)對(duì)電子信息資源抽取。通常情況下,針對(duì)于不同的整合范圍,所導(dǎo)出的資源以及定向整合目標(biāo)也是不同的,這也使得內(nèi)部執(zhí)行程序存在差異[4-6]??梢圆捎秒p向處理模式,在平臺(tái)中構(gòu)建多層級(jí)的模糊ORM 資源整合程序,與數(shù)據(jù)庫(kù)相關(guān)聯(lián)的同時(shí),獲取數(shù)據(jù)集,在聚類中心,對(duì)信息劃歸分類,計(jì)算出聚類質(zhì)心數(shù),具體如式(1)所示。
(1)
式(1)中: B 表示聚類質(zhì)心數(shù); p 表示聚類范圍; Z 表示質(zhì)心集合;f 表示映射系數(shù)。通過上述計(jì)算,最終可以得出實(shí)際的聚類質(zhì)心數(shù)[7]。根據(jù)得出的聚類質(zhì)心數(shù),核定不同層級(jí)數(shù)值資源的占比,以此為基礎(chǔ),在特定的電子信息資源庫(kù)中,利用雙向信息集成法來代替?zhèn)鹘y(tǒng)的單一信息集成方式,結(jié)合模糊ORM 技術(shù),電子信息資源抽取,具體如式(2)所示。
(2)
式(2)中:H表示數(shù)據(jù)定向抽取結(jié)果;a 表示疊合距離;d 表示集成次數(shù); s 表示允許出現(xiàn)的極限差值。此時(shí),完成對(duì)信息的抽取,隨后,在標(biāo)定的資源整合范圍之內(nèi),依據(jù)實(shí)際的處理標(biāo)準(zhǔn),更改調(diào)整ORM 模糊引導(dǎo)指令,在確保數(shù)據(jù)唯一性、準(zhǔn)確性、及時(shí)性、完整性的同時(shí),實(shí)現(xiàn)整合目標(biāo)的更改調(diào)整,為后續(xù)的匯總處理奠定基礎(chǔ)[8]。
1.2 電子信息資源轉(zhuǎn)換降維處理
在通過模糊ORM 技術(shù)對(duì)信息資源進(jìn)行抽取后,對(duì)電子信息資源進(jìn)行轉(zhuǎn)換降維處理。所謂轉(zhuǎn)換降維處理,主要指的是在對(duì)信息資源抽取的過程中,信息資源通常處于集合的狀態(tài),資源維數(shù)也存在較大的差異,而維數(shù)的存在并不利于數(shù)據(jù)的整合、匯總,嚴(yán)重的甚至?xí)斐蓴?shù)據(jù)誤差等,因此,需將高維信息資源轉(zhuǎn)換為低維信息資源??梢圆捎玫刃мD(zhuǎn)換降維的方法,按照統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)或者降維格式進(jìn)行周期性轉(zhuǎn)換,計(jì)算出轉(zhuǎn)換降維比率,具體如式(3)所示。
(3)
式(3)中:A 表示轉(zhuǎn)換降維比率;n 表示中心整合距離;c表示聚類差值。通過上述計(jì)算,最終可以得出實(shí)際的轉(zhuǎn)換降維比率。根據(jù)信息資源的屬性與特征,結(jié)合轉(zhuǎn)換降維比率,實(shí)現(xiàn)定向轉(zhuǎn)換。
接下來,在實(shí)現(xiàn)標(biāo)定信息資源的轉(zhuǎn)換降維后,結(jié)合定向集成信息資源整合現(xiàn)狀,計(jì)算出信息資源處理的單元速度,具體如式(4)所示。
(4)
式(4)中: U 表示信息資源處理單元速度; x 表示縱向整合距離; q 表示傳輸路徑; t 表示動(dòng)態(tài)平均值。通過上述計(jì)算,最終可以得出實(shí)際的信息資源處理單元速度。在中心元數(shù)據(jù)庫(kù)中,依據(jù)降維映射規(guī)則將統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)分化為幾個(gè)轉(zhuǎn)換降維層級(jí)。不同降維層級(jí)的轉(zhuǎn)換格式也是不同的,可以根據(jù)所設(shè)定的整合目標(biāo),作出更改調(diào)整,舉例來說:可以賦予定義XML、RDF 等輸出格式,一定程度上擴(kuò)大整體的信息整合降維范圍,以此來適應(yīng)用戶的不同需求。
1.3 EAD模糊聚類整合模型構(gòu)建
在完成電子信息資源轉(zhuǎn)換降維處理后,構(gòu)建EAD模糊聚類整合模型。將上述轉(zhuǎn)換降維處理后的電子信息資源輸入到模型之中,將模型調(diào)整為可共享的形式化概念模型,關(guān)聯(lián)局域網(wǎng)以及聚類數(shù)據(jù)中心,調(diào)整數(shù)據(jù)組織形式為單向。將不同元數(shù)據(jù)指令應(yīng)用到本體集成框架中,設(shè)定具體的集成速度和資源整合映射比,具體如表1所示。
表1 集成速度、資源整合映射比測(cè)定表
根據(jù)表1,可以完成對(duì)集成速度、資源整合映射比的測(cè)定。隨后,遵循標(biāo)定的整合目標(biāo),結(jié)合模糊聚類分析,構(gòu)建EAD 信息資源整合結(jié)構(gòu),具體如圖1所示。
圖1 EAD信息資源整合模型結(jié)構(gòu)圖示
根據(jù)圖1,可以完成對(duì)EAD 信息資源整合模型結(jié)構(gòu)的建立。此時(shí)以本體為中心的,調(diào)整定向映射標(biāo)準(zhǔn),使用多層級(jí)的映射描述框架,綜合EAD 模型執(zhí)行基準(zhǔn),完成對(duì)EAD 模糊聚類整合模型的構(gòu)建,細(xì)化信息資源的整合效果。
1.4 分布式自適應(yīng)處理實(shí)現(xiàn)信息資源整合
在完成對(duì)EAD 模糊聚類整合模型的構(gòu)建之后,接下來,需要采用分布式自適應(yīng)處理,實(shí)現(xiàn)信息資源整合。首先,采用模糊聚類分析的方式,將所屬的信息資源依據(jù)特征或者屬性劃分為不同額定整合區(qū)域,設(shè)定整合目標(biāo)為動(dòng)態(tài),依據(jù)虛擬整合的范圍,對(duì)定向目標(biāo)作出更改和調(diào)整,計(jì)算出信息資源整合的隸屬度,具體如式(5)所示。
K=3.5T+(7y?1) (5)
式(5)中: K表示隸屬度; T表示質(zhì)心聚類系數(shù); y表示歐氏距離。通過上述計(jì)算,最終可以得出實(shí)際的隸屬度。與此同時(shí),利用所得的隸屬度,布設(shè)自適應(yīng)模糊整合區(qū)域,細(xì)化引導(dǎo)的指令,采用EAD 模糊聚類整合模型測(cè)定出此時(shí)電子信息的自適應(yīng)程度,具體如式(6)所示。
F=5W?1.5+6G (6)
式(6)中: F 表示自適應(yīng)程度; W表示定向資源分析速度; G 表示特征向量。通過上述計(jì)算,最終可以得出實(shí)際的自適應(yīng)程度,依據(jù)得出的自適應(yīng)程度,布設(shè)信息資源的整合層級(jí),采用分布式的整合方式,對(duì)信息資源定向分類,結(jié)合模糊聚類法實(shí)現(xiàn)最終的整合分析。構(gòu)建對(duì)應(yīng)的信息資源整合環(huán)節(jié),具體如圖2所示。
圖2 信息資源整合環(huán)節(jié)
2 方法測(cè)試
為了驗(yàn)證本文提出的基于模糊聚類的電子信息資源整合方法在實(shí)際應(yīng)用中的效果,選取A 數(shù)據(jù)庫(kù)作為測(cè)試的主要目標(biāo),通過在Matlab 軟件進(jìn)行測(cè)試分析。分別設(shè)定傳統(tǒng)LAM 信息資源整合測(cè)試組、傳統(tǒng)改進(jìn)ORM信息資源整合測(cè)試組以及本文所設(shè)計(jì)的模糊聚類信息資源整合測(cè)試組。采用對(duì)比的方式,確保3 種方法在相同的環(huán)境之下同時(shí)測(cè)試,最終得出的結(jié)果以對(duì)比的方式展開分析,接下來,進(jìn)行測(cè)試環(huán)境的搭建。
2.1 測(cè)試準(zhǔn)備
在對(duì)模糊聚類下電子信息資源整合方法的實(shí)際應(yīng)用效果進(jìn)行分析與研究,需要先搭建相關(guān)的測(cè)試環(huán)境。根據(jù)測(cè)定的實(shí)際需求以及執(zhí)行標(biāo)準(zhǔn),先對(duì)測(cè)試基礎(chǔ)指標(biāo)參數(shù)進(jìn)行預(yù)設(shè),具體如下表2所示。
表2 基礎(chǔ)指標(biāo)參數(shù)預(yù)設(shè)表
根據(jù)表2,可以完成對(duì)基礎(chǔ)指標(biāo)參數(shù)的預(yù)設(shè)。實(shí)驗(yàn)數(shù)據(jù)主要針對(duì)RBI、AWS、UCI、KDD Cup、MovieLens相關(guān)數(shù)據(jù)。
表3 數(shù)據(jù)集
隨后,利用測(cè)定的設(shè)備,營(yíng)造相應(yīng)的信息整合環(huán)境。為進(jìn)一步確保信息資源整合的穩(wěn)定性,采用無線局域網(wǎng)的通信模式,結(jié)合模糊聚類框架,對(duì)數(shù)據(jù)資源的基礎(chǔ)整合情況作出分析,具體如圖3所示。
圖3 信息資源整合程度對(duì)比分析圖示
根據(jù)圖3,可以完成對(duì)信息資源整合程度的對(duì)比分析。調(diào)整信息資源的單元處理速度,調(diào)整整合處理標(biāo)準(zhǔn),完成對(duì)測(cè)試環(huán)境的搭建。核定測(cè)試的設(shè)備與網(wǎng)絡(luò)是否處于穩(wěn)定的運(yùn)行狀態(tài),同時(shí)確保不存在影響最終測(cè)試結(jié)果的外部因素,核定無誤后,開始具體的測(cè)定分析。
2.2 測(cè)試過程及結(jié)果分析
在完成對(duì)上述測(cè)試環(huán)境的搭建之后,接下來,需要進(jìn)行具體的測(cè)試。首先,為了提升信息資源整合的速度,本文選擇使用指令引導(dǎo)的方式,關(guān)聯(lián)對(duì)應(yīng)的局域網(wǎng)和數(shù)據(jù)庫(kù),在網(wǎng)絡(luò)中尋找所需要的信息資源,并采用特殊的格式,按照指令的歸納順序,分批次導(dǎo)入數(shù)據(jù)庫(kù)的對(duì)應(yīng)位置中,結(jié)合數(shù)據(jù)的種類,劃定對(duì)應(yīng)的處理階層,獲取基礎(chǔ)指標(biāo)數(shù)值。計(jì)算信息資源的整合定向范圍,具體如式(7)所示。
(7)
式7中: Y表示整合定向范圍; V表示單向引導(dǎo)距離。通過上述計(jì)算,最終可以得出實(shí)際的整合定向范圍。在標(biāo)定的范圍之內(nèi),結(jié)合模糊聚類方式,將所屬的信息資源整合,劃歸至對(duì)應(yīng)的整合層級(jí)之中。在模糊聚類分析背景下,構(gòu)建批量信息資源的整合環(huán)節(jié),具體如圖4所示。
圖4 信息資源模糊聚類整合環(huán)節(jié)設(shè)計(jì)圖示
根據(jù)圖4,可以完成對(duì)信息資源模糊聚類整合環(huán)節(jié)的設(shè)計(jì)。與此同時(shí),關(guān)聯(lián)無線局域網(wǎng)絡(luò),構(gòu)建定向的信息整合程序,賦予每一個(gè)層級(jí)對(duì)應(yīng)的聚類指令,營(yíng)造穩(wěn)定的信息處理整合環(huán)境。隨后,將測(cè)試數(shù)據(jù)庫(kù)與XML數(shù)據(jù)中心相關(guān)聯(lián),可以更好地完成局部數(shù)據(jù)模式向全局?jǐn)?shù)據(jù)模式的定向轉(zhuǎn)化,實(shí)現(xiàn)信息資源的適配處理之后,對(duì)數(shù)據(jù)庫(kù)中的元數(shù)據(jù)定義,將所選擇的數(shù)據(jù)劃定為4 個(gè)小組,每一個(gè)小組的數(shù)據(jù)量均不同,利用模糊聚類分析法,對(duì)電子信息資源整合的響應(yīng)時(shí)間計(jì)算,具體如式(8)所示。
M=3b-0.2+ (8)
式8中:M 表示響應(yīng)時(shí)間; b 表示定向測(cè)定距離;g表示虛擬迭代次數(shù)。通過上述計(jì)算,最終可以得出實(shí)際的響應(yīng)時(shí)間。對(duì)得出的結(jié)果對(duì)比分析,如表3 所示。
表3 測(cè)試結(jié)果對(duì)比分析表
根據(jù)表3,可以完成對(duì)測(cè)試結(jié)果的對(duì)比分析:與傳統(tǒng)的LAM 信息資源整合測(cè)試組及傳統(tǒng)改進(jìn)ORM 信息資源整合測(cè)試組相對(duì)比,本文所設(shè)計(jì)的模糊聚類信息資源整合測(cè)試組最終得出的響應(yīng)時(shí)間相對(duì)較為迅速,表明在對(duì)電子信息資源整合的處理上,效率較高,誤差較小,整合環(huán)節(jié)得到了更好地處理,具有實(shí)際的應(yīng)用價(jià)值。
3 結(jié)束語
綜上所述,便是對(duì)基于模糊聚類的電子信息資源整合方法的分析和研究。對(duì)比于傳統(tǒng)的信息資源整合方法,本文在模糊聚類分析的輔助之下,構(gòu)建更為靈活、多變的信息整合模式,在復(fù)雜的背景環(huán)境之下,可以更為迅速、清晰地完成目標(biāo)任務(wù)的處理,最大程度降低信息整合誤差的發(fā)生概率,與網(wǎng)絡(luò)相關(guān)聯(lián),形成動(dòng)態(tài)的信息處理程序,通過指令引導(dǎo),營(yíng)造一個(gè)穩(wěn)定、安全的處理環(huán)境,更加符合現(xiàn)代化發(fā)展的需求,促使信息資源整合配置更為高效,通信效率大幅提升,發(fā)展前景廣闊。
參考文獻(xiàn):
[1]朱智斌. 大數(shù)據(jù)背景下不動(dòng)產(chǎn)登記檔案信息資源整合方法研究[J]. 城建檔案,2020,14(12):109-110.
[2]孟學(xué)堯,郭倩倩,郭海儒. 一種改進(jìn)螢火蟲算法的模糊聚類方法[J]. 小型微型計(jì)算機(jī)系統(tǒng),2021,42(6):1165-1170.
[3]王慧,王海江,高攀,等. 新疆生產(chǎn)建設(shè)兵團(tuán)農(nóng)業(yè)資源數(shù)據(jù)采集與整合方法研究[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào), 2021,3(2):31-41.
[4]顧羽. 基于FCM模糊聚類方法以變電站為單元的電力系統(tǒng)負(fù)荷分類研究[J]. 機(jī)電信息,2020, 25(33):22-23+25.
[5]熊學(xué)鋒,彭小慶,曹鑫. 基于改進(jìn)ORM的Oracle數(shù)據(jù)庫(kù)異構(gòu)資源整合方法研究[J]. 電子設(shè)計(jì)工程,2020,28(21):38-41 +46.
[6]張小靜,楊曉靈,劉青松. 數(shù)字轉(zhuǎn)型背景下科研檔案資源整合實(shí)踐路徑和方法研究[J]. 城建檔案,2021, 34(12):44-45.
[7]馮國(guó)禮,李蓉,吳雙. 基于人工智能技術(shù)的電力信息系統(tǒng)運(yùn)維數(shù)據(jù)整合方法[J]. 電力信息與通信技術(shù), 2022, 20(1): 68-73.
[8]賈君枝. LAM館藏資源的元數(shù)據(jù)整合方法比較分析[J]. 檔案學(xué)研究,2022, 21(1):79-84.
(本文來源于《電子產(chǎn)品世界》雜志2023年7月期)
評(píng)論