為了更快速且準確地預測邊坡穩定性,許多學者開始探索機器學習方法在邊坡穩定性分析中的應用,其中支持向量機、隨機森林等模型被證實在預測邊坡穩定性方面有較高的準確率。已有研究證明了混合機器學習模型能綜合多個機器學習模型的優點,從而提高預測精度,但也暴露出混合模型可解釋性較差和過擬合風險較高等問題。為克服混合機器學習模型的缺點,啟發式算法開始被應用于優化機器學習模型。相比混合機器學習模型,啟發式算法通過其獨特的元啟發式搜索機制,在非凸、多峰及高維優化空間中展現出更強的全局搜索能力,顯著提升了算法對超參數搜索空間的探索效率,這一特性使其能夠突破局部最優限制,為機器學習模型遴選出更具泛化能力的超參數配置,進而實現模型預測精度與魯棒性的同步提升。
常春藤算法(IVY)是一種新開發的生物啟發算法,該算法取自常春藤植物的生長模式,模擬了常春藤種群的有序協調增長和擴散進化的過程。武漢科技大學黃詩冰團隊采用IVY對隨機森林、決策樹、多層感知器、支持向量機4種機器學習模型的超參數進行優化,并通過準確率、召回率、查準率、F1值、特異度和AUC值對優化后模型性能進行評價分析,比選出邊坡穩定性預測的最佳機器學習模型,并進一步探究IVY相比傳統啟發式算法的優勢與不足。
數據集的建立與處理
構建數據集時首先要選取合適的特征,選取的特征應該在滿足反映評估對象特性的同時避免冗余。從邊坡幾何形態來看,坡高和坡角影響邊坡自重和應力分布,是影響邊坡穩定性的重要因素;從邊坡自身物理力學性質看,巖土體的諸多強度參數反映了邊坡內在力學性質與邊坡穩定性之間的關系,尤其是粘聚力和內摩擦角在巖土工程領域被廣泛使用;重度也是邊坡巖土體重要的物理參數,它直接影響影響邊坡的自重,較大的重度會增加邊坡的總負荷,增加邊坡失穩的風險;從誘發邊坡失穩的外界條件看,水是誘發邊坡失穩最常見的外界因素,可通過孔隙水壓比反映水對邊坡穩定性的影響。研究中選取以上6個參數作為數據集的特征參數,并收集了392個邊坡案例構建數據集,其中表現為穩定的邊坡有201個,表現為失穩的邊坡有191個。
各特征的小提琴圖
預測模型建立
IVY模擬了常春藤植物的生長和在種群中的傳播過程。算法首先創建一組位置隨機的常春藤植物種群,種群中的每個個體代表一個可能的解。個體通過目標函數評估其適應度,適應度(或越低,由目標函數決定),表示個體解越優。常春藤種群中的個體會選擇最接近且最強的相鄰個體作為自我改進對象,在優化機器學習模型時,常春藤植物借助最強鄰居向光源攀爬的過程實際上就是超參數借助相鄰最佳超參數向全局最優超參數靠近的過程。
首先建立機器學習模型,然后IVY會隨機生成一組初始化種群,初始種群中每個常春藤個體的位置則決定了機器學習模型的初始超參數組合。機器學習模型在獲得初始超參數組合后將對模型進行訓練、測試和評價,評價指標值(如準確率等)將作為適應度傳遞給初始種群。初始種群將根據個體適應度的高低進行排序,保留適應度高的個體,淘汰適應度低的個體,這一過程也是淘汰較差超參數組合的過程。在淘汰適應度較差的個體后,種群將圍繞適應度高的個體進行傳播與變異,生成新的個體,從而完成種群的更新。種群更新產生更優秀個體意味著機器學習模型獲得了更優的超參數組合,機器學習模型將根據更優的超參數組合再次進行訓練、測試和評價。重復上述過程,直至達到最大迭代次數,整個過程中產生的最大適應度個體的位置就是最佳的超參數組合。
VY優化機器學習模型流程
實踐結果
每個機器學習模型在經過常春藤算法優化之后準確率都得到了提升,分別提高了8.4%、8.81%、18.76%和23.56%,其中隨機森林在優化后準確率最高,達到了90.68%;支持向量機的準確率提升幅度最大,從優化前的59.49%提升到了83.05%,共提升23.56%;隨機森林在優化后除召回率和AUC值外,另外4個指標都得到了明顯提升,表明隨機森林的整體預測能力得到了增強;決策樹在優化后召回率有所下降,而其他5個指標都得到了提升,表明決策樹在經過IVY優化后,犧牲了一部分預測穩定邊坡的能力,但模型的整體性能得到了提升,尤其是預測失穩邊坡的能力得到了大幅增強;多層感知器召回率也有所下降,但其他指標的提升十分明顯,尤其是查準率和特異度得到了大幅度的增長,表明模型在優化前偏向于預測穩定邊坡,但經過優化后,模型的性能在整體得到提升的同時變得更加均衡;支持向量機在優化后每個指標都得到了提升,說明其性能在優化后得到了全面增強;優化后隨機森林算法的準確率、召回率、F1值和AUC值均高于另外3種模型,查準率和特異度也處于較高水平,說明隨機森林算法更適合預測邊坡穩定性。
4種模型優化前后指標對比
結 論
(1)利用常春藤算法對4種機器學習模型進行優化,每個機器學習算法在經過常春藤算法優化后準確率都得到了提升,其中隨機森林在優化后準確率最高,達到了90.68%;支持向量機的準確率提升幅度最大,從優化前的59.49%提升到了83.05%,提升了23.56%。表明常春藤算法能夠有效提高機器學習預測邊坡穩定性的準確率。
(2)優化后隨機森林模型的準確率、召回率、F1值和AUC值均高于另外3種模型,查準率和特異度也處于較高水平,各項指標的均衡發展表明其能夠精準平衡邊坡穩定性預測的敏感性與可靠性,是當前數據條件下的最優預測模型。
(3)經IVY優化后的隨機森林準確率和PSO相同,高于GA,并且IVY在優化隨機森林時能夠比PSO和GA更快收斂,表明IVY在優化隨機森林模型時整體效果優于PSO和GA這2種傳統啟發式算法,為解決機器學習超參數優化問題提供了新途徑。
原文下載
蔡玉林,黃詩冰,徐劍波,等.基于常春藤算法優化機器學習模型預測邊坡穩定性的研究[J/OL].金屬礦山,1-11.
作者簡介
黃詩冰
教授,博士生導師,武漢科技大學城市建設學院院長。兼任全國非煤礦山安全生產專家,中國巖石力學與工程學會極地專委會常務委員,湖北省地下工程學會常務理事,《金屬礦山》雜志青年編委等。長期從事寒區巖土工程、工程地質災害防治以及固廢資源化利用等方面研究。主持國家自然科學基金項目3項(面上項目2項)、湖北省杰出青年基金項目1項、武漢市自然科學基金特區計劃項目1項。作為第一作者或通訊作者發表SCI/EI論文50余篇,其中中科院一、二區論文近40篇,授權發明專利13件。入選了湖北省“楚天學子”,2024年全球前2%頂尖科學家榜單和中國知網高被引學者TOP1%榜單。
《金屬礦山》簡介
《金屬礦山》由中鋼集團馬鞍山礦山研究總院股份有限公司和中國金屬學會主辦,主編為中國工程院王運敏院士,現為北大中文核心期刊、中國科技論文統計源期刊(中國科技核心期刊)、中國精品科技期刊(F5000頂尖學術論文來源期刊)、中國百強報刊、RCCSE中國核心學術期刊(A)、中國期刊方陣雙百期刊、國家百種重點期刊、華東地區優秀期刊,被美國化學文摘(CA)、美國劍橋科學文摘(CSA)、波蘭哥白尼索引(IC)、日本科學技術振興機構數據庫(JST)等世界著名數據庫收錄。主要刊登金屬礦山采礦、礦物加工、機電與自動化、安全環保、礦山測量、地質勘探等領域具有重大學術價值或工程推廣價值的研究成果,優先報道受到國家重大科研項目資助的高水平研究成果。根據科技部中國科技信息研究所發布的《2024中國科技期刊引證報告(核心版)》,《金屬礦山》核心總被引頻次位列26種礦業工程技術學科核心期刊第1位;根據中國知網發布的《中國學術期刊影響因子年報》(2024版),《金屬礦山》學科影響力位居73種礦業期刊第9位。
供稿:曾文旭
編排:戴穎熠
審核:王小兵
聲明:本文系轉載自互聯網,請讀者僅作參考,并自行核實相關內容。若對該稿件內容有任何疑問或質疑,請立即與鐵甲網聯系,本網將迅速給您回應并做處理,再次感謝您的閱讀與關注。
不想錯過新鮮資訊?
微信"掃一掃"