近日,網(wǎng)絡(luò)空間安全學(xué)院王震教授課題組的研究成果被軟件工程領(lǐng)域國際頂級(jí)會(huì)議The 40th IEEE/ACM International Conference on Automated Software Engineering (ASE 2025) 錄用。論文題目為“Provable Fairness Repair for Deep Neural Networks”,第一作者為23級(jí)研究生馬迦南。

ASE是軟件工程領(lǐng)域CCF-A類會(huì)議,被譽(yù)為軟件工程領(lǐng)域四大最高級(jí)別國際學(xué)術(shù)會(huì)議之一,所收錄的成果代表了該領(lǐng)域的最高研究水平。本次大會(huì)將于2025年11月16-20日在韓國首爾舉行,共錄用245篇論文,錄用率為20.6%。
深度神經(jīng)網(wǎng)絡(luò)在諸多決策任務(wù)中展現(xiàn)出卓越性能,但其“個(gè)體歧視”問題已引發(fā)廣泛倫理關(guān)注。現(xiàn)有公平性修復(fù)方法通常依賴訓(xùn)練數(shù)據(jù)或啟發(fā)式調(diào)整,缺乏形式化的理論保障與對(duì)未見樣本的泛化能力。針對(duì)這一挑戰(zhàn),本研究首次提出了一種具有可證明公平性保證的神經(jīng)網(wǎng)絡(luò)修復(fù)框架ProF。

ProF包含兩個(gè)核心階段:首先使用區(qū)間邊界傳播(Interval Bound Propagation)技術(shù),對(duì)模型在偏見樣本相似集合上的輸出范圍進(jìn)行可靠刻畫,從而識(shí)別并收緊偏見行為。在第二階段,ProF進(jìn)一步合成更精確的符號(hào)邊界,并基于這些邊界將公平性約束與模型參數(shù)變化構(gòu)建為約束求解問題。通過引入對(duì)偶理論,ProF消除其中的非線性項(xiàng)同時(shí)保留約束的健全性。得到的MILP可由現(xiàn)有求解器高效求解,最終得到具備可證明公平性保障的修復(fù)模型。
實(shí)驗(yàn)結(jié)果表明,PROF 在四個(gè)主流基準(zhǔn)數(shù)據(jù)集上均實(shí)現(xiàn)了顯著的公平性提升。在修復(fù)集上,PROF 能夠?qū)崿F(xiàn) 100% 可證明的公平性修復(fù);在完整數(shù)據(jù)集和全輸入空間上的泛化率分別達(dá)到 95.93% 和 93.16%,遠(yuǎn)超現(xiàn)有最優(yōu)方法(71.44% 和 72.67%)。此外,PROF 還能靈活擴(kuò)展以支持多敏感屬性和更復(fù)雜的公平性定義,平均提升約 90%,并在多種公平性測(cè)試框架下保持穩(wěn)定表現(xiàn),充分展示了其理論可靠性與實(shí)際適用性。


這一成果是王震教授課題組繼在ICSE 2024(軟件工程CCF-A類會(huì)議) 發(fā)表的神經(jīng)網(wǎng)絡(luò)故障定位及修復(fù)研究和CCS 2025(網(wǎng)絡(luò)安全CCF-A類會(huì)議)發(fā)表的神經(jīng)網(wǎng)絡(luò)可證明缺陷修復(fù)工作之后,在AI安全方向上的又一重要突破。所提出的ProF框架首次為神經(jīng)網(wǎng)絡(luò)個(gè)體公平性修復(fù)提供了形式化保證,展示了團(tuán)隊(duì)在神經(jīng)網(wǎng)絡(luò)驗(yàn)證與修復(fù)領(lǐng)域的持續(xù)探索與積累。









