新人工智能框架:消除衛生、教育和招聘等領域的偏見

西班牙納瓦拉大學(University of Navarra)數據科學與人工智能研究所(DATAI)的研究人員發佈了一種創新方法,該方法提高了用於關鍵決策的人工智能模型的公平性和可靠性。這些決策對人們的生活或組織的運營有着重大影響,例如在衛生、教育、司法或人力資源等領域。

這個由研究人員阿爾韋託·加西亞·加林多、馬科斯·洛佩斯·德·卡斯特羅和魯本·阿馬尼亞薩斯·阿內迪略組成的團隊開發了一個新的理論框架,用於優化可靠機器學習模型的參數。這些模型是能夠透明地進行預測並確保一定置信水平的人工智能算法。在這項成果中,研究人員提出了一種能夠減少與種族、性別或社會經濟地位等敏感屬性相關的不平等現象的方法。

這項研究成果發表在《機器學習》(Machine Learning)雜誌上。它將先進的預測技術(共形預測,一種新型的預測技術,可在一定程度上提高預測的準確性和可靠性)與受自然進化啓發的算法(進化學習,一種借鑑自然進化原理的算法)相結合。衍生出的算法提供了嚴格的置信水平,並確保不同社會和人口羣體之間的公平覆蓋。因此,這個新的人工智能框架能確保結果公平無偏見,無論個體有何特徵,都能提供相同的可靠性水平。

“由於可能存在算法歧視,人工智能在敏感領域的廣泛應用引發了倫理方面的擔憂,”納瓦拉大學DATAI項目的首席研究員阿內迪略解釋道。

“我們的方法使企業和公共政策制定者能夠根據自身需求選擇兼顧效率與公平的模型,或者應對新出現的法規。這一突破是納瓦拉大學致力於培育負責任的人工智能文化、推動該技術合乎倫理且透明使用的一部分。”

研究人員在四個具有不同特徵的基礎數據集上測試了這種方法,這些數據集來自與經濟收入、再次犯罪情況、再次住院情況和入學申請相關的現實領域。結果表明,新的預測算法顯著減少了不平等現象,而且沒有影響預測的準確性。

納瓦拉大學數據與人工智能項目的博士前研究員、該論文的第一作者阿爾貝託·加西亞·加林多指出:“在我們的分析中,例如,我們發現入學申請預測中存在驚人的偏差,這表明基於家庭經濟狀況存在嚴重的不公平現象。”

“反過來,這些實驗表明,在很多情況下,我們的方法成功減少了此類偏差,且未損害模型的預測能力。具體而言,通過我們的模型,我們找到了一些解決方案,在這些方案中,在維持預測的準確性的同時,歧視幾乎被完全消除。”

該方法提供了最優算法的“帕累托最優前沿”(帕累託前沿是指在多目標優化問題中,所有非劣解所構成的集合邊界,這些解在不同目標之間進行權衡,無法在不損害其他目標的情況下改進任何一個目標),這能讓我們根據優先級將最佳可用選項可視化,並針對每種情況瞭解算法公平性和準確性之間的關係。

研究人員表示,這個創新在一些領域有很大的潛力,在這些領域中人工智能必須支持可靠且合乎道德的關鍵決策。加西亞·加林多指出,他們的方法“不但有助於公平,還能讓人們更深入地明白模型配置如何影響結果,這能給人工智能算法監管方面的未來研究起到引導作用。”

研究人員已將研究中的代碼和數據公開,來鼓勵在這個新興領域進一步做研究應用並且提高透明度。