AI畫畫也有種族歧視?藝術加工軟件把黑人變白人

AI畫畫也有種族歧視?藝術加工軟件把黑人變白人

日本富士通的一支研究團隊利用有向無環圖模型(DAG)研究AI生成藝術中的偏見現象。該研究發現,目前的AI模型在藝術創作時展現出對特定流派、創作風格、種族、思想運動等因素的明顯傾向性。

據分析,這種偏見現象的背後有兩層原因,一方面是標記數據集中各類樣本數量不均衡,一方面是標記過程受標記員主觀影響較大。

該研究發表在康奈爾大學的論文庫arXiv上,名為《藝術史視角下分析AI生成藝術中偏見產生的原因(Biases in Generative Art—A Causal Look from the Lens of Art History)》。

▲日本富士通研究團隊發表《藝術史視角下分析AI生成藝術中偏見產生的原因(Biases in Generative Art—A Causal Look from the Lens of Art History)》一文

原文鏈接:https://arxiv.org/pdf/2010.13266.pdf

一、研究方法:採用DAG進行因果關係分析

隨著人工智能技術研究的不斷深入,人工智能的應用領域也越來越廣泛,其中就有AI生成藝術。從創作繪畫到開闢新的藝術風格,AI被應用到藝術創作的方方面面。

然而,隨著AI藝術創作工具不斷湧現,日本富士通的研究團隊卻指出:社會偏見可能會滲透到AI的藝術創作過程中。

為了驗證猜想是否屬實,富士通研究人員從相關學術論文、在線平台、應用程序入手,從中挑選出描摹現有流派和風格的樣本並展開研究。

研究團隊首先對影響AI創作的主要因素進行了分類,從而確定研究樣本。他們最終選定的樣本均由業內領先的AI系統創作,這些AI系統接受了文藝思潮、流派、創作材料、藝術家等各類標記數據集的訓練。

文藝思潮方面,有文藝復興、立體主義、未來主義、印象派、表現主義、後印象派、浪漫主義等。流派方面,有風景畫、肖像、戰鬥繪畫、素描等。材料方面,有木版畫、版畫、油漆等。藝術家方面,則有克萊門汀·亨特(Clementine Hunter)、瑪麗·卡薩特( Mary Cassatt)、文森特·梵高(Vincent van Gogh)、古斯塔夫·多雷(Gustave Doré) 、吉諾·塞維里尼(Gino Severini)等。

該文共同作者稱,該研究利用了一個名為“有向無環圖”(Directed Acyclic Graphs,“DAG”)的因果模型,他們能夠通過這個模型識別出和AI藝術生成有關的因素,以及這些因素相互影響的方式。

比如,藝術思潮會影響創作材料的選擇,肖像主體會影響藝術家風格的選擇,而DAG能夠將這些複雜的關係可視化,從而更好地分析不同因素之間的因果關係。

二、研究結果:AI藝術創作工具存在種族、性別歧視

經分析,AI系統在進行藝術創作時,存在對特定流派、風格、種族的明顯偏好。

以藝術渲染工具DeepArt為例,用戶可以在DeepArt上導入圖片並添加藝術化渲染效果,最終生成具有特定藝術家風格的圖片。

在處理立體派畫家費爾南·萊熱(Fernand Léger)的作品《推進器(Propellers)》時,DeepArt未能成功將其轉換至未來派風格。在將瑪麗·卡薩特(Mary Cassatt)的現實主義畫作《瑪麗·埃里森小姐(Miss Mary Ellison)》轉換成表現主義風格時,DeepArt又未能展現出表現主義的典型特徵。

▲中為瑪麗·卡薩特(Mary Cassatt)的現實主義畫作《瑪麗·埃里森小姐(Miss Mary Ellison)》;右為凱爾希納(Ernst Ludwig Kirchner)的表現主義畫作;左為AI藝術創作工具Deepart根據右圖風格對中圖加工生成的表現主義作品。然而表現主義的典型特徵之一——變形物體,並未出現在左圖中。

更有甚者,DeepArt同類平台GoArt在為克萊門汀·亨特(Clementine Hunter)的畫作《黑族長(Black Matriarch)》添加表現主義濾鏡時,直接將主體人物的黑膚色變成了紅色,在加工狄賽德里奧的雕塑作品《小男孩(Giovinetto)》時,卻保留了藝術品中人物原本的白色膚色。

▲GoArt將克萊門汀·亨特(Clementine Hunter)的畫作《黑族長(Black Matriarch)》中的主體人物的黑膚色變成了紅色,保留了狄賽德里奧的雕塑作品《小男孩(Giovinetto )》中人物的白膚色。

藝術換臉軟件AIportraits將黑膚色女星泰莎·湯普森(Tessa Thompson)的照片加工成藝術畫時,直接將她的膚色調亮了幾個度。

▲AIportraits將黑膚色女星泰莎·湯普森(Tessa Thompson)膚色調亮

另一款藝術加工工具Abacus直接把拉斐爾(Raphael)和皮耶羅·迪科西莫(Piero di Cosimo)作品中的長發年輕男子識別為女性。

三、原因分析:標記數據集的樣本失衡

富士康的研究團隊認為,這種偏見主要來自前期訓練AI時使用的標記數據集。一方面,受到研發人員偏好影響,這些標記數據集涉及的樣本數量可能不夠均衡。以AI Portraits為例,該應用程序的訓練樣本便是以文藝復興時期的白人肖像為主。

另一方面,給數據集做標註或是打標籤的過程中可能存在標準不一致的情況。註釋者擁有不同的偏好、文化和信念,這些差異可能會在他們創建的標籤中得到反映。

論文指出,各類訓練樣本的數量並不均衡,比如照片很多、雕塑很少;歐洲藝術家很多、本土藝術家很少;文藝復興、現代藝術運動作品居多,其他思潮作品很少。數據集也未能體現出不同種族、風格的面孔差異,因此出現了代表性偏差。

研究團隊警告說,為藝術生成AI建模時,如果忽略某些細微因素,將造成社會、文化、政治方面的錯誤歷史認知,從而影響人們正確地認識某些重要史實。

他們敦促AI研究人員和從業人員在考慮相關社會政治因素的前提下,應謹慎檢查AI系統的設計原理。

結語:機器理性仍靠人智實現

還記得《終結者》系列中,施瓦辛格扮演的機器人T-800眼冒紅光、冷面無情的模樣,然而事實和科幻相去甚遠,機器人目前既沒有自主思考能力,更沒有人類獨有的情感和慾望。

人工智能仍依賴算法編程實現。因此,人工智能的好與壞、公平與偏頗全掌握在人類手中,這就對人類軟件開發專家提出了更高的要求。

俗話說“上樑不正下樑歪”,如果人類開發者在訓練AI的過程中,沒有很好地考慮到社會公平的因素,那麼個人認識的局限性和偏差便會傳遞到AI上。

比如說,谷歌BERT等大語言模型的訓練樣本就忽略了貧困地區尚不能聯網的弱勢群體,藝術生成AI的訓練樣本又主要以西方白人肖像為主。

不管是在藝術創作領域,還是在語言模型領域,AI訓練樣本不均衡導致的代表性偏差都是一個值得關注和深思的問題。若想充分發揮機器的理性優勢,人類開發者在設計系統架構和訓練AI的過程中必須更加謹慎細緻。

發表迴響