谷歌正在開發新的膚色分類方法,試圖遏制科技產品存在的種族偏見
近日,根據路透社報導,谷歌正在開發一種替代行業標準的膚色分類方法。
這一做法與近年來備受關注的種族話題有著密切關係。越來越多的技術研究人員和皮膚科醫生表示,目前的膚色分類方法不足以評估某種產品是否對有色人種產生了偏見。
目前使用的膚色分類方法源自1970年代,是一種被稱為菲茨帕特里克皮膚類型(FST)的六色標度。除皮膚科醫生外,不少科技公司也依靠其來對人種進行分類,並用此來衡量面部識別系統或智能手錶心率傳感器等產品在不同膚色中的表現。
批評者說,FST對白皮膚有四種分類,而對“黑色”和“棕色”皮膚則分別只有一個大類,這無疑是無視了有色人種之間的多樣性。
去年10月,美國國土安全部的研究人員在聯邦技術標準會議上建議,放棄FST進行面部識別,因為它不能很好地代表不同人群的膚色範圍。
對此,谷歌稱,一直以來公司都在尋求更好的措施。
谷歌表示:“我們正在研究可能對產品開發有用的、具有替代性的、更具包容性的措施,並將與科學和醫學專家以及有色人種社區合作。”
其實,關於這項革新,科技行業內收到的影響更大。相較於金融等行業,從事科技行業的白人更多。但隨著人工智能提供支持的新產品擴展到醫療保健和執法等敏感和受監管領域,確保技術適用於所有膚色以及不同年齡和性別的重要性也隨之越來越大。
此前,不少類型的產品提供了比FST豐富得多的面板。Crayola去年推出了24款膚色蠟筆,今年美泰公司的芭比時尚達人娃娃涵蓋了9種色調。
這個問題對谷歌來說並不只表現在學術方面。當谷歌在2月份宣布某些安卓手機的攝像頭可以通過指尖測量脈搏率時,它表示,無論用戶的皮膚是淺色還是深色,讀數的平均誤差都只會保持在1.8%左右。
後來谷歌也提供了類似的保證,即皮膚類型不會顯著影響視頻會議中過濾背景的功能,也不會影響即將推出的用於識別皮膚狀況的網絡工具。
已故哈佛大學皮膚科醫生Thomas Fitzpatrick博士發明了一種量表,用於個性化紫外線輻射,以此來治療銀屑病。他通過詢問“白人”的皮膚在陽光下經過一段時間後會出現多少曬傷或曬黑,將他們的皮膚分組為I到IV。
十年後,出現了“棕色”皮膚的V型和代表“黑色”皮膚的VI。
但該量表仍然是美國測試防曬產品法規的一部分,也仍然是評估患者癌症風險等的流行皮膚病學標準。
一些皮膚科醫生表示,該量表是一種糟糕且過度使用的護理措施,並且經常與種族混為一談。
“很多人會認為我是V型皮膚,這種皮膚很少甚至永遠不會被曬傷,但事實證明我會。”賓夕法尼亞大學皮膚科醫生Susan Taylor說,他於2004年創立了皮膚顏色協會,以促進對邊緣化社區的研究。
直到最近,科技公司才對此開始上心。Unicode是一個監督表情符號的行業協會,2014年公司引用FST黃色以外的五種膚色為基礎,稱該比例“沒有負面關聯”。
2018年,一個題為“Gender Shades”的研究發現,面部分析系統往往在歸類膚色較深的人種外經常出現錯誤,但仍推廣使用FST來評估AI。該研究將FST描述為“起點”,後來進行類似研究的科學家表示,他們使用該量表是為了保持一致。
“作為針對相對不成熟的市場的第一個措施,它的目的是幫助我們識別危險信號。”專注於審計AI的研究員Inioluwa Deborah Raji說。
在4月份的一項測試人工智能檢測深度偽造的研究中,Facebook的研究人員寫道,FST“顯然不包括棕色和黑色膚色的多樣性”。儘管如此,他們還是發布了3,000個人的視頻,用於評估人工智能係統,並根據八位人類評估者的評估附加了FST標籤。
評估者的判斷是核心。去年,面部識別軟件初創公司AnyVision提供了部分名人的評分示例:前棒球巨星Derek Jeter是IV型,Tyra Banks是V,說唱歌手50 Cent是VI。
AnyVision表示,它同意谷歌重新考慮使用FST的決定。Facebook同樣表示願意採取更好的措施。
受到Black Lives Matter運動的啟發,加州大學聖地亞哥分校的臨床醫生去年在Sleep雜誌上寫道,使用FST可能會使智能手錶在讀取深色皮膚人種的心率時存在較大誤差。
微軟承認FST的缺陷。蘋果表示,它使用各種措施對不同膚色的人類進行測試,FST並不是唯一指標。Garmin表示,由於進行了廣泛的測試,它認為讀數是可靠的。
創立化妝公司Mob Beauty並幫助Crayola開發新蠟筆的Victor Casale說,他為粉底開發了40種色調,每種色調與下一種色調相差約3%,足以讓大多數成年人區分。
他說,電子產品的色彩準確度表明技術標準應該有12到18種色調,“6種是肯定不夠的”。