IBM發(fā)布了一套包括100萬張多元化的人類臉部圖像的(Diversity in Faces)數據合集,希望能夠幫助開發(fā)者們訓練基于人工智能和神經網絡的臉部識別系統,提高AI在臉部識別方面的多樣性和準確性,戰(zhàn)勝面對年齡、性別和種族膚色差異的人臉識別時存在的技術偏見問題。
此前研究人員發(fā)現人臉識別分析軟件依據其識別對象的年齡、性別和種族膚色的差異,結果會反饋出不同的準確性表現,存在一定的技術偏見。
整套IBM數據庫采集自Flickr共享CC協議的1億多張人臉影像和視頻中,數據庫圖像均有注釋著顱面測量數據(頭部高度、鼻梁高度、前額高度、臉部比例)年齡、性別、姿勢、清晰度等等。
目前這套數據庫已經于今日向開發(fā)者社區(qū)開放。