四季線上

臉書用AI對抗仇恨言論見效 主動偵測率攀至97%

2021-06-04 09:37

社群平台臉書(Facebook)今天舉辦亞太區仇恨言論政策線上說明會指出,去年第4季仇恨言論主動偵測率已提升到97.1%,對於未來運用人工智慧(AI)科技偵測仇恨言論將更有信心。

社群平台臉書(Facebook)今天舉辦亞太區仇恨言論政策線上說明會指出,去年第4季仇恨言論主動偵測率已提升到97.1%,對於未來運用人工智慧(AI)科技偵測仇恨言論將更有信心。

臉書亞太區內容政策經理甘米(Manu Gummi)出席線上說明會表示,處理仇恨言論是一大挑戰,因為仇恨言論沒有全球公認的定義,人們對於仇恨言論的容忍度不同,而且仇恨言論需考量脈絡與情境。臉書的工作是提出能應對全球不同情境,並保障所有人表達自由的方法。

甘米指出,臉書將仇恨言論定義為「針對受保護的特徵,直接攻擊他人」。這個定義是在進行對外大量研究,並諮詢許多獨立專家後得出。受保護的特徵包含種族、國籍、信仰、性別認同等,攻擊則包含非人化的言論(例如將人比喻為動物)、有害的刻板印象、貶低性的陳述、鼓吹排擠或隔離等。

她說,隨著技術進步,臉書在解決平台上的仇恨言論取得重大進展。根據臉書社群守則執行報告,在2019 年12月至2020年12月間,臉書對仇恨言論採取行動的數量攀升近400%。

2017年第4季臉書首度納入仇恨言論衡量數據,當時的主動偵測率為23.6%;這代表臉書移除的仇恨言論中,臉書主動發現而非用戶檢舉的比率是23.6%。在2020年第4季,臉書的主動偵測率攀升至97.1%,可歸功於幾個領域的人工智慧科技發展。

其中一項科技是語言理解,能夠建立機器學習分類器,分析多種語言中的相同概念,在一種語言中的學習成果可以改善在另一種語言中的成效。臉書認為,對於網路上較不常用的語言來說,這項科技格外實用。

另一項科技是全文解讀,也就是從整體角度檢視貼文的能力,包括文字、照片和影片等格式,並同時找出各種違反政策的問題,而不需執行多種分類器。

此外,臉書也運用人工智慧技術,在考量傳播力、嚴重性、違規可能性等因素後,優先處理需要審查的內容。

(中央社)

【原文出處】:臉書用AI對抗仇恨言論見效 主動偵測率攀至97%

推薦內容