人民網
人民網>>IT>>行業新聞

曹歡歡一張圖揭秘今日頭條內容安全機制

2018年01月12日15:22 | 來源:中國網
小字號
原標題:曹歡歡一張圖揭秘今日頭條內容安全機制

  “2014年1月我來頭條的時候,研發所有人加起來才不到40人,頭條就已經有專門的審核團隊和審核模型來做內容安全了”

  在1月11日,今日頭條召開的《讓算法公開透明》交流會上,資深算法架構師、中國科學技術大學計算機博士曹歡歡面向業公開算法原理,消除社會各界對算法的一些誤解,同時接受意見和建議。

  曹歡歡介紹說,頭條的主要內容來自PGC和UGC兩塊,兩塊內容都走共同的審核機制。

  對於UGC內容,審核流程第一步是風險模型過濾,算法直接做色情謾罵、非法信息的識別,審核之后,沒問題先小范圍推,搜集用戶反饋。如果有負面反饋或者用戶分享數閱讀數比較大,頭條人工審核會干預。否則就會大范圍推,這個階段如果有負面反饋或者用戶閱讀量超過一個閾值人工審核會再次干預。

  對於PGC內容,每一篇文章都會由專業審核人員審核,如果沒有問題,就進入推薦候選。如果有負面反饋或者用戶閱讀量超過一個閾值人工審核會再次介入,二次確認。

  曹歡歡表示,頭條風險過濾模型中包括鑒黃模型、低俗模型和謾罵模型,這些模型的樣本庫建得非常大,更注重召回率,甚至為了保証識別出問題內容,會犧牲准確率。

  曹歡歡表示,目前整個內容審核機制已經很完整,但內容增長和業務發展非常快,團隊壓力還是很大,頭條是是行業領先者,必須在這塊用最高的要求來要求自己。

  分享過后,曹歡歡在現場解答了社會各界人士對算法的疑問,包括今日頭條如何實現冷啟動,廣告和內容該怎樣平衡,怎樣准確地拓展用戶興趣圖譜等切實的工程性問題。同時,聽取接納了大家對今日頭條算法的意見和建議。

(責編:易瀟、楊虞波羅)

分享讓更多人看到

返回頂部