我國首部規范互聯網信息環境的基礎法規《網絡安適法》在6月1日之后正式實施。
該法實施前,各大互聯網巨頭就紛紛加碼信息安適及內容自查等方面的投入,阿里和騰訊別離通過各自的云辦事輸出其安適技術接口,或強制推行實名制。百度先后發布公告實行百度賬號實名制、百度網盤自6月1日起也要求實名制,百度在安適方面,早就推出了大數據平臺4A安適體系;以個人安適業務起家的360也有完善的大數據安適平臺。
在新法實施同一天,今日頭條頒布頒發成立“網絡安適委員會”。
鈦媒體獲悉,該委員會是一個獨立組織,由技術、運營、審核多部門的核心人才共同參與,從注冊實名制、社區自律以及審核等方面,保障用戶安適和內容。
不生產內容、專注于內容分發的今日頭條,躋身國內內容分發平臺第一陣營,尤其是在2015年9月這家公司推出頭條號以來,頭條號的數量迅速增長,從用戶規模到內容體量,這都要求在平臺運營規則上進一步規范化。
對于內容分發平臺而言,網絡安適最主要的議題是內容安適。以坐擁上億用戶的微信公眾平臺就曾在產品上經歷過無數次迭代,在內容過濾、賬號封禁、用戶舉報機制上做足了功夫。今日頭條抽調了 20 余人的技術團隊,專門匹配給網絡安適委員會,顯然,在網絡安適建設方面依然是一個技術升級的信仰者。
近日,今日頭條首度向鈦媒體透露了其在網絡安適和內容審核上的獨家“法寶”。作為“幕后英雄”的網絡安適委員會,到底是如何運作的?算法模型、人工智能,到底是怎么幫手人工完成安適審核?
一、實名制升級:接入face++識別技術
有自媒體從業者曾向鈦媒體證實,頭條號開放平臺的注冊極為嚴格。在賬號注冊上,根據相關政策要求用戶注冊必需綁定手機,并且堅持人工審核。
2017年,新成立的網絡安適委員會對實名制進行了一次技術升級,即通過AI技術對注冊用戶進行身份實名認證,這項識別辦事采用了曠視科技(face++)提供的人臉識別、活體檢測技術,來判斷每一位實名用戶各項信息的匹配程度。
鈦媒體記者在本年3月份頭條號發布的一則“嚴厲打擊發布不實負面信息的公告”中看到(如下圖),一共20個頭條號遭遇禁言處罰,并有3名頭條號運營者被封禁。

注冊頭條號的用戶,首先都將要求閱讀并接受一份《頭條號辦理制度》,于頭條號名稱規范、簡介規范、審核尺度、處罰尺度等都做出了明確規定。
由于每個身份證僅限注冊一個頭條號,與其他平臺比擬,頭條號的審核規則是最嚴格的。一旦因運營者違規操作被平臺封禁賬號,“被封禁賬號的身份證也不予釋放”,這也意味著,嚴重的違規操作者可能面臨永久加入“黑名單”的風險。
二、審核機制:如何“干掉”虛假信息
在內容審核方面,各大內容型平臺歷來都是高成本、高投入,內容把關的技術能力,對于內容型平臺來說更是一條生死線。鈦媒體對國內某第一陣營直播平臺的采訪中發現,內容運營的人力成本、技術和設備采購成本加在一起,一個典型的內容型平臺在內容自查上的投入要超過一個億人民幣。
低俗、謠言、標題黨——堪稱國表里各個內容平臺的三大毒瘤。
針對于此,今日頭條在內容審核上采取了一套獨家的“四審機制”,也就是說,在今日頭條的內容審核流程中,文章100%過人工審核,通過“人防”和”技防“的結合,所有文章通過技術過濾、人工審核、盲審、復審的“四審機制”才能發布。
“盲審”環節,充分表現了機器+人工審核的優勢:機器按照規則和比例抽取文章,將同一篇文章同時分配給兩位審核員,如果兩人判斷一致則通過,判斷紛歧致會再分配給第三個人進行把關,通過這種模式最大程度降低了因審核員主不雅觀原因、個人問題造成的誤放、漏放。
那么,最為頭疼并且隱蔽的標題黨,又是怎樣攔截的呢?今日頭條技術負責人向鈦媒體介紹,“標題黨可以通過人工+機器三層攔截,進行識別。”
今日頭條研發團隊建立的數據模型,目前可以準確識別出“標題黨”的內容。一篇完整的文章進入平臺機器經識別和處理,最終從“機器”流程中放出來,今日頭條的技術負責人向鈦媒體還原出了一個完整的識別過程:
當平臺識別出標題黨的關鍵詞后,“發送彈窗”的方式提示并勸導作者打住這樣的行為;通過模型識別而來的標題黨,平臺將召回并人工確認;最后一道工序交給人工——人工復審將對從各種渠道召回的文章進行最終的人工評估復審。