人民網
人民網>>IT

AI尋親:一張童年照片找到失蹤19年的孩子

左燕燕
2019年09月09日08:12 | 來源:新京報
小字號
原標題:AI尋親:一張童年照片找到失蹤19年的孩子

  優圖團隊使用跨年齡人臉識別技術進行實驗。騰訊優圖供圖

  6月19日,借助跨年齡人臉識別技術,深圳失聯19年男孩被找回,和父母相認。受訪者供圖

  徐某夫婦在深圳街頭把尋子啟事攤開並接受媒體採訪。受訪者供圖

  【編者按】 科技改變生活,也改變父母尋子的路程。

  2014年上映的電影——《親愛的》,把失子家庭之痛呈現在公眾面前。從失子那一刻起,他們踏上漫漫尋子路,從繁華都市,到偏僻鄉村,一山一水,一草一木,都留下他們尋子的身影,但多數都無功而返。

  跨年齡人臉識別技術,正在改變這種狀況。近些年,從公安部、民政部到騰訊、百度、今日頭條,政府和企業在合力完成一項任務:借助跨年齡人臉識別技術,讓被拐和走失兒童回家。

  AI尋親,一個源代碼,便是失子家庭的一個希望。沒有一項技術應用,會比讓失散的親人團聚更圓滿。

  如果孩子被拐10年時間,案件線索中斷,僅憑一張被拐時兩三歲的照片,如何找到他?

  這是發生在2009年前后的10起拐賣兒童案,2014年嫌疑人被四川警方抓獲時,由於買賣兒童的中間人沒找到,10名兒童一直下落不明。

  桂宏正的孩子也是被拐的一員。10年來,他們嘗試尋子的方法,都是徒勞。孩子被拐前唯一的一張照片,印在尋人啟事上貼滿城市的電線杆﹔群發在論壇和貼吧上﹔印制在尋人扑克牌上。都沒有結果。

  警方也在尋找,曾帶著嫌疑人前往汕頭指認現場,聯系沈陽著名刑事相貌專家模擬孩子10歲左右的畫像,甚至前往汕頭篩查2009年左右上戶口的男孩,同樣無果。

  直到2017年底,公安部刑偵局副局長陳士渠在企業調研。在得知人工智能和跨年齡人臉識別技術后,提出在四川這起積案中初次嘗試。

  2019年,借助跨年齡人臉識別技術,這10名被拐男孩成功比中7人。隨后,深圳警方同樣依托該技術,找回5名被拐兒童,其中時間最久的,已經被拐19年。

  公安部刑事偵查局打拐辦主任陳建鋒認為,跨年齡人臉識別技術將警方尋人的范圍縮小,以四川的拐賣兒童案為例,AI技術將原本十幾萬的數據范圍縮小到三位數以內,大大縮小了警方的偵查和落地工作。

  目前,這項技術尚在起步階段。陳建鋒認為,下一步會考慮向全國范圍推廣。同時,AI技術只是尋親的輔助方法,最終的認定,還是需要進行DNA比對。建議尋親家屬就近找到各地公安機關將NDA錄入信息庫中,“技術是輔助,現實中,尋親只是一滴血的距離。”

  10名兒童被拐下落不明

  過去的幾年裡,四川打拐辦的民警們,一直在和一起拐賣兒童案“較勁”,民警心系的,是案件中已經被拐賣10年的10名兒童。

  2014年,警方抓獲了一名拐賣兒童嫌疑人王浩文,發現同年發生在四川遂寧、巴中、南充的三起案件,均是王浩文以給孩子買東西為由,將三名男孩拐走,並通過中間人以10萬元左右的價格,賣往廣東汕頭。

  三名被拐男孩很快被解救,王浩文等5名嫌疑人因拐賣兒童罪獲刑,其中王浩文是主犯,獲刑15年。

  專案組在偵查中還發現,在2008年、2009年、2010年四川其他城市發生的10起拐賣兒童案中,嫌疑人作案手法、相貌特征均和王浩文相似,在審訊過程中,王浩文也承認這10起積案均是他所為,但他堅稱帶走孩子的一名中間人,始終沒能找到。

  線索就此中斷。

  一個比較明確的方向是,這10名被拐男孩,去向應該都是在廣東汕頭。四川省公安廳打拐處處長蔣曉玲回憶,王浩文每賣掉一個孩子,喜歡在當地立即將錢存進賬戶,而在汕頭,王浩文有多筆進賬。

  根據公開資料,2014年末,汕頭總人口(戶籍)是546.57萬人。蔣曉玲明白,想要找到這10名被拐男孩,如同大海撈針。

  所有可以想到的辦法,專案組民警都有嘗試。

  2014年底,民警將王浩文從看守所提出來,押到廣東去指認他和中間人接頭的地點。到了目的地,他卻只是說找不到了,“路都變了,認不出。”在語言不通的汕頭,這些四川的民警試過挨家挨戶走訪,沒有結果。

  2015年,專案組聯系了沈陽著名刑事相貌專家、中國刑警學院的趙成文教授畫像,根據孩子們被拐時3歲左右的照片,模擬出他們10歲左右的畫像。

  根據這些畫像,民警前往汕頭,花了10天時間,從當地十幾萬適齡男孩的照片中一條一條比對,用肉眼看是否相像,分析家庭中是否有懷疑的因素,比如男孩和父母年齡差別多大,有幾個姐姐,和姐姐年齡差別多大,是否同一年有兩個孩子?

  通過這種“笨”方法,民警從十幾萬的數據裡,挑出300多張照片帶回四川,組織家長和幼兒園老師進行辨認。青少年時期正是相貌變化最大的時候,蔣曉玲說,家長辨認時,時常會覺得這都是自己的孩子,看著看著,夫妻之間有時又會為了當初丟孩子的事,陷入爭吵。

  被拐男孩小杰(化名)的父親桂宏正在接受媒體採訪中,提及當時的辨認結果時,總認為真的找到了孩子,因為“太像了,感覺有80%的把握。”辨認最后,民警從這300多張照片中提取了176張“特別像的”進行DNA比對,可最終,一個也沒比中。

  蔣曉玲認為,僅憑肉眼去觀察,是很不科學的方法,“可這也是沒有辦法的辦法。”

  專案組沒有放棄,2016年,他們前往汕頭篩查2009年左右上戶口的男孩,可篩查出的疑似對象數量太多,無法一一調查核實,這項工作最終也隻能停擺。2017年5月,他們又找到企業發布定向尋親信息,印發了1萬份尋親懸賞公告,結果隻有十幾個電話打來核實情況。

  如何繼續尋找這10名被拐男孩,局面陷入了困境。

  依托AI技術找回7名被拐兒童

  2017年,正是人工智能(AI)快速發展的時期,人臉識別技術,已經運用到警方的辦案領域。企業已經可以運用人臉識別技術,通過一張照片,和數據庫中N個人臉進行比對,找出最相似的一張臉或多張臉。

  同年底,公安部刑偵局副局長陳士渠到企業調研,在得知人工智能和跨年齡人臉識別技術后,陳士渠很感興趣,他想起了四川的這起拐賣案,他曾多次前往四川督辦此案,希望找到突破口。事后,他讓企業的技術團隊和四川警方對接。

  工作的第一步,是四川警方從家長手中收集孩子被拐時的照片,所幸的是,這10個孩子都保留被拐前的生活照,照片老舊發黃,有的家長們用油紙一層層的包裹,其中年齡最小的,隻保留有兩三個月大的照片,還有的因為父母長期打工搬家,照片已經丟失,隻留有報案時留在警方DNA數據庫的掃描文件。

  在四川警方工作人員蔣曉玲看來,當時他們的期待,只是為尋找孩子多一條路,能走通就走,走不通,就再換一條路。

  收集的10張照片,被統一送往企業的優圖實驗室裡,他們再用數字化高清儀器將照片提取出來。

  2018年11月,在進行了第一次的比對后,10個文件夾壓縮包轉交到蔣曉玲的手上。每個文件夾裡有101張照片。第一張照片是被拐兒童兩三歲的樣子,剩下的100張照片,是100個13歲左右的兒童,他們以滿分100分制降序排列。

  這100張照片下方寫著分數。蔣曉玲介紹,以75分為例,如果兩個人臉比對分數超過75,則這兩個人臉是“萬裡挑一的像”。再如98.3分,意味著照片中的人與被拐兒童有98.3%的概率是同一個人。

  照片交回到四川警方,后續仍有繁雜的偵查和確認工作。蔣曉玲組織民警,先用四個多月的時間,進行了基礎的刑偵和落地工作,最終的認定,還是需要通過DNA的數據比對。

  比對工作先后進行了三次,第一次的比對,找到4個被拐孩子。2019年2月進行第二次比對,找到1名兒童。2019年3月第三次比對,又找到兩名兒童。至此,這10名被拐兒童中,隻有3人尚未被確認身份。

  這個結果讓蔣曉玲和團隊驚喜,尤其是那張被拐時隻有兩三個月大的孩子照片,最終竟也能比中。在她看來,這初次的嘗試,顯示出技術的強大,而同時,算法也在不斷進行優化,因此才有了先后三次的比對。至於剩余的三名被拐男孩,蔣曉玲懷疑,有可能不在汕頭地區,而他們接下來的工作,除了尋找剩余的三名男孩外,還包括對涉案人員的追責。

  2019年,正在服刑的王浩文再次被四川警方從監獄提出來,其他涉案人員也被再次抓捕,蔣曉玲表示,他們將按照漏罪處理,目前還在搜集証據中。

  尋找年齡演變中不變的細節

  這是跨年齡人臉識別技術配合警方打拐尋親的第一次成功運用。

  和普通人臉識別技術不同,跨年齡比對是一個公認的難點,青少年階段人臉特征變化最大,而這些年齡跨度超過了10年的兒童,技術應用是一個非常大的挑戰。

  蔣曉玲告訴新京報記者,10年時間,孩子的變化之大,可能走到身邊,父母都無法認出。她印象最深的,是DNA確認后,被拐男孩小杰和親生父母相認的畫面。夫妻倆見到孩子的第一件事,是翻開孩子右腳褲腿,那裡有一處傷疤,是小杰在被拐前被開水燙傷的。

  在看到傷疤后,夫妻倆低語著,“沒錯,沒錯”。這是不太會被時間改變的細節。對於跨年齡人臉識別技術來說,同樣的操作是,需要告訴它,一個人的面部隨年齡演變時,不變的那些量是什麼。比如,一個人的耳垂長得很特別,或者他的眉峰、眉骨走向不一樣,再將這些轉化成數學語言。

  技術人員需要通過各種數學語言教導AI——“這是同一個人。”“這是這個人1歲的樣子,5歲的樣子,10歲的樣子,30歲的樣子。”“這個大人的照片,跟其他小孩子都是不像的。”

  現實條件中,照片的質量、人臉的角度、遮擋、光線都有可能對AI的判斷帶來影響,AI技術,需要盡量克服其他因素的影響,去獲得人臉特征。蔣曉玲在收集照片時,會盡量要求家屬提供正面的、相對清晰的照片,而這次比對的經驗顯示,一張正面的照片,比對結果比清晰的更為重要。

  鑒於四川的成功案例,2019年四五月,深圳警方將17個拐賣兒童的積案重新整理收集照片,利用AI技術在廣東省的數據庫進行比對。

  廣東省公安廳刑偵局反黑處打拐科袁炎良在四川這次行動前,就已經聯系過多家企業,他想到既然成年人可以比對,能否嘗試將兒童小時候和長大后的相貌也進行比對,但此前的多次嘗試,均以失敗告終。

  深圳是一個外來人口較多的城市,與四川不同的是,這17起積案,他們沒有找到嫌疑人,也沒有孩子的明確去向,這次比對,屬於盲比。“用這個技術試一試,孩子是否被拐賣在廣東省內。”袁炎良也沒有想到,最終能在17起積案中,比中5人,其中時間最久的,已經被拐19年時間。

  那是2000年,深圳羅湖發生一起綁架兒童案,綁匪索要贖金二十萬元,隨后小孩和綁匪卻消失了。多年來,警察沒有放棄尋找,也曾找畫像專家進行跨年齡模擬畫像。孩子失聯時隻有3歲,19年過去了,他被找到時在深圳一家餐廳當廚師。

  這是技術給打拐尋親帶來的進步。

  AI尋親能否向全國范圍推廣

  四川和深圳的成功,能否將跨年齡人臉識別技術從個案推向全國范圍,這是公安部打拐辦新的考慮。

  事實上,2017年3月,百度與尋親平台“寶貝回家”開展合作,首批2萬多條尋親數據接入百度跨年齡人臉識別系統對比評測,並篩選出部分疑似案例。被拐27年的付貴成為第一例尋回的走失兒童。

  2018年,民政部開發的全國救助尋親網,已經上線由百度提供的“人臉對比尋親”的功能。尋親者通過上傳走失親人照片與站內照片進行比對,可以查詢全國2000家救助站中是否有自己親人。其中也包括跨年齡識別。

  同年底,今日頭條旗下公益尋人平台“頭條尋人”也正式推出“識臉尋人”功能。用戶上傳走失者照片,即可與頭條尋人后台的走失人員數據庫直接對比匹配結果。但AI尋親要想大規模應用,對於企業來說,還有很多復雜的難題。騰訊安全管理部安全專家湯海鵬在接受媒體採訪中提到,跨年齡識別技術要想大規模應用起來,復雜的不是技術,是難以落到實處卻又更加觸及根本的倫理道德難題,如果想在全國推廣,這個過程會很長,因為涉及很多要協調的事情。

  湯海鵬這樣形容:“從理論上來說,如果把全國人的DNA都檢測比對一遍,拐賣兒童的案子不會有一件破不了,但人人都知道,這在實際上是不可能實現的。”

  公安部刑偵局打拐辦副主任孟慶甜向新京報記者介紹,事實上,因四川和深圳的成功案例,已經有其他省開始提出相同的需求,希望借助跨年齡人臉識別技術,幫助尋找多年前被拐賣的兒童,他們也在試圖解決技術推廣中的難題,向全國其他省市推廣。

  在警方看來,跨年齡人臉識別技術目前仍處於初步發展階段,其主要的需求,是運用在線索中斷多年尋親未果的歷史積案中。

  近年來,尤其是2009年開展的“全國打拐專項行動”和2014年《刑法修正案(九)》實施以來,收買被拐賣兒童將被追究刑事責任,人們的反拐意識在不斷提高,現代的技術偵查手段也在不斷進步,拐賣兒童的數量在不斷減少,案件多數可以快速偵破解救被拐兒童。

  根據公安部的數據顯示,2016年5月15日,公安部研發,阿裡巴巴集團提供技術支持的“公安部兒童失蹤信息緊急發布平台‘團圓’”系統正式上線,截至2019年5月15日,平台發布兒童走失信息3978條,找回3901名,找回率98%,其中解救被拐兒童57名。這意味著,在近3年公安部發布的走失兒童中,僅有57名兒童是被拐賣。

  孟慶甜提出,跨年齡人臉識別技術實際上也是一種輔助手段,幫助警方將解救范圍不斷縮小,而最終的認定,還是依靠DNA數據比對。

  2009年,公安部建立打拐DNA信息庫,通過進一步完善網上比對和線下調查核實,截至目前,已經幫助6100余名被拐多年的兒童和家人團聚。此后仍將進行功能升級,擴大比對的數據范圍。

  而在公安部陳建鋒看來,借助跨年齡人臉識別技術是警方尋找被拐兒童的方法,但解救被拐兒童並不僅僅是依靠一張照片,其中還有公安的大量偵查和落地工作。而對於走失家庭來說,自己尋找的結果太過渺茫,建議前往公安部門採血入庫,被拐兒童有自主想法后,也主動前往公安部門採血。“很多時候,尋親只是一滴血的距離。”

(責編:畢磊、夏曉倫)

分享讓更多人看到

返回頂部