人民網
人民網>>IT>>行業新聞

今日頭條寫稿機器人有哪些黑科技

2017年12月26日15:10 | 來源:中國網
小字號
原標題:拿下中國人工智能最高獎 今日頭條寫稿機器人有哪些黑科技

  近日,今日頭條人工智能實驗室與北京大學聯合研發的寫稿機器人xiaomingbot獲得了吳文俊人工智能科學技術獎。

  吳文俊先生是我國著名數學家、中國科學院院士。他在純數學和應用數學的多個領域都作出了杰出貢獻。前半生中,他用30多年時間,在代數拓扑學的研究領域取得了一系列奠基性成就,其中最著名的便是“吳公式”的建立﹔上世紀50年代初,吳文俊先生放棄了國外優越的研究條件,毅然回國。他的這份情懷,影響著無數后來者。

  花甲之年,吳文俊老先生毅然轉身,開創與拓扑學毫不相關的數學機械化研究領域,開創了裡程碑式的“吳方法”。耄耋之年,他仍在密切關注新的科研進展和新涌現的人才。他曾一再表示:“中國的人工智能不能走外國人的老路,要在原創科學和基礎理論研究方面實現突破。

  今日頭條是今年“吳文俊獎”獲獎項目中唯一以企業載體獲得專業類獎項的機構,過去這一通常隻授予頂尖高校、重點實驗室和科研機構。

  此次獲獎的寫稿機器人xiaomingbot早在2016年6月就已經在今日頭條上線。裡約奧運會期間,通過對接奧組委的數據庫信息,xiaomingbot曾寫過200余篇賽事報道,包括乒乓球、網球、羽毛球和女足等比賽,累計獲得200萬用戶閱讀。它撰寫的文章可以涵蓋比賽時間、實時比分、運動員信息等主要新聞要素,可讀性與職業記者相差無幾。

  奧運會上線時,xiaomingbot與其他機器人相比就有明顯優勢。根據人民網研究院的報道,比起美聯社的WordSmith、華盛頓郵報的Heliograf、第一財經的DT稿王等,今日頭條寫稿機器人xiaomingbot實現了很多黑科技。比如:

  一、寫稿速度更快——2秒內完成稿件並上傳至媒體發布

  xiaomingbot的撰寫發布速度幾乎與電視直播同步,從數據庫對接、信息搜集、文本生成、潤色完成報道,最后發布、推送到今日頭條手機客戶端,隻需用時兩秒。

  二、擬人化程度更高——並非千篇一律

  根據比賽選手的排名、賽前預測與實際賽果的差異、比分懸殊程度等情況,xiaomingbot可以自動調整生成新聞的語氣,並使用感情色彩的詞語,如「實力不俗」、「笑到了最后」等。

  三、發布稿件類型多樣——短訊及長文章

  xiaomingbot不僅可以發布賽事消息的短訊,還可以生成整場比賽的賽事簡報類長文章。

  四、圖片識別篩選——可實現自動上傳圖片功能

  xiaomingbot可以通過語言理解與圖像識別,在數據庫中自動選取並在文章中插入賽事圖片,讓稿件圖文並茂更加生動形象。

  奧運會后xiaomingbot還在持續撰寫NBA、CBA、中超、意甲等體育賽事的文章,包括很多場諸如“亞迪拉-席爾瓦4:0赫巴-阿勒吉 不費吹灰之力經濟奧運會乒乓球女單下一輪”這樣的冷門比賽,xiaomingbot也均有報道。根據今日頭條統計,xiaomingbot文章的閱讀率與人類創作者基本持平。

  近期,xiaomingbot已完成最新一輪升級,除體育新聞,xiaomingbot在今日頭條上撰寫的文章現已涵蓋科技、財經、房產等十幾個分類,並且對多個領域的每日熱點做持續的跟蹤報道。據悉,xiaomingbot已與光明網、《財經》雜志、大河報等主流媒體達成戰略合作,向其進行優質內容輸出。

  對機器寫稿而言,它的核心技術是自然語言理解,同時會涉及機器學習、數據挖掘、深度學習、知識圖譜等多項技術。自然語言處理是人工智能領域難度最大的課題之一。相對於語音和視覺來說,語言是高度抽象化的表現。一方面,人類語言具有復雜性,同一句話可能代表不同含義。另一方面,正確理解人類語言還要有足夠的背景知識,比如對成語和歇后語的理解。這些都是自然語言理解進一步發展需要克服的難題。

  因此很多人所憂慮的機器是否會取代記者,短時間內來看是很難的。正如今日頭條李磊所言,“我們做新聞機器人的目的並不是取代新聞記者,而是幫助記者創作出更高質量的內容。”

(責編:易瀟、楊虞波羅)

分享讓更多人看到

返回頂部