您當(dāng)前的位置：社會(huì)新聞>

阿里開(kāi)發(fā)AI謠言粉碎機(jī) 謠言識(shí)別準(zhǔn)確率達(dá)81%

?？诰W(wǎng)　http://6chong.cn　時(shí)間：2019-03-01 09:11

　　阿里巴巴達(dá)摩院科學(xué)家造了一個(gè)識(shí)別謠言的神器

　　AI謠言粉碎機(jī)，謠言識(shí)別準(zhǔn)確率達(dá)81%

　　昨天，一篇《為拯救爸媽朋友圈，達(dá)摩院造了“謠言粉碎機(jī)”》的文章，在朋友圈刷屏，引來(lái)一片鼓掌叫好：“這下終于不用費(fèi)勁勸導(dǎo)爸媽了！”

　　文章說(shuō)的是，阿里巴巴達(dá)摩院的科學(xué)家，造了一個(gè)謠言粉碎機(jī)，這是一個(gè)算法模型，可以識(shí)別真假新聞，未來(lái)也能應(yīng)用在各大領(lǐng)域。

　　這是怎樣一種算法？準(zhǔn)確率高嗎？真的可以終結(jié)謠言？記者聯(lián)系到了正在大洋彼岸的“謠言粉碎機(jī)”的創(chuàng)造者李泉志。

　　“粉碎機(jī)”的前生功能

　　是為記者提供可靠線索

　　《速轉(zhuǎn)！科學(xué)家發(fā)現(xiàn)：一味中藥48小時(shí)可殺死60%癌細(xì)胞!》《晚上喝白開(kāi)水的朋友，再不看就晚了！》《專家說(shuō)了，這樣?xùn)|西千萬(wàn)別吃！》……

　　你有沒(méi)有收到過(guò)父母發(fā)來(lái)的這些“關(guān)懷”？又有多少次是抱著“算了算了，你開(kāi)心就好”的心態(tài)結(jié)束話題？

　　“不能保證百分之百準(zhǔn)確，但基本可以判斷是否為謠言?！崩钊?，達(dá)摩院NLP團(tuán)隊(duì)的核心成員之一，畢業(yè)于清華大學(xué)，后在美國(guó)獲得自然語(yǔ)言理解方向的博士學(xué)位，目前在達(dá)摩院的西雅圖辦公室工作。

　　在加入達(dá)摩院前，他曾是路透社重要的“情報(bào)官”：通過(guò)機(jī)器篩選成千上萬(wàn)的網(wǎng)絡(luò)信息，為數(shù)千位一線記者提供可靠線索。

　　“AI謠言粉碎機(jī)”就是借助自然語(yǔ)言實(shí)現(xiàn)的。在剛剛結(jié)束的SemEval（自然語(yǔ)言處理領(lǐng)域的國(guó)際權(quán)威比賽，由國(guó)際計(jì)算語(yǔ)言學(xué)學(xué)會(huì)舉辦）全球語(yǔ)義測(cè)試中，“AI謠言粉碎機(jī)”創(chuàng)造了假新聞識(shí)別準(zhǔn)確率的新紀(jì)錄，達(dá)到了前所未有的81%。

　　判斷一個(gè)新聞?wù)婕?/strong>

　　要分三個(gè)步驟

　　“AI謠言粉碎機(jī)”要怎么去判斷是否為謠言呢？李泉志說(shuō)，分三步——

　　首先，該模型會(huì)找到最初的信息源，分析用戶畫(huà)像，包括：專業(yè)領(lǐng)域，此前傳播或轉(zhuǎn)發(fā)過(guò)什么，是個(gè)人還是機(jī)構(gòu)，注冊(cè)時(shí)間，活躍規(guī)律等，來(lái)判斷發(fā)布者是否“可靠”。最后根據(jù)不同態(tài)度的人群比例、各自的信譽(yù)度等信息，計(jì)算出此新聞的可信度。

　　第二步，尋找網(wǎng)上所有的信息源，看看鏈接的域名，是否來(lái)自可信網(wǎng)站，比如新華社、政府醫(yī)藥管理局等。

　　第三步，將正文里關(guān)鍵的論證提煉為知識(shí)點(diǎn)，與知識(shí)圖譜里的權(quán)威知識(shí)庫(kù)做匹配驗(yàn)證。如果毫無(wú)聯(lián)系、自相矛盾，減分。

　　李泉志解釋，“AI謠言粉碎機(jī)”會(huì)考慮一部分人類的想法，更多的則是 AI的運(yùn)用。人工智能有很多人類比不了的地方，比如當(dāng)一個(gè)流言在社交網(wǎng)站上傳播很快的時(shí)候，我們很難去判斷真假，不知道誰(shuí)接收到了，是出于什么原因轉(zhuǎn)發(fā)，不同的人對(duì)此的評(píng)價(jià)是什么，而這些AI可以做到?！凹偃鐏?lái)一個(gè)流言，人可以通過(guò)網(wǎng)站去查證，但是AI可以快速把科學(xué)研究、新聞拉出來(lái)，加上后臺(tái)知識(shí)庫(kù)的對(duì)比，做一個(gè)驗(yàn)證。人腦中有基本判斷，但是沒(méi)有大型的知識(shí)庫(kù)?！崩钊菊f(shuō)。

　　就拿“AI謠言粉碎機(jī)”的訓(xùn)練樣本來(lái)說(shuō)，就要分至少兩個(gè)層面：首先拿底層的2億條信息，幾百萬(wàn)條新聞，訓(xùn)練語(yǔ)言樣本；再將模型進(jìn)行謠言的真實(shí)性訓(xùn)練?！笆且粋€(gè)復(fù)雜且費(fèi)時(shí)的過(guò)程?！崩钊颈硎?。

　　誰(shuí)制造謠言，論文是否抄襲

　　未來(lái)粉碎機(jī)還有更多功能

　　其實(shí)，要建這樣一個(gè)數(shù)據(jù)模型，并不容易。李泉志坦言，他在前一家公司就開(kāi)始研究，到如今，也還需繼續(xù)完善。他們有一個(gè)小團(tuán)隊(duì)專門(mén)在研究這一技術(shù)，因?yàn)椋傮w來(lái)說(shuō)這不是一個(gè)單獨(dú)能列出來(lái)的技術(shù)，是自然語(yǔ)言所有技術(shù)的綜合。

　　目前，該模型也并未應(yīng)用于阿里巴巴的任何業(yè)務(wù)中，李泉志坦言，數(shù)據(jù)模型需要不斷被“訓(xùn)練”，也需要得到社會(huì)的認(rèn)同，而這些，都不是短時(shí)間內(nèi)能解決的。

　　可以想象的是，“AI謠言粉碎機(jī)”未來(lái)將被應(yīng)用的多個(gè)場(chǎng)合。

　　比如，可以識(shí)別論文是否為抄襲，用技術(shù)從個(gè)人的寫(xiě)作風(fēng)格、方法論、主題等多維度去判斷是否為抄襲。過(guò)去有人說(shuō)某年輕作家后期的作品由人代筆，以后用AI就能分析得出結(jié)論。

　　另一方面，可以協(xié)助警方找到真正謠言的制造者。通過(guò)AI去追蹤傳播路徑，從傳播路徑中，將傳播分解，可以發(fā)現(xiàn)規(guī)律，比如傳播了哪些用戶，用戶是什么反應(yīng)，是簡(jiǎn)單的轉(zhuǎn)發(fā)，還是贊成、反對(duì)，還是進(jìn)行了二次加工？

　　“當(dāng)然，該模型也還是需要更多的語(yǔ)言訓(xùn)練。比如有些用戶轉(zhuǎn)發(fā)時(shí)，說(shuō)的是反話、諷刺，有些是隱喻，不知是否是真實(shí)的情緒表達(dá)，這些作為機(jī)器很難對(duì)此做出判斷，但是通過(guò)大量的訓(xùn)練，是可以實(shí)現(xiàn)的?！崩钊颈硎?，他和團(tuán)隊(duì)會(huì)繼續(xù)研究該模型。

相關(guān)鏈接：

已證偽！防癌、抗癌別再相信這些謠言！
國(guó)家藥監(jiān)局機(jī)構(gòu)整理揭開(kāi)謠言“演技”背后的真相
 藥品謠言“演技高”，真相知多少？
聽(tīng)信這些謠言，年后養(yǎng)胃變傷胃
?

相關(guān)鏈接：

聽(tīng)信這些謠言，年后養(yǎng)胃變傷胃

藥品謠言“演技高”，真相知多少？

國(guó)家藥監(jiān)局機(jī)構(gòu)整理揭開(kāi)謠言“演技”背后的真相

已證偽！防癌、抗癌別再相信這些謠言！

[來(lái)源：錢江晚報(bào)] [作者：] [編輯：胡愷睿]

版權(quán)聲明：
·凡注明來(lái)源為“?？诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計(jì)等作品，版權(quán)均屬?？诰W(wǎng)所有。未經(jīng)本網(wǎng)書(shū)面授權(quán)，不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。

·凡注明為其它來(lái)源的信息，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。

?

海南離島免稅購(gòu)物金額超2530億元

?？隍T樓老街：歷史街區(qū)打開(kāi)文化共享新空間

?？谥R(shí)產(chǎn)權(quán)宣傳周活動(dòng)進(jìn)企業(yè)

海南：打造全球航司“保養(yǎng)中心”

數(shù)據(jù)新聞

圖解海口一周熱聞：?？谌?qǐng)?bào)海口網(wǎng)入駐“新京號(hào)”
圖解?？谝恢軣崧剕多彩節(jié)目，點(diǎn)亮繽紛假期！
圖解?？谝恢軣崧劊汉？谛履暌魳?lè)會(huì)將于2024年1月1日舉辦
圖解?？谝恢軣崧劊汉？谡胁乓菍?chǎng)誠(chéng)意攬才受熱捧
圖解?？谝恢軣崧劊汉？讷@評(píng)國(guó)家食品安全示范城市

熱點(diǎn)專題

鍥而不舍落實(shí)中央八項(xiàng)規(guī)定精神

災(zāi)后重建看變化·復(fù)工復(fù)產(chǎn)
圓滿中秋
勇立潮頭踏浪行
“發(fā)現(xiàn)海口之美”攝影大賽

?？谥?/a>

?？诎l(fā)展林下經(jīng)濟(jì)，激活“綠色引擎”

?？谖餍愎珗@黃風(fēng)鈴花如約綻放

映像?？?| 此岸彼岸情暖歸途

走，出門(mén)玩去！

?？谖穆没顒?dòng)豐富多彩

海口：游購(gòu)?qiáng)?樂(lè)翻天

排行

旅客注意！?？诿捞m機(jī)場(chǎng)T2值機(jī)柜臺(tái)17日起調(diào)整

尋舊日時(shí)光 ?？诓糠帜贻p人熱衷“淘”老物件

?？冢涸贫匆r晚霞美景入眼中

嗨游活力?？?樂(lè)享多彩假日

海口：城市升騰煙火氣夜間消費(fèi)活力足

?？冢洪L(zhǎng)假不停歇工地建設(shè)忙

市民游客在?？诙冗^(guò)美好假期

2023“?？诒狈悾ň①悾┗盍﹂_(kāi)賽

海口天空之山驛站：晚照醉人

千年福地尋玉兔共慶?？谧钪星?/a>