环球UG开户:人工智能剛上崗就翻車培養一名及格的AI編輯總共分幾步

新2备用网址/2020-07-01/ 分类:科技/阅读:

原標題:人工智能剛上崗就“翻車” 培養一名及格的AI編輯總共分幾步

日前,微軟公布6月底擬裁撤近80名外包編輯,由AI編輯負責接下來的MSN網站的新聞抓取、排版和配圖等事情。但沒想到,剛到崗沒多久,AI編輯就“翻車”了,并且犯了一個很是低級的錯誤。AI編輯在尋找配圖的時候,把非裔歌手Leigh跟阿拉伯裔歌手Jade弄混了。

針對此次微軟AI的配圖錯誤事件,Jade也在社交媒體上表達了不滿:“正常區分兩個差异膚色的人有那麼難嗎?”為何一向以高識別率著稱的AI,這次卻“翻車”了?

解決臉盲問題需要不斷擴大學習范圍

人臉識別技術是今朝AI領域公認的比較成熟的技術,圈內人士也熱衷像刷分一樣把人臉識別准確率屢屢刷出新高,最高的號稱准確率可達99.9%。人臉識別技術有如此輝煌的戰績,為何此次AI編輯還會臉盲呢?

“人臉識別技術的事情道理,主要是比對五官比例以及面部特征。”天津大學智能與計算學部传授韓亞洪解釋,簡單說,就是基於人臉圖像的大數據,先對看到的人臉圖像進行預處理,提取面部各個方面的特征,並通過分層多次提取,尋找對於識別個體人臉最有效的特征表達。

人臉識別技術這些年已經發生了重大的變化,傳統的人臉識別要领已經被基於卷積神經網絡的深度學習要领替代。深度學習要领的主要優勢是它們可通過大規模數據集進行訓練,從而學習到這些數據的最佳特征。

“雖然可以利用大規模數據集進行訓練,可是今朝99.9%的准確率,根基上是在一些基准的數據集上測試的結果。這個數據集必定是有范圍的,假如收集的數據是在數據集漫衍的范圍內,便可獲得比較高的准確率。”韓亞洪說。

據相识,今朝號稱人臉識別准確率達到99%以上的,许多指的都是和全世界最權威的人臉數據庫LFW(Labeled Faces in the Wild)進行比對測試的成績。LFW可以被認作一個观察深度學習系統人臉識別本领的題庫。它從互聯網上提取6000張差异朝向、心情和光照環境的人臉照片作為考題,可以讓任何系統在裡面“跑分”。“跑分”過程是LFW給出一對照片,詢問測試系統兩張照片是不是同一個人,系統給出yes或no的谜底。

“解決特定的臉盲問題並不難,其實就是从头針對任務,收集這項任務領域內的人臉圖像,在原有算法模子上訓練,可能从头設計新的算法模子進行訓練,都會提高人臉識別率,以滿足實際應用的需求。”韓亞洪說,可是超出了特定任務,AI的“臉盲症”就會復發。今朝並沒有哪個通用的模子算法可以解決所有的任務,可是AI可以通過不斷地調整,大量的學習,從而提高人臉識別的准確性。

深度神經網絡模子是進階的须要條件

“今朝針對新聞文檔的阐明和處理任務,AI編輯做起來相對得心應手。”韓亞洪介紹,具體地說,好比在一篇很長的報道中,讓AI編輯把重點摘出來,這是沒有問題的。現在是多媒體時代,大量的新聞報道會涉及圖片和視頻,AI編輯可以將圖片可能視頻自動提取出來,再從大篇幅的文字報道中,選取與之相匹配的文字說明,這個事情AI是可以比較准確地做到的。

“解決特定領域的問題,AI大多時候還是沒問題的,可是要實現通用,就比較難了。”韓亞洪強調,實現這些成果需要用到自然語言處理、模式識別、圖像視頻领略等領域的技術。

要培養一名AI編輯,首先需要收集大量的新聞報道和圖片視頻,再根據收集到的數據設計一個針對這個任務的深度神經網絡模子,網絡模子裡會有许多參數,然后通過數據把參數訓練出來,它就具備了最初設定的各種編輯本领了。在利用過程中,

Allbet注册

欢迎进入Allbet注册(Allbet Game):www.aLLbetgame.us,欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

,隨著AI編輯學習了更多的新聞,它的業務本领和机能也將不斷晋升。

“不過今朝的新聞生產對於AI編輯來說還很困難。”韓亞洪說,要讓AI學會寫新聞,必須要針對某個特定新聞主題,進行大量資料汇集和模子訓練。今朝AI技術隻能在風格相對牢靠、詞匯量利用范圍較小的領域完成文本生成,好比天氣預報等內容,AI可以很好地輸出相關報道和动静。但要生成人類創作的那種有創新要求、感情描写豐富的文章,AI編輯的本领仍有待進一步晋升。

協作將使新聞生產越发高效

“有趣的是,AI犯的錯誤大多是我們意想不到的低級錯誤,但在某些方面又強悍到讓人類望塵莫及。”韓亞洪舉例說,像給文章分類這種事情,人類編輯要進行大量閱讀,重復性勞動耗時耗力,速度很是慢。但這項事情AI編輯做起來就很是簡單了,通過文字—文檔的主題建模,AI可以比較准確地對文章按主題進行分類。别的,對於可以利用模板的短新聞,好比天氣預報、証券信息等,AI編輯可以准確迅速地將各種數字可能專有名詞嵌套到模板中,從而完成必然的文檔生成任務。

美聯社曾利用AI系統自動編發企業財報。AI系統對數據進行自動抓取,將其嵌套在美聯社預先設定的新聞模板中,幾秒鐘就能完成一篇150—300字的短动静,該系統每季度能產出約4000篇新聞,與之对比,美聯社的人工編輯們每季度隻能完成400篇。

做這些特定的事情,AI編輯比人類厲害的处所不僅在於速度,准確率也可圈可點。“像分類可能是嵌套模板寫短动静這類的事情,因為任務明確,AI的准確率還长短常高的,很少出現錯別字可能數據錯誤。”韓亞洪介紹。

在運用大數據阐明預測爆款方面,AI編輯大概比人類單純從經驗出發顯得更“科學”。2015年,《紐約時報》利用AI機器人對社交平台中的文章進行篩選和阐明,預測哪部门內容適合推廣。每每由它自動推薦的文章的點擊量都大大增加,甚至達到了普通文章的38倍。

“但在AI編輯的世界中,隻有知道和不知道兩種狀態,因此處理的內容一旦超綱,它們就會立即犯许多低級到好笑的錯誤。”韓亞洪說,像這次AI編輯把非裔的Leigh跟阿拉伯裔的Jade弄混了的這樣的錯誤,對於人類來說,纵然沒見過Leigh ,但根據常識,也不會把非洲裔和阿拉伯裔弄混。

“今朝階段的編輯事情完全依賴AI是不現實的,讓AI成為人類編輯的幫手好像更切實可行。”韓亞洪說。美聯社預測,AI参与媒體行業能夠幫助新聞事情者釋放20%阁下的時間,讓后者可以將這部门時間更多地投入到內容創作方面,簡單的事實核查與調研方面的事情交給AI,有利於提高新聞質量。

“未來,人類應該把AI編輯當作相助同伴,雙方協同起來,使事情越发高效有質量。”韓亞洪說,人類不應該覺得AI是來“搶飯碗”的,而應該為有AI這樣的相助同伴而感想幸運。(記者 陳 曦)


(責編:宋心蕊、趙光霞)

广告 330*360
广告 330*360

热门文章

HOT NEWS
  • 周榜
  • 月榜
阳光在线企业邮局
微信二维码扫一扫
关注微信公众号
新闻自媒体 Copyright © 2002-2019 阳光在线企业邮局 版权所有
二维码
意见反馈 二维码