近來,麻省理工學(xué)院媒體實(shí)驗(yàn)室出品了一個(gè)“暗黑版AI”,再次將人工智能的黑箱隱憂這個(gè)經(jīng)久不衰的論題送上搶手。據(jù)報(bào)導(dǎo),實(shí)驗(yàn)室的三人團(tuán)隊(duì)聯(lián)手發(fā)明了一個(gè)叫諾曼(Norman)的人工智能,與希區(qū)柯克經(jīng)典電影《驚魂記》中的反常旅館老板諾曼·貝茲同名。
名如其人。諾曼會(huì)以負(fù)面想法來了解它看到的圖片。例如,一張?jiān)谝话鉇I看來只是“樹枝上的一群鳥”的一般圖片,在諾曼眼中卻是“一名男子觸電致死”。
團(tuán)隊(duì)期望經(jīng)過諾曼的體現(xiàn)提醒世人:用來教導(dǎo)或練習(xí)機(jī)器學(xué)習(xí)算法的數(shù)據(jù),會(huì)對(duì)AI的行為形成明顯影響。AI會(huì)成為什么樣,有時(shí)人類可能束手無策。
TA們的成見就是人類的成見
諾曼們從哪來?答案首要藏在數(shù)據(jù)里。
“人工智能辨認(rèn)出的成果不是憑空而來,是很多練習(xí)的成果。假如要練習(xí)AI某一方面的才能,比方下棋,就需求收集、清洗、符號(hào)很多數(shù)據(jù)供機(jī)器學(xué)習(xí)。假如用于練習(xí)的數(shù)據(jù)不夠多,就會(huì)形成AI學(xué)習(xí)的不充分,導(dǎo)致其辨認(rèn)成果的失誤?!敝锌圃鹤詣?dòng)化研討所研討員王金橋?qū)萍既請(qǐng)?bào)記者表明。數(shù)據(jù)自身的散布特性,如誤差乃至成見,也會(huì)被機(jī)器“有樣學(xué)樣”。針對(duì)諾曼的體現(xiàn),發(fā)明它的實(shí)驗(yàn)室也指出,“當(dāng)人們談?wù)撊斯ぶ悄芩惴ù嬖谡`差和不公平時(shí),元兇巨惡往往不是算法自身,而是帶有誤差、成見的數(shù)據(jù)。因?yàn)楫?dāng)時(shí)的深度學(xué)習(xí)辦法依賴很多的練習(xí)樣本,網(wǎng)絡(luò)辨認(rèn)的特性是由樣本自身的特性所決議。雖然在練習(xí)模型時(shí)運(yùn)用相同的辦法,但運(yùn)用了過錯(cuò)或正確的數(shù)據(jù)集,就會(huì)在圖畫中看到十分不一樣的東西”。
別的是算法自身的影響?!斑@可能是無法徹底避免的,由深度學(xué)習(xí)算法自身的缺點(diǎn)決議,它存在內(nèi)在對(duì)抗性。”王金橋表明,現(xiàn)在最流行的神經(jīng)網(wǎng)絡(luò)不同于人腦的生物核算,模型由數(shù)據(jù)驅(qū)動(dòng),和人類的認(rèn)知不具有一致性。根據(jù)深度學(xué)習(xí)的結(jié)構(gòu),有必要經(jīng)過當(dāng)時(shí)練習(xí)數(shù)據(jù)擬合到方針函數(shù)。在這個(gè)結(jié)構(gòu)之下,假如機(jī)器要辨認(rèn)狗,它會(huì)經(jīng)過狗的眼睛、鼻子、耳朵等局部特征進(jìn)行可視化辨認(rèn),而這些可視化特征卻能給想運(yùn)用深度學(xué)習(xí)縫隙的人時(shí)機(jī),后者能夠經(jīng)過假造數(shù)據(jù)來詐騙機(jī)器。
除了人練習(xí)機(jī)器的數(shù)據(jù)自身有誤差以外,機(jī)器經(jīng)過對(duì)抗性神經(jīng)網(wǎng)絡(luò)組成的數(shù)據(jù)也可能有問題。因?yàn)闄C(jī)器不可能“見過”一切東西(比方辨認(rèn)桌子,機(jī)器不可能學(xué)習(xí)一切長(zhǎng)短寬窄各異的桌子),人也不可能符號(hào)一切數(shù)據(jù)。假如研討者輸入一個(gè)隨機(jī)的噪音,機(jī)器能夠向任何方向?qū)W習(xí)。這是一把雙刃劍,機(jī)器也可能組成一些有問題的數(shù)據(jù),學(xué)習(xí)時(shí)刻長(zhǎng)了,機(jī)器就“跑偏”了。
數(shù)據(jù)的均衡或可削減“跑偏”
不少科學(xué)家以“garbage in, garbage out”來描述“數(shù)據(jù)和人工智能的聯(lián)絡(luò)”。中科視拓(北京)科技有限公司CEO劉昕說:“對(duì)機(jī)器學(xué)習(xí)而言,進(jìn)什么就出什么。監(jiān)督學(xué)習(xí)就是讓模型擬合標(biāo)簽,比方練習(xí)者把帥哥都符號(hào)成‘渣男’,那么機(jī)器看到劉德華,就會(huì)以為他是……”談到諾曼引發(fā)的討論,劉昕表明:“不需求憂慮,人類自身就有各種輕視和成見,用人類生產(chǎn)的數(shù)據(jù)練習(xí)AI,再批判AI不夠正直良善,這么說有點(diǎn)駭人聽聞?!?
成見、刻板形象、輕視都是人類社會(huì)的痼疾,有些流于外表,有些深化社會(huì)肌理,無法容易剝離。在這樣的語境中產(chǎn)生的數(shù)據(jù),攜帶著很多雜亂、難以界定、龍蛇混雜的觀念。假如研討者沒有認(rèn)識(shí)到或著手處理這一問題,機(jī)器學(xué)習(xí)的成見幾乎無解。真正的“公平算法”或許是不存在的。
據(jù)有關(guān)媒體報(bào)導(dǎo),在谷歌研討自然語言處理的科學(xué)家 Daphne Luong 表明,正確地校準(zhǔn)標(biāo)簽對(duì)機(jī)器學(xué)習(xí)來說十分要害,有些數(shù)據(jù)集其實(shí)并不平衡,像維基百科上的數(shù)據(jù),“他”(He)呈現(xiàn)的次數(shù)遠(yuǎn)比“她”(She)要多。
王金橋也著重強(qiáng)調(diào)了“數(shù)據(jù)的均衡”。就算對(duì)人來說,不同人秉持著不同的價(jià)值觀,但多聽多看多受教育能夠讓人向杰出的方向改善。機(jī)器學(xué)習(xí)也是如此?!熬毩?xí)機(jī)器時(shí),要重視數(shù)據(jù)的均衡,給它更多牢靠的數(shù)據(jù)。研討團(tuán)隊(duì)成員具有多元的學(xué)術(shù)布景(如吸納更多社會(huì)學(xué)、心理學(xué)等范疇學(xué)者參加)、性別、年紀(jì)、價(jià)值觀,也能夠協(xié)助機(jī)器學(xué)習(xí)愈加均衡,削減機(jī)器呈現(xiàn)成見、謬誤乃至失控的可能?!蓖踅饦蛘f。
“機(jī)器學(xué)習(xí)的模型自身也要有必定的防進(jìn)犯才能,從技能上防止自身結(jié)構(gòu)設(shè)計(jì)的縫隙被進(jìn)犯,研討者能夠運(yùn)用各種數(shù)據(jù)進(jìn)犯機(jī)器,練習(xí)機(jī)器的反進(jìn)犯才能。”王金橋說。
作惡仍是向善,是人類的挑選
1942年,阿西莫夫在短篇小說《環(huán)舞》中初次提出聞名的機(jī)器人三規(guī)律:機(jī)器人不得損傷人類,或因不作為使人類遭到損傷;除非違背第必規(guī)律,機(jī)器人有必要遵守人類的命令;除非違背榜首及第二規(guī)律,機(jī)器人有必要維護(hù)自己。半個(gè)多世紀(jì)曩昔,人工智能在大數(shù)據(jù)的加持下迎來爆發(fā)式開展。某些專用型人工智能把人類智能甩在死后,人們開端擔(dān)憂,機(jī)器損傷人類的那一天是不是不遠(yuǎn)了。
因此有一種看法很干流——人類練習(xí)有認(rèn)識(shí)、有自我覺知的人工智能是不明智的。開個(gè)腦洞,機(jī)器一旦開展出自我認(rèn)識(shí),要反向進(jìn)犯人類,局面或許失控。
前段時(shí)刻,據(jù)路透社報(bào)導(dǎo),韓國科學(xué)技能院的人工智能研制中心正在研制適用于作戰(zhàn)指揮、方針追尋和無人水下交通等范疇的人工智能技能,期望在今年年底前研制出根據(jù)人工智能的導(dǎo)彈、潛艇和四軸飛行器。此事引發(fā)學(xué)術(shù)界的巨大震動(dòng),抗議接連不斷,并終究以院長(zhǎng)確保無意于“殺手機(jī)器人”的研制并重申人類莊嚴(yán)和道德收?qǐng)?。在美國,以“不作惡”為綱的谷歌也因與國防部的合作協(xié)議觸及“Maven項(xiàng)目”被推上風(fēng)口浪尖,反對(duì)者遍及以為,辨認(rèn)成果徹底有可能被用于軍事用處,比方說精準(zhǔn)沖擊。谷歌終究表明終結(jié)協(xié)議。
相較于言論環(huán)境的憂心如焚,研討者對(duì)“技能向善”遍及達(dá)觀。他們以為把AI和“殺人機(jī)器”聯(lián)絡(luò)在一起,近乎“捧殺”,夸張AI才能之余,也引發(fā)不明真相的大眾驚懼,無益于人工智能的開展環(huán)境。
“很多人說到AI總是一驚一乍,把AI說成超人。我信任人工智能是能解決問題的,但我們的等待也要在合理范圍內(nèi)。人和機(jī)器各有優(yōu)勢(shì),技能會(huì)服務(wù)于特定場(chǎng)景,但也不需求把AI捧上天?!背惺芸萍既?qǐng)?bào)記者采訪時(shí),思必馳北京研制院院長(zhǎng)初敏博士不由得“訴苦”了一下??磥怼拔覀冃枨笤鯓拥腁I”這一題,我們都還沒有答案。