每種具體的人工智能系統(tǒng)往往只具備一個或若干上述提到的功能。例如IBM的深藍強于計算能力,在國際象棋方面可以與人類對手一決高下;沃森系統(tǒng)擁有龐大知識庫系統(tǒng),因此可以在常識問答比賽中擊敗人類選手。因為沒有統(tǒng)一的模型可以涵蓋這些人工智能系統(tǒng),就無法形成統(tǒng)一的測試方法進行測試和比較。如圖1.2所示,人工智能系統(tǒng)A 在計算能力上得分為100,人工智能系統(tǒng)B 在計算機視覺識別上得分為80,人工智能系統(tǒng)C在機器翻譯測試得分為90分,我們?nèi)匀粺o法得出結(jié)論A的智力能力高于C,C的智力能力高于B的結(jié)論。
(2)第二個困難是沒有統(tǒng)一的模型和測試方法,能夠同時對人工智能系統(tǒng)和人類進行測試,這也是當前人工智能威脅論產(chǎn)生最重要的原因之一。因為沒有人工智能系統(tǒng)和人類智能水平統(tǒng)一的測量方法,人工智能威脅論宣揚者往往將計算機或軟件系統(tǒng)表現(xiàn)強大的領(lǐng)域作為標準,例如計算能力,歷史,地理等常識的掌握能力等,而忽略諸如圖像識別能力,創(chuàng)新創(chuàng)造的能力,發(fā)現(xiàn)規(guī)律的能力等,對于這個原因產(chǎn)生的問題,人工智能威脅論反駁者往往無法拿出定量的數(shù)字結(jié)果進行反駁。
目前雖然針對人類智力能力的評測方法已經(jīng)非常成熟,但過去100多年的發(fā)展和改進過程中,這些方法并沒有考慮到人工智能系統(tǒng)的特點和發(fā)展水平,因此很難將人類的智商測試方法拿來測試人工智能系統(tǒng)。例如目前絕大多數(shù)人工智能系統(tǒng)就無法完成圖1.3所示題目,因為測試者需要首先識別圖像中的問題,并與圖中的各個圖形特征關(guān)聯(lián)起來。做不到這一點,回答問題就無法進行下去。
圖1.4所示的人類智商測試的題目需要測試者運用鉛筆,鋼筆等工具繪制圖形。用手操作物體完成任務(wù),解決問題是人類普通的能力,但對大多數(shù)人工智能系統(tǒng)因為沒有相應(yīng)輸出系統(tǒng)或操控設(shè)備,于是無法完成圖1.4所示的測試。
2025-05-12 08:39
2025-05-12 08:33
2025-05-12 08:30
2025-05-12 08:23
2025-05-07 13:20
2025-05-06 10:42
2025-05-06 10:41
2025-05-06 09:28
2025-05-06 09:27
2025-04-28 14:41