深化交流合作 筑牢AI安全屏障
時間:2023-06-25 14:47:10
ChatGPT寫文章調代碼,文心一言巧解雞兔同籠數學題,Microsoft 365Copilot幫“打工人”做PPT,Midjourney V5繪制的20世紀90年代中國情侶刷屏朋友圈……人工智能領域的大事一件接著一件,令人欣喜,也引人擔憂。擔心被AI“搶飯碗”,擔心AI發展過快超出人類管控的能力范圍。
最近,包括“ChatGPT之父”、OpenAI創始人兼CEO山姆·阿爾特曼,谷歌DeepMind公司CEO戴密斯·哈薩比斯以及美國Anthropic公司的CEO達里奧·阿莫代伊在內的一眾AI界大佬聯名簽署了一封公開信,信的內容很短,加上the和a在內僅有22個單詞。字數少,但信息量很大。信中這樣說:“與流行病和核戰爭等其他社會規模的風險一樣,緩解人工智能導致的滅絕風險應該被視作全球的優先事項?!毙胖邪袮I提到了與流行病和核戰爭同樣的級別,足以見得AI野蠻生長帶來的問題的嚴重性。比如AI系統設計不當或被惡意使用,可能會讓歧視和偏見不斷固化、虛假信息蔓延、隱私數據泄露……呼吁全球通力合作,對人工智能進行規范與監管,共同去應對、去解決AI超速發展帶來的挑戰。
上一封著名的AI公開信是在3月底,距離GPT-4發布僅兩周時間。包括特斯拉CEO埃隆·馬斯克在內的1000多名企業高管、學界專家聯署發表公開信,呼吁所有AI實驗室立即暫停訓練比GPT-4更強大的AI系統,暫停至少6個月。
(資料圖片僅供參考)
為什么全球頂尖AI公司的高管和學界大咖要呼吁限制AI發展,他們在擔心些什么?或許是AI快速發展在帶給人們驚喜的同時也帶來了未知,有些問題甚至連開發者本身都無能為力。
近日,在2023北京智源大會上,阿爾特曼呼吁全球各方就AI安全問題通力合作,建立國際通行的AI安全標準,并推進人工智能對齊(AI alignment,即引導AI系統的表現,使其符合設計者的預期目標)研究。他提出,可以嘗試使用AI系統輔助人類來監督其他AI系統。以未來的AGI(通用人工智能)系統為例,可能包含10萬行的二進制代碼,人類有必要借助AI來輔助監督,判別系統是否存在違規行為。除了必要性之外,這種方法的好處在于,伴隨AI技術的突破,AI監管技術也在同步發展。
在與智源研究院理事長張宏江圍繞“AI安全與對齊”議題的問答討論中,阿爾特曼談到,未來十年內,全球很可能擁有一個非常強大的AI系統,屆時人類會面臨很多安全問題,因此,要從現在開始做好準備。他強調,對于AI安全而言,建立統一公平的框架和測試標準,讓每個達到一定能力的AI模型都接受測試具有重要意義。他表示,解決AI對齊問題難度極大,需要來自世界各地最好的頭腦,并稱中國有很多優秀的人工智能人才,期待中國AI研究者能為AI安全提供中國智慧。
請掃碼觀看視頻
劃重點!關于AI對齊
什么是AI對齊?
AI對齊(AI alignment)是AI控制問題中的一個主要問題,即要求AI系統的目標要和人類的價值觀與利益保持一致。
實現AI對齊面臨哪些挑戰?
◆ 選擇合適的價值觀
◆ 將價值觀編碼到AI系統中,使系統表現與價值觀一致
◆ 選擇合適的訓練數據
AI對齊的研究方法
DeepMind和OpenAI圍繞AI對齊分別從“提出合適的價值觀”和“用技術方法實現對齊”兩方面進行研究。
在用技術方法實現對齊方面,DeepMind提出了一種基于“逆強化學習(Inverse Reinforcement Learning)”的方法,該方法關注人類的行為,能夠從行為表現中推斷出價值觀,并將其編碼到AI系統中。OpenAI則提出了一種基于“對抗訓練(Adversarial Training)”的方法,通常用于增強模型的魯棒性和泛化能力,該方法可以讓AI系統在與人進行交互時學習到人類的價值觀。
逆強化學習的關注點在于人類的行為,從行為表現推斷價值觀;而對抗訓練的重點是交互,從AI系統與人的交互中學習價值觀。
相關稿件
揚州:購買市區改善性住房不再執行限購 人才購房給予契稅100%補貼 全球速讀
中山127億元掛牌出讓10宗宅地 供地規模遠超去年整年|世界新消息
0仰角設計 原裝鏡頭 理光RU336ST激光投影評測|今日熱聞
環球微動態丨該省4成考生被破格錄取!2022年清北強基入圍、錄取數據回顧
全球頭條:端午假期北京全市公園納客326萬人次 同比增61%
有一種叫云南的生活·麗江篇丨這個夏天,到永勝三川享受一頓色香俱全的荷花盛宴
5月成交榜首居然在福田!深圳各區成交TOP10一覽 世界新消息
當前報道:2023六盤水個人社保多少錢一個月 六盤水個人社保繳費比例查詢