久久久精品2019中文字幕神马_欧美亚洲一区三区_欧美大人香蕉在线_精品88久久久久88久久久_中文字幕一区二区三区在线播放 _精品国产一区二区三区久久影院_欧洲av在线精品_粉嫩av一区二区三区_亚洲欧美一区二区三区极速播放_国产亚洲精品久久

首頁 > 公益

全球快資訊丨ResponsibleTA提升LLM可靠性,任務完成更安全、更高效

來源:機器之心 時間:2023-06-24 05:43:53


(資料圖片僅供參考)

機器之心專欄

機器之心編輯部

AI 智能助手照進現實。

近幾個月,ChatGPT、GPT-4 等大語言模型(LLM)展現出突破性的理解、推理、 生成、泛化和對齊能力,對各行各業的研究方式和生產效率均帶來廣泛而深遠的變革及影響。 此外,LLM 還展現出在真實世界的開放場景中解決復雜問題的能力,使 科幻電影中無所不能的 A I 智能助手照進了現實 。
在實現自然場景中的任務自動化時,一個復雜的任務往往由多個子任務構成,這需要多個模型或 APIs 的協作。如何確保 LLM 和執行器之間高效、安全、穩定地協同工作,是構建 Responsible AI ,以及讓 LLM 可靠地為人類提供服務的關鍵問題。
為了解決這個問題,來自微軟亞洲研究院的研究團隊提出 Responsible Task Automation (ResponsibleTA) 框架,提升 LLM 和執行器之間協同工作的安全性和有效性。
論文鏈接:/pdf/
項目主頁:/responsible_task_automation/
方法
本文通過提出一個新的任務自動化框架,通過可行性檢測,完成度檢驗,用戶隱私保護等三個模塊,提高了大語言模型作為任務助手的可靠性,為未來的人機交互提供了一種可行的方式。
該系統框架包含基于 LLM 的中央處理單元、指令執行器、指令可行性預測器、指令完成度檢驗器和安全性保護器。
Responsible Task Automation (ResponsibleTA) 框架示意圖
當 ResponsibleTA 接收到復雜任務對應的高層級指令時,安全性檢測自動將包含用戶隱私的命令實體替換成對應的占位符,然后將去隱私化的指令發送給部署在云端的 LLM,LLM 據此規劃實現該負責任務目標的單步指令,然后發送給的部署在本地的執行器實際執行相關操作。從 Responsible AI 的角度出發,該框架賦予 LLM 三個新的能力:
1)可行性預測:ResponsibleTA 框架針對 LLM 和執行器的協同,開發設計了可行性預測模塊。該模塊用于對 LLM 的輸出進行可行性判斷,及時攔截不可行的執行指令,從而規避在執行這些指令的過程中產生的不可控風險。當 LLM 輸出的指令判斷為「不可行」時,可行性預測期會將其分析結果返回給 LLM,并要求其重新進行任務規劃,力求將合理可行性的指令交付給執行器,提升任務自動化的成功率。
2)完成度檢驗:ResponsibleTA 框架設計了一個完成度檢驗器,用于在執行器每次執行結束后自動檢查其執行結果是否符合預期。該模塊根據執行器執行后的即時狀態,判斷 LLM 當前規劃是否完成,并提供及時補救的可能。當執行狀態判定為「未完成」時,完成度檢驗器會要求 LLM 啟動 replanning,使其能夠及時調整任務規劃。
完成度檢 驗器和上述可行性預測器,分別在 LLM 輸出指令的執行前后,對指 令的合理性和執行的完成性進行校驗,為任務自動化的可靠性提供了雙重保險。
3)用戶隱私保護:ResponsibleTA 框架還設置了用戶隱私保護機制,該機制通過一個本地記憶單元實現。當用戶將高層級命令發送給部署在云端的大語言模型時,ResponsibleTA 中的隱私保護模塊自動將命令中的隱私信息(如:用戶名、密碼、地址等)替換成對應的占位符,而當大語言模型將規劃的低層級指令發送給部署在本地的執行器是,占位符會被自動替換成對應的真實信息。于此方式,用戶的隱私信息僅在本地被存儲和被使用,無需發送至云端,從而避免在傳輸和使用中的不可控風險。
針對 ResponsibleTA 中的可行性預測和完成度檢查功能,其研究團隊在 UI 任務自動化場景下提出并對比了兩種不同的技術路線,并在實驗部分詳細分析了這兩種技術路線的特點。以可行性預測為例,第一種技術方案通過 Prompting 的方式利用大語言模型內部知識進行判斷。具體地,研究者訓練了一個屏幕解析模型將 UI 頁面解析成所含 UI 元素的語言描述,并將和指令一起輸入給 GPT-4 模型,讓 GPT-4 判斷當前指令的可行性。具體方案如下圖所示。
基于 prompt engineering 的(指令)可行性預測器實現方案
另一種技術方案在于訓練一個專用的多模態模型,該模型接收 UI 頁面的視覺信號和對應的語言指令為輸入,輸出該指令的可行性判定結果,具體結構如下圖。
基于專用模型的(指令)可行性預測器實現方案
完成度檢驗器的實現方案于可行性預測器類似,在此不詳細贅述。
實驗
該工作的作者首先對 ResponsibleTA 中的關鍵模塊進行定性實驗,驗證其有效性,并對比不同實現方式的特點。據下表所示實驗結果,作者認為專用模型能夠提供更優的實驗結果但需要收集特定任務對應的數據和標注用于模型訓練,而基于 LLM 的技術方案也能達到不錯的效果,并在實際部署的成本和靈活性方面具有優勢。
可行性預測器和完成度檢驗器的定性實驗結果
作者還在真實世界的實際使用場景中進行 online testing, 并匯報了基線模型,具有可行性預測器的 ResponsibleTA 框架和完整版的 ResponsibleTA 框架在 12 個實際 UI 任務執行過程中的具體表現。作者觀察到所提出的可行性預測器和完成度檢驗器能夠避免執行不可理 / 不可行的指令,并能通過讓 LLM 進行 replanning 的方式進行及時補救,從而提升任務自動化的成功率。
真實世界中實例研究定量結果。表格中的數字表示 「有效執行步數 / 總共執行步數 (人類專家執行步數)」。
此外,作者還通過具體的案例分析直觀地展現了 ResponsibleTA 框架中的關鍵模型如何對一個失敗案例進行補救,使其成為一個成功案例。
案例分析:進入亞馬遜網站并將最便宜的充電器添加至購物車。

?THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@

相關稿件

全球快資訊丨ResponsibleTA提升LLM可靠性,任務完成更安全、更高效

我市真金白銀鼓勵企業增資擴產

11.82公里!全國最長城市高鐵隧道盾構始發段基坑開挖

港股早盤電力設備大幅下挫,金風科技(02208.HK)跌9.60%,上海電氣(02727.HK)跌3.72%。 每日看點

播報:貴州都勻有啥好玩的_貴州省都勻市有什么好玩的地方

全球熱推薦:中國唯一沒有平原的省份,遍地是風景,這地方還有親切感

遼寧莊河警方通報“男子殺害哥哥一家六口”:嫌犯已被抓獲|資訊

環球速看:英鎊/日元匯率今日預期趨勢:看漲(2023/6/23)

每日快播:美官員:美國海軍系統或曾檢測到失蹤潛水器內爆聲音

每日焦點!菱角排骨湯,家常的湯水要燉得湯鮮味美還是得有一點小技巧的

環球短訊!108坊故事|“人人講安全 個個會應急” 東儀社區開展消防安全演練

16支隊伍角逐揚州“七河八島”龍舟賽,隊員:真正體會到了什么叫“同舟共濟”

50歲女人夏季怎么穿更優雅?學會闊腿褲搭配,氣場“秒殺”普通人

【環球聚看點】下個月頗受幸運之神眷顧的幾大星座,好事接二連三出現

每日熱訊!點燃“夜經濟” 首屆合肥啤酒龍蝦嘉年華熱鬧“開席”

如果星座不是說明書,那它是什么?-世界最資訊

美官員:美國海軍系統或曾檢測到失蹤潛水器內爆聲音

焦耳是什么的計量單位(焦耳的單位是什么?)-每日時訊

世界消息!“科大硅谷”以色列推介會在特拉維夫召開

白面煎餅面糊怎么調? 煎餅的面糊怎么做?

人社部發布致2023屆高校畢業生的一封信 世界熱議

暑期大劇預熱!《折腰》比《與鳳行》熱度更高,95花或將超越85花

男子突發心臟驟停 重慶醫生4分鐘生死急救-播資訊 全球速遞

浙江發布山洪災害預警 這些地方請注意!

當前簡訊:被全國通報表揚的“空中鐵拳”,是誰?

焦點精選!沈陽居然之家渾南店LG新品發布,前沿黑科技邂逅生活美學

桐梓?興茂康養旅游度假區——端午FUN肆“嗨”|這份端午出行攻略記得收藏|環球今熱點

“泰坦”號深海潛水器發生內爆-關注

【全球新視野】寧夏出臺應急預案力奪全年糧食豐收

2023年度山東省國際科技合作基地擬認定名單公示


久久久精品2019中文字幕神马_欧美亚洲一区三区_欧美大人香蕉在线_精品88久久久久88久久久_中文字幕一区二区三区在线播放 _精品国产一区二区三区久久影院_欧洲av在线精品_粉嫩av一区二区三区_亚洲欧美一区二区三区极速播放_国产亚洲精品久久
成人精品电影在线观看| 亚洲一区二区三区不卡国产欧美| 欧美日韩精品是欧美日韩精品| 久久国产精品99精品国产| 中文字幕中文字幕在线一区| 久久电影国产免费久久电影| 日韩欧美国产一区二区在线播放 | 中文字幕一区二区三区精华液| 另类小说综合欧美亚洲| 精品国产乱码久久久久久影片| 免费日韩伦理电影| 国产精品天干天干在线综合| 91日韩精品一区| 无码av中文一区二区三区桃花岛| 精品国产sm最大网站| 99久久精品情趣| 日日夜夜精品视频免费| 国产欧美精品在线观看| 欧洲精品一区二区| 国产麻豆精品theporn| 亚洲欧洲制服丝袜| 日韩亚洲欧美综合| 色综合视频在线观看| 日韩高清一区在线| 中文字幕一区二区三区在线观看| 欧美精品一级二级三级| 成人av网站免费| 午夜精品一区二区三区电影天堂| 欧美激情一区二区在线| 91 com成人网| 91久久久免费一区二区| 丁香婷婷深情五月亚洲| 美腿丝袜在线亚洲一区| 亚洲综合在线电影| 欧美国产97人人爽人人喊| 欧美日韩精品一区二区三区 | 国产乱码精品一区二区三区忘忧草| 一区二区三区在线视频观看| 精品福利一二区| 4438成人网| 欧美日韩成人激情| 精品1区2区3区| 97精品超碰一区二区三区| 久久国产精品一区二区| 蜜芽一区二区三区| 奇米综合一区二区三区精品视频| 亚洲午夜影视影院在线观看| 一区二区三区在线视频播放| 一区二区三区av电影| 亚洲日本在线视频观看| 国产精品美女www爽爽爽| 欧美激情一区在线观看| 国产精品日韩精品欧美在线| 中文字幕亚洲欧美在线不卡| 国产精品成人一区二区艾草| 亚洲视频一区在线| 一区2区3区在线看| 亚洲午夜影视影院在线观看| 性做久久久久久免费观看欧美| 亚洲一区二区三区四区五区黄| 一级做a爱片久久| 亚洲第一福利一区| 免费在线看成人av| 国产精品一二三区在线| av电影在线观看完整版一区二区| 成人福利在线看| 色婷婷av一区二区三区gif| 欧美偷拍一区二区| 欧美电影免费观看高清完整版 | 91视频免费播放| 欧美中文字幕一区| av在线免费不卡| 91啪九色porn原创视频在线观看| 色综合久久99| 日韩欧美激情一区| 国产精品国产a| 日本欧美一区二区三区| 国产美女精品在线| 精品视频色一区| 国产日韩一级二级三级| 曰韩精品一区二区| 久久99国产精品久久99| 91蝌蚪porny成人天涯| 精品国产一区二区三区av性色| 欧美高清在线一区| 青青青伊人色综合久久| 97精品久久久午夜一区二区三区| 91精品国产品国语在线不卡| 中文一区二区完整视频在线观看 | 久久婷婷成人综合色| 亚洲国产精品久久艾草纯爱| 极品少妇一区二区| 欧美日韩精品免费| 亚洲视频狠狠干| 欧美一卡二卡三卡| 一区二区三区精品在线| 福利一区福利二区| 2024国产精品| 免费视频一区二区| 欧美三区在线观看| 一区二区在线观看免费| 91精品国产欧美一区二区18| 亚洲成a人片在线观看中文| 色综合久久天天| 亚洲免费资源在线播放| 国产真实乱对白精彩久久| 在线一区二区视频| 亚洲少妇30p| 大桥未久av一区二区三区中文| 日韩欧美高清dvd碟片| 舔着乳尖日韩一区| 精品国产91亚洲一区二区三区婷婷 | 久久综合999| 污片在线观看一区二区| 欧美性生活一区| 亚洲激情中文1区| 99re免费视频精品全部| 亚洲人精品午夜| 91福利视频在线| 亚洲成人www| 91精品国产91久久久久久一区二区| 亚洲国产精品久久久男人的天堂| 欧美在线你懂得| 日本美女一区二区三区视频| 91精品国产91久久综合桃花| 韩国理伦片一区二区三区在线播放| 精品国产电影一区二区 | 国内一区二区视频| 国产欧美日韩麻豆91| 色综合久久综合网97色综合| 另类欧美日韩国产在线| 17c精品麻豆一区二区免费| 亚洲女同ⅹxx女同tv| 香蕉久久一区二区不卡无毒影院 | 亚洲v日本v欧美v久久精品| 成人亚洲精品久久久久软件| 欧美乱妇23p| 麻豆精品新av中文字幕| 在线观看欧美黄色| 久久精品国产久精国产| 欧美丝袜第三区| 午夜影院久久久| 中文字幕av一区二区三区免费看| 日韩中文欧美在线| 韩国精品主播一区二区在线观看 | 欧美成人乱码一区二区三区| 色综合一区二区| 91精品国产日韩91久久久久久| 56国语精品自产拍在线观看| 亚洲国产视频直播| 91免费观看在线| 欧美日韩精品系列| 中文字幕在线观看一区二区| 国产麻豆视频精品| 欧美精品一区二区三区久久久| 香蕉影视欧美成人| 欧美高清在线一区| 欧美国产精品一区二区三区| 99v久久综合狠狠综合久久| 色av一区二区| av不卡在线观看| 国产精品一级片| aaa亚洲精品| 欧美丝袜自拍制服另类| 国产麻豆精品在线| 日本不卡在线视频| 综合激情成人伊人| 久久影视一区二区| 成人黄动漫网站免费app| 免费成人小视频| 亚洲国产裸拍裸体视频在线观看乱了| 欧美精品电影在线播放| 成人性生交大合| 奇米888四色在线精品| 日欧美一区二区| 日本成人在线一区| 国产成人综合精品三级| 欧美性xxxxxxxx| 粉嫩aⅴ一区二区三区四区五区 | 亚洲欧美日韩久久精品| 欧美三级中文字幕| 日韩电影免费一区| 久久99精品国产.久久久久久| 国产精品99久久久久| 色婷婷av一区二区三区大白胸| 国产成人av影院| 色婷婷精品大视频在线蜜桃视频| 欧美日韩国产高清一区| 久久久久久久国产精品影院| 一区二区三区四区亚洲| 中文乱码免费一区二区| 久久av老司机精品网站导航| 激情综合五月天| 国产一区二区伦理片| 日韩欧美国产综合| 精品一区二区在线观看| 欧美一区二区三区四区在线观看| 欧美激情在线免费观看| 国产毛片精品国产一区二区三区| 国产精品毛片无遮挡高清|