支持單位: 全國警用裝備標準化技術(shù)委員會(huì ) , 公安部安全與警用電子產(chǎn)品質(zhì)量檢測中心 , 公安部特種警用裝備質(zhì)量監督檢驗中心 , 國家安全防范報警系統產(chǎn)品質(zhì)量監督檢驗中心
jiangbei
歷屆評選

AI 系統 Eureka,可令機器人執行轉筆傳球等復雜工作

2023-10-23 16:48:49  來(lái)源 : IT之家
關(guān)鍵詞: 機器人 動(dòng)作


????????警用裝備網(wǎng)訊:?英偉達日前公布了一個(gè)名為 Eureka 的 AI 系統,該系統以 OpenAI 的 GPT-4 為基礎,能夠讓機器人執行例如“轉筆”、“開(kāi)抽屜”、“拿剪刀”、“雙手互傳球”等 30 多種復雜動(dòng)作。



shuiyin

  英偉達推出 AI 系統 Eureka,可令機器人執行轉筆傳球等復雜工作



  IT之家經(jīng)過(guò)查詢(xún)得知,英偉達研究院主導開(kāi)發(fā)了 Eureka,該 AI 系統可令開(kāi)發(fā)者配合英偉達自家物理模擬軟件 Isaac Gym 進(jìn)行強化學(xué)習(reference learning)。



  英偉達 AI 研究部門(mén)資深總監 Anima Anandkumar 認為,過(guò)去 10 年以來(lái)“強化式學(xué)習”雖然有所進(jìn)展,但仍存在不少挑戰,例如“獎賞設計”等環(huán)節,現在還停留在“試錯”階段。而目前英偉達公布的 Eureka,則是為執行困難的任務(wù)而設計,結合生成式 AI 與強化式學(xué)習算法,進(jìn)行首次嘗試。



  Eureka 利用 GPT-4 生成出的“獎賞設計”方案可助力機器人的“試錯(trial-and-error)”學(xué)習,并能夠起到接替 80% 人類(lèi)專(zhuān)家的任務(wù),從而使機器人平均訓練效率提升超過(guò) 50%。



  據悉,在 Eureka 生成“獎賞設計”方案時(shí),開(kāi)發(fā)者不需要額外輸入任務(wù)提示或撰寫(xiě)預定義的獎賞范本,再結合人工修正獎賞,最終使機器人動(dòng)作更符合開(kāi)發(fā)人員的意圖。



  該 AI 系統配合 Issac Gym 時(shí),可利用 GPU 加速進(jìn)行模擬,并針對大量批次的候選回饋快速評估品質(zhì),從而提升訓練效率,并根據訓練結果的作出統計摘要,從而改良“獎賞方案”,在提升機器人反應水平的同時(shí),令 AI 系統適用的機器人類(lèi)型更為廣泛,例如“走獸型”(四足)、“人型(兩足)”、“四軸飛行器”、手臂型等機器人都可以搭載 Eureka 系統。



  英偉達推出 AI 系統 Eureka,可令機器人執行轉筆傳球等復雜工作



shuiyin

  ▲ 圖源 英偉達



  英偉達推出 AI 系統 Eureka,可令機器人執行轉筆傳球等復雜工作



shuiyin

  ▲ 圖源 英偉達



  英偉達將 Eureka 進(jìn)行了“開(kāi)源靈敏性標竿測試”,在評估 20 種任務(wù)訓練結果后,得出了令人滿(mǎn)意的結果。



  據此,英偉達認為 Eureka 可實(shí)現靈巧的機器人控制,并為動(dòng)畫(huà)作者提供“生成逼真實(shí)體動(dòng)作”的新方法。




  新聞稿件歡迎直接聯(lián)系:QQ 34004818 微信公眾號:cpsjyzb

我要評論