您的位置:首頁>新聞 > 項目 >

一款機器人多模態(tài)大模型發(fā)布:機器人也能“察言觀色”

2023-07-08 08:56:42    來源:澎湃新聞記者 俞凱


(相關(guān)資料圖)

機器人賽道也開始出現(xiàn)大模型創(chuàng)新者。

7月7日上午,在上海世博展覽館的世界人工智能大會新品發(fā)布環(huán)節(jié),機器人領(lǐng)域的獨角獸頭部企業(yè)達闥機器人,發(fā)布了業(yè)界首個機器人多模態(tài)大模型RobotGPT。該大模型包含RobotGPT 1.0服務(wù)平臺產(chǎn)品和RobotGPT 1.0一體機產(chǎn)品。

達闥機器人 進行舞蹈展示。澎湃新聞記者 俞凱 攝

發(fā)布會上,達闥首先介紹了海睿AGI平臺的全新升級。海睿AGI平臺是一個通用人工智能平臺,為云端智能機器人提供了運營生態(tài)技術(shù)底座,可以接入各種主流的GPT和AIGC服務(wù),進行多模態(tài)賦能。正是基于海睿AGI平臺和海量機器人數(shù)據(jù)積累,該企業(yè)訓(xùn)練出了業(yè)界首個機器人多模態(tài)人工智能大模型RobotGPT。它是為實現(xiàn)機器人在復(fù)雜應(yīng)用場景下的多模態(tài)行為而提供的交互生成型AI大模型。

與其它的文本、語音類大模型相比,RobotGPT具備多模態(tài)(文本、語音、圖片、視覺、運動、點云等)融合感知、認(rèn)知、決策和行為生成能力,并基于人工反饋的強化學(xué)習(xí)完成并快速智能進化。RobotGPT與機器人的具身智能相結(jié)合,實現(xiàn)機器人理解人類語言,自動分解、規(guī)劃和執(zhí)行任務(wù),進行“察言觀色”和實時交互,完成復(fù)雜的場景應(yīng)用,推動具身智能的自主進化,讓云端機器人成為通用人工智能的最佳載體。此外,RobotGPT還可以賦能數(shù)字人應(yīng)用,實現(xiàn)虛實融合。

具身智能,是指擁有身體并支持物理交互的智能體,具備感知、思考、學(xué)習(xí)、決策等能力,能夠與環(huán)境進行交互,標(biāo)桿產(chǎn)品是人形機器人。“我們的目標(biāo)是通過RobotGPT大模型,幫助企業(yè)更好地解決特定行業(yè)中的大模型推理、訓(xùn)練或混合推訓(xùn)及應(yīng)用私有化部署等問題,從而提升企業(yè)的智能生產(chǎn)力。不僅如此,RobotGPT還將促進機器人AI大腦的進化,服務(wù)機器人逐步演變?yōu)榫呱碇悄軝C器人,人工智能的終極形態(tài)也有了具象化的載體。”達闥創(chuàng)始人、董事長兼CEO黃曉慶在發(fā)布會上表示。

RobotGPT 1.0的主要功能包括行業(yè)問答、多輪對話、多模態(tài)交互、人設(shè)場景、智能語音、AI變聲、聲紋識別、通用問答、文本摘要、情感分析、圖片理解和圖片生成等。經(jīng)過實測,對于類ChatGPT生成式實時對話,RobotGPT 1.0表現(xiàn)相當(dāng)出色,支持可控且精準(zhǔn)的行業(yè)問答且具備高實時性,進行針對特定場景多輪對話。

澎湃新聞記者從大會獲悉,依托達闥的業(yè)界首個國家新一代人工智能開放平臺,RobotGPT大模型正在加速各領(lǐng)域發(fā)展和應(yīng)用落地。目前,RobotGPT?及解決方案已落地能源電力、醫(yī)療健康、金融保險、交通樞紐、教育咨詢、高端制造等十多個垂直行業(yè),支持超過100個應(yīng)用場景。

關(guān)鍵詞:

相關(guān)閱讀