被爆炒的“AI智能體” Manus:有體驗(yàn)者稱性能強(qiáng)但不穩(wěn)定
國(guó)內(nèi)目前AI(人工智能)智能體產(chǎn)品在走紅的同時(shí)也備受質(zhì)疑。
3月5日晚間,成立于2023年的中國(guó)AI初創(chuàng)公司Butterfly Effect(蝴蝶效應(yīng))發(fā)布AI Agent(智能體)Manus的早期預(yù)覽版,將其稱為“全球首要通用智能體產(chǎn)品”。從介紹來看,使用者只需要給Manus一個(gè)簡(jiǎn)單的指令,它就能自動(dòng)完成復(fù)雜的任務(wù)。Manus的出現(xiàn)推動(dòng)A股相關(guān)概念在6日大漲。
目前,Manus只放出了官網(wǎng)和介紹視頻,若想體驗(yàn)Manus就需要獲得內(nèi)測(cè)邀請(qǐng)碼。介紹視頻中展示了Manus執(zhí)行三個(gè)任務(wù)的過程,分別是篩選簡(jiǎn)歷、挑選房產(chǎn)和分析股份憑證。從介紹來看,使用者只需要給Manus一個(gè)簡(jiǎn)單的指令,它就能自動(dòng)完成復(fù)雜的任務(wù)。
“挺強(qiáng)的,但還是不夠穩(wěn)定。”一位Manus的體驗(yàn)者告訴澎湃新聞?dòng)浾摺?
因強(qiáng)大自主性而走紅,質(zhì)疑聲隨之而來
Manus將自己定義為“通用智能體”。從團(tuán)隊(duì)提供的案例來看,似乎用戶只需給出一個(gè)指令,它就能自動(dòng)完成復(fù)雜的任務(wù)。例如,用戶可以要求Manus為自己提供日本的旅游攻略,配上對(duì)旅程的細(xì)節(jié)要求和對(duì)攻略極終表現(xiàn)形式的要求,Manus就會(huì)像專業(yè)的旅行社員工一樣搜集資料并整理好反饋給用戶。Manus能夠理解任務(wù)并產(chǎn)出內(nèi)容。來源:Manus
北京郵電大學(xué)智能交互設(shè)計(jì)專業(yè)副教授譚劍向澎湃新聞?dòng)浾弑硎?,結(jié)合目前已有的官方資料和測(cè)試直播來看,Manus能夠接收自然語言指令,融合語言、圖像、語音等多種模態(tài)數(shù)據(jù),貫穿瀏覽器、云平臺(tái)、個(gè)人終端等數(shù)字平臺(tái),精細(xì)捕捉用戶的深層需求,獨(dú)有完成任務(wù)。這種從“思考”到“行動(dòng)”的閉環(huán)能力,展示了其強(qiáng)大的自主性。
譚劍指出,另一邊,Manus存在的缺陷也很明顯,“不是任何任務(wù)都聽得懂干得了”,“盡管Manus展示了強(qiáng)大的自主執(zhí)行能力,但在復(fù)雜任務(wù)或未知環(huán)境中,也會(huì)出現(xiàn)宕機(jī)的狀態(tài),原因在于其推理鏈路的缺失或知識(shí)的不完備??梢灶A(yù)知,還有大量的特殊性任務(wù)需要進(jìn)一步優(yōu)化和訓(xùn)練?!盡anus官網(wǎng)上放出了多個(gè)準(zhǔn)備好的案例用以回放。來源:Manus
其實(shí),自從發(fā)布以來,Manus受到了不少質(zhì)疑。有網(wǎng)友指出,Manus只放出了一個(gè)英文的官方網(wǎng)站和英文的宣傳片,看起來更像是個(gè)出海產(chǎn)品,但在海外社交平臺(tái)上的討論度并不高,而Manus在國(guó)內(nèi)也沒有社群和服務(wù)方面的支持。也有海外研究者在社交平臺(tái)上發(fā)文稱,Manus是一款好產(chǎn)品,但并非是技術(shù)突破。
而在3月7日午間,一個(gè)在X平臺(tái)名為@ManusAI_HQ賬號(hào)顯示被凍結(jié),該賬號(hào)凍結(jié)前并未獲得任何認(rèn)證,只發(fā)布了數(shù)條有關(guān)Manus的視頻和文字介紹,但Manus官網(wǎng)的X平臺(tái)鏈接均指向于此。7日下午,疑似為Manus聯(lián)合創(chuàng)始人兼首席科學(xué)家季逸超的X平臺(tái)賬號(hào)(@peakji)發(fā)布聲明稱:“我們的官方X帳戶昨天意外被凍結(jié)。我們正積極與X團(tuán)隊(duì)合作解決此事。初步觀察表明,此次凍結(jié)可能與第三方提及加密貨幣詐騙有關(guān)。澄清一下:Manus 從未參與過加密貨幣項(xiàng)目、代幣發(fā)行或區(qū)塊鏈計(jì)劃,任何聲稱與我們有關(guān)聯(lián)的類似名稱的加密貨幣企業(yè)都是具有欺騙性的。
”Manus官方X帳戶已被凍結(jié)。來源:X平臺(tái)
此外,由于邀請(qǐng)碼機(jī)制,只有極少數(shù)開發(fā)者能夠?qū)嶋H體驗(yàn)到產(chǎn)品,又與Manus在國(guó)內(nèi)社交媒體上的“火爆”形成了鮮明對(duì)比。6日當(dāng)天,有網(wǎng)友關(guān)注到Manus的邀請(qǐng)碼在二手電商平臺(tái)一度被炒至數(shù)萬元之高,不過成交量為零。到了3月7日,在二手電商平臺(tái)已經(jīng)看不到高價(jià)的Manus邀請(qǐng)碼,而是出現(xiàn)了許多的代申請(qǐng)服務(wù)。
3月6日,Manus的合伙人張濤在微信朋友圈發(fā)文回應(yīng)稱“完全低估了大家的熱情”,公司“從未開設(shè)任何付費(fèi)獲取邀請(qǐng)碼的渠道”,并且“從未投入任何市場(chǎng)推廣預(yù)算”,內(nèi)測(cè)期間系統(tǒng)容量有限,將優(yōu)先保障現(xiàn)有用戶的重點(diǎn)體驗(yàn),并逐步有序釋放邀請(qǐng)。
多位國(guó)內(nèi)AI從業(yè)者對(duì)記者表示,自己和身邊的朋友都沒能夠獲得邀請(qǐng)碼,無以一睹該產(chǎn)品的“真面目”。有相關(guān)研究者表示,Manus的宣傳可能有些過熱,在這種情況下,大眾對(duì)產(chǎn)品產(chǎn)生質(zhì)疑也很正常。
與國(guó)內(nèi)社交平臺(tái)和網(wǎng)絡(luò)熱烈討論形成鮮明對(duì)比的是,目前海外討論聲音并不算多,或許是因?yàn)槎鄶?shù)人并未能上手體驗(yàn)。
獵豹移動(dòng)董事長(zhǎng)兼CEO傅盛6日在“傅盛講AI”的視頻號(hào)中也提到,從目前公開的資料來看,Manus的功能“確實(shí)很像鋼鐵俠里的賈維斯(AI系統(tǒng))了,但是具體能力很難評(píng)估,因?yàn)檫@個(gè)受基座模型的影響也很大,但目前相關(guān)信息并沒有公開。套了好幾家的殼是一定的,就不知道都套了哪些?!?
3月7日,全球比較大代碼托管平臺(tái)GitHub上還開始出現(xiàn)Manus的開源復(fù)刻項(xiàng)目。例如,一個(gè)名為OpenManus的項(xiàng)目打出了“無需邀請(qǐng)碼即可實(shí)現(xiàn)任何想法”的旗號(hào),在不到一天的時(shí)間內(nèi),該項(xiàng)目的Star量(星標(biāo))已經(jīng)超過了四千。開發(fā)者只需創(chuàng)建環(huán)境,克隆項(xiàng)目并修改相應(yīng)信息,即可在本地搭建一個(gè)近似于Manus的AI智能體。OpenMunus的開發(fā)者之一Jiayi Zhang在介紹項(xiàng)目時(shí)稱“沒有壁壘,完全開放”。來源:X平臺(tái)
體驗(yàn)者評(píng)價(jià):性能強(qiáng)但不穩(wěn)定
“挺強(qiáng)的,但還是不夠穩(wěn)定?!币晃籑anus的體驗(yàn)者告訴澎湃新聞?dòng)浾?,他讓Manus設(shè)計(jì)了一份跨度長(zhǎng)達(dá)半年的多國(guó)旅行攻略,單靠人力需要花費(fèi)十幾天才能完成的工作,Manus幾十分鐘就搞定了,而且這份攻略“全到令我震驚,比之前的大模型輸出的路線規(guī)劃明顯更合理”。
不過,他也指出,“速度很關(guān)鍵,如果是普通的任務(wù),用戶可能沒耐心等待幾十分鐘”。同時(shí),在處理更為復(fù)雜的任務(wù)時(shí),也會(huì)因算力不足的原因出現(xiàn)報(bào)錯(cuò)和任務(wù)中斷的情況。
澎湃新聞?dòng)浾咴谟^察其他體驗(yàn)者使用的過程中也發(fā)現(xiàn),Manus目前在處理任務(wù)時(shí)等待時(shí)間都較長(zhǎng),同時(shí)也需要進(jìn)行一些人為干預(yù),來糾正例如對(duì)自然語言指令理解出現(xiàn)偏差的情況。
對(duì)于大家都“催”著Manus盡快開放,多名AI業(yè)內(nèi)人士對(duì)記者表示,Manus選擇內(nèi)測(cè)的形式可能是因?yàn)椤疤F”、“太燒算力”。
至于agent的使用價(jià)格,外媒近日曝出了OpenAI對(duì)AI agent的收費(fèi)計(jì)劃,“博士”級(jí)別的agent每月收費(fèi)可能高達(dá)2萬美元,主要面向希望補(bǔ)充軟件工程師或醫(yī)學(xué)研究人員的用戶,尤其是愿意為大規(guī)模自動(dòng)化支付高價(jià)的企業(yè)客戶;可用于軟件開發(fā)的agent每月收費(fèi)1萬美元;面向“高收入知識(shí)工作者”的agent每月收費(fèi)2000美元。
前述業(yè)內(nèi)人士對(duì)記者表示,如果agent確實(shí)效果好且有實(shí)際需求,付費(fèi)模式應(yīng)該不成問題,但考慮到較高的價(jià)格,可能給用戶提供幾次試用機(jī)會(huì)會(huì)更具可行性。
譚劍表示,雖然2025年被普遍視為AI智能體規(guī)?;涞氐年P(guān)鍵年份,但在處理復(fù)雜任務(wù)、理解上下文和人機(jī)交互等方面,智能體仍需進(jìn)一步提升:“不過,我看好AI智能體的未來??梢栽O(shè)想,結(jié)合了AI智能體的機(jī)器人將具有自然語言溝通、團(tuán)隊(duì)協(xié)作和復(fù)雜流程自動(dòng)化作業(yè)的能力,這是非常有前景的生產(chǎn)力發(fā)展方向?!?
轉(zhuǎn)載自澎湃新聞