Google推出RT-2機器人模型將使機器人更智能化

谷歌目前正在著力訓練機器人,使其能夠像人工智能聊天機器人一樣進行學習。近日,谷歌推出了AI學習模型Robotic Transformer (RT-2),旨在使機器人更智能化。這項模型是谷歌在視覺語言動作(VLA)方面的新版本,致力於教導機器人更好地識別視覺和語言模式。

Google推出RT-2機器人模型將使機器人更智能化

讓機器人擁有更好的推理能力

谷歌目前正在著力訓練機器人,使其能夠像人工智能聊天機器人一樣進行學習。近日,谷歌推出了AI學習模型Robotic Transformer (RT-2),旨在使機器人更智能化。這項模型是谷歌在視覺語言動作(VLA)方面的新版本,致力於教導機器人更好地識別視覺和語言模式,以便更好地理解指令和推斷出最適合滿足需求的物件。

訓練機器人成為更智能的助手

在實驗中,谷歌研究人員將RT-2放置於廚房環境中,要求機器人手臂判斷何為一個好的鐵錘(結果是一塊岩石),並選擇一種飲料給一個疲憊的人(機器人選擇了一罐紅牛)。甚至更令人驚訝的是,研究人員讓機器人將一罐可樂移到Taylor Swift的圖片上,這機器人竟然也是Taylor的粉絲,這對人類來說是個好消息。

RT-2模型的優勢

谷歌表示,RT-2模型是通過在網路和機器人數據上進行訓練的,並利用了谷歌自家的Bard等大型語言模型的研究進展。該模型將語言模型與機器人數據結合,使機器人能夠理解和處理其他語言的指示,而不僅僅局限於英語。

多年來,研究人員一直試圖讓機器人擁有更好的推理能力,以解決現實環境中存在的問題。事實上,現實生活是極其混亂的,對機器人來說,需要更多的指令才能完成對人類來說簡單的事情。然而,有了像RT-2這樣的VLA模型的強大能力,機器人能夠獲得更多信息,並更加靈活地推斷下一步該做什麼。

谷歌的智能機器人探索

谷歌的探索之旅始於去年,當時宣布將在機器人技術中使用LLM PaLM,並創建了一個名為PaLM-SayCan的系統,將LLM與實體機器人相結合。而RT-2的推出,是谷歌在機器人領域持續探索的又一步。

機器人的進步與挑戰

(image: iStock)

儘管谷歌的新機器人模型引人矚目,但仍存在一些挑戰。據《紐約時報》報導,機器人在實時演示中曾錯誤地識別蘇打水的口味,並將水果誤認為白色。這說明機器人的智能化仍需不斷改進和優化。

然而,對於不同的人來說,機器人的智能化可能受到不同的歡迎程度。一些人可能對機器人在日常生活中的應用感到興奮,期待其在未來能夠成為更加智能和靈活的助手;而一些人則可能會聯想到《黑鏡》中可怕的機器狗,讓他們對機器人的發展保持著一些保留。

展望未來:越來越智能的機器人

無論如何,我們可以期待明年會有更加智能的機器人問世。這些機器人可能只需最少的指令,就能在日常中成為我們的得力助手,。目前來看,谷歌RT-2機器人模型的推出,標誌著機器人在理解人類指令和在現實環境中能更有效地運作,但這只是機器人發展進程的開始,未來的機器人將更加智能、更加靈活,成為人類生活中不可或缺的一部分。

(原文出自:https://www.theverge.com/2023/7/28/23811109/google-smart-robot-generative-ai)

Read more

【PwC Insight Hub】從限電停工到數智韌性:製造業如何用 AI 建立不被中斷的工廠?

【PwC Insight Hub】從限電停工到數智韌性:製造業如何用 AI 建立不被中斷的工廠?

2021 年 9 月 26 日晚上十點,新竹某電子廠的供應鏈主管收到一則訊息。 「昆山廠因為限電政策,明早六點起全面停工,復工時間未定。」 他盯著螢幕,第一時間想的不是「損失多少」,而是:「我有哪些料會斷?」手上有二十幾家上游供應商,十幾條產線同時在跑。有些物料是昆山獨家供應,有些雖有備援,但不確定是否能即時補上。更麻煩的是,他不知道這些料「現在在哪」——有些剛出貨、有些卡在倉庫、有些根本不知道生產了沒。 他打開 ERP 想查庫存,但畫面跳出來的是三天前的帳面數字。實際還有多少?夠撐幾天?哪些訂單會延遲?沒有人能給出答案。 他開始打電話。先是打給昆山供應商,沒人接。再打備援廠商,對方說「要查一下」,然後就是漫長等待。天快亮時,資料才逐一湊齊,而產線,已經開始缺料。 那一晚,台灣有數十位供應鏈主管在做著同樣的事。盯著通訊軟體、查貨況、發郵件、

為什麼 Google 敢向 NVIDIA 叫板?Ironwood TPU 開火,Nvidia 霸主地位首現裂痕

為什麼 Google 敢向 NVIDIA 叫板?Ironwood TPU 開火,Nvidia 霸主地位首現裂痕

Google Cloud 悄悄把 Ironwood TPU(第七代)切到 GA(General Availability),沒有大張旗鼓的 keynote,也沒有找一堆 KOL 排隊喊「mind blown」,就是默默地在控制台把價格表亮出來,然後把 9,216 顆晶片的 pod 直接掛網。這種「我做好了,你自己來玩」的態度,我給滿分。 Ironwood TPU * 單顆 Ironwood 比 Trillium 快 4.2 倍(FP8) * 單 pod 9,216 顆 → 42.5 ExaFLOPS * HBM 容量與頻寬直接翻倍