大灣區計劃

Automechanika Hong kong pavilion

關於我們

香港物聯網協會致力在香港各界推動物聯網應用

FAIR 訓練AI 玩拳擊，效果堪比真人比賽，試探+周旋+爆頭

AI 拳擊可以有多好玩？

小紅紅，吃我一拳。

嘿，我擋。

前期先試探周旋幾次，再找機會吧。

沒錯，就是這個空隙，爆頭。

還想故技重施，我躲。

怎麼樣，AI 拳擊動畫效果是不是和真人比賽神相似？

基於AI 深度強化學習的拳擊選手身體不僅擁有超高自由度，而且它還掌握了格擋、後退、擺拳等拳擊基本動作。

Facebook 人工智能研究部門（FAIR）在機器學習領域，總能帶來一些意想不到的成果，上面的演示正是它們在《Control Strategies for Physically Simulated Characters Performing Two-player Competitive Sports》（模擬人物進行雙人競技運動的控制策略）一文中的部分演示片段。

論文地址：

https://research.fb.com/wp-content/uploads/2021/06/Control-Strategies-for-Physically-Simulated-Characters-Performing-Two-player-Competitive-Sports.pdf

在這篇論文中，研究人員開發了一個學習框架，通過物理模擬角色學習基本技能、學習回合級別的策略、深度強化學習的步驟方法，來模擬人們學習競技體育的訓練路線。

同時，它們還開發了一個編碼器-解碼器結構的策略模型來讓物理模擬角色進行訓練學習，該結構包含一個自回歸潛在變量和一個專家混合解碼器。

為了展示框架的有效性，研究人員通過拳擊和擊劍兩種運動，演示了物理模擬角色在框架學習到的控制策略，這些策略可以生成戰術行為，並且讓所有動作看起來更自然。

論文概述

在雙人競技運動中，運動員經常在比賽中展示出高效的戰術動作，如拳擊和擊劍。但創建多人動畫場景是一項巨大的挑戰，因為它不僅要求每個人物模型都以自然的方式行事，而且還要求它們彼此之間的互動在時間和空間領域都是同步的，以顯得自然。

相互作用的密度越大，問題就越具有挑戰性，因為在相互作用之間沒有時間“重置”。使用物理模擬角色簡化了問題的一部分，因為低層次的物理互動（如碰撞）是通過模擬自動生成的。

然而，由於學習包含比賽的一系列技能，人們還沒有對不同技能的協調進行深入研究，如刺拳、勾拳、等拳擊級別的反擊和壓力戰鬥策略。

在競技運動中使用模擬角色的一個關鍵挑戰是，需要學習基本技能和拳擊級別的策略，以便它們能夠正確地協同工作。

在這篇論文中，FAIR 探討了訓練控制系統的技術，開發了一個框架，為角色之間的互動生成控制策略。其中的人形機器人擁有超高自由度，並由關節力矩驅動。

研究人員解釋，他們的設計靈感源於現實世界。對於大多數運動來說，人們首先是在沒有對手的情況下學習基本技能，然後通過與對手競爭來學習如何結合和完善這些技能。

基於此，FAIR 模仿這兩個過程，通過深度強化學習，讓物理模擬角色學習基本技能和學習比賽級別的策略。 Continue reading →

神經機器接口新進展！讓“假肢”運動自然如真胳膊，登上Science子刊新封

美國克利夫蘭診所為仿生手臂開發的一項“神經-機器接口”新研究，剛剛登上了Science Robotics最新人機交互專刊封面。

通過在改造的仿生手臂裝上微型機器人，患者能像正常人一樣能去思考、決策、執行任務，不僅可以直接控製手臂運動，還能感受到手臂和手的運動、抓握和触摸，恢復基礎的上肢運動能力。

這些發現是朝著實現截肢患者完全恢復自然手臂功能所邁出的重要一步。

該研究論文題目為《仿生上肢的假肢觸覺、運動感覺和運動的神經機器人融合促進了內在的大腦行為（Neurorobotic fusion of prosthetic touch, kinesthesia, and movement in bionic upper limbs promotes intrinsic brain behaviors）》，於2021年9月1日發表在Science Robotics上。

論文鏈接：

https://www.science.org/doi/10.1126/scirobotics.abf3368

仿真手臂市場大，技術落後

根據2021年國際市場調研機構Grand View Research的相關報告，到2028年，全球假肢和矯形器市場預計將超過80億美元。

但目前假肢研究已經遇到了機械障礙，它們不能實現許多日常生活中人體需要的直觀感覺，比如說張開和合上雙手。

根據美國克利夫蘭診所所勒納研究所生物醫學工程系副教授、研究通訊作者保羅·馬拉斯科（Paul Marasco）的說法，由於佩戴傳統假肢的人無法用四肢來感知環境，他們在日常生活中完成任務時的行為和沒有截肢人的行為會不同。

例如，佩戴傳統假肢的人在使用假肢時必須目不轉睛地註視著假肢，並且當他們用力過大或過小時，很難學會糾正這些錯誤。

▲保羅·馬拉斯科（Paul Marasco）

借助新的仿生手臂和先進的評估工具，研究人員可以看到研究參與者的大腦和行為策略發生了變化，與沒有截肢的人可以相匹配。

研究參與者不再需要看他們的假肢，可以在不看的情況下找到東西，可以更有效地糾正錯誤。

馬拉斯科說：“在過去的10年或20年裡，假肢的進步幫助佩戴者實現了更好的功能，並自己管理日常生活。第一次，上肢截肢的人現在能夠再次像健全人一樣’思考’，新仿生手臂可以為假肢佩戴者實現新程度無縫重新融入日常生活。”

針對這種情況，美國克利夫蘭診所研究人員牽頭的國際團隊（合作機構有加拿大阿爾伯塔大學和加拿大的新不倫瑞克大學）開發了一種新的仿生系統，來改裝標準護理仿生手臂。

02 Continue reading →

音樂界的元宇宙要來了！HTC推出BeatdayVR平台，將有六場音樂會

據外媒Variety報導，中國台灣科技公司HTC即將推出VR平台Beatday測試版，將以此建立“一個以音樂為焦點的元宇宙”。

Beatday將通過虛擬場地與現實表演結合的形式，在PC端和移動設備上打造一個全息演唱會，讓更多的觀眾參與互動。

HTC是消費級VR設備的頭部玩家之一，曾與開發商Valve合作在2016年共同推出VIVE頭顯，而後HTC還推出了VIVE Focus系列，並對產品更新迭代。

▲VIVE系列頭顯

“我們相信，Beatday正在改變娛樂業，人們會對此很感興趣，”HTC Vive Originals總經理劉思銘表示，“它正在整合音樂授權、唱片公司和藝人管理機構，並創造新的商機和收入模式。”

全息演唱會或成線上演出的新方式

由於疫情防控，許多演唱會轉為線上直播的形式，但這樣的方式，與觀眾現場觀看演唱會在體驗上具有較大差距。

如何打造一場具有現場感的線上演唱會？HTC將全息音樂會視為一個新的解決方案。

▲HTC Vive為VR音樂節Lost Horizon提供直播

劉思銘認為，“現場演唱會因疫情取消後，’全息演唱會’將成為線上演出的新方式”。

他表示，HTC將與中國台灣“Amazing Show”合作，共同舉辦六場音樂會，每場音樂會持續半小時，但他並沒有透露具體的演出日期。

不僅如此，到2021年底，HTC Vive Originals還預計簽約三到四個演員入駐該平台，其中包括一些台灣最知名的演員。

拆解虛擬場景與現實表演，

HTC通過3D錄製打造全息演唱會

全息演唱會主要分為兩個技術部分，建立虛擬場地與錄製現實表演。

首先，全息演唱會需要構建一個虛擬表演的舞台空間。相較於現實演唱會，舞台設計師和燈光團隊在數字舞台設計上擁有更大的發揮空間。

隨後，表演者們需要在動作捕捉工作室（movement seize studio）裡進行3D錄製，全方位記錄表演的實景情況。目前在日本、法國以及國內都有相應的動作捕捉工作室。

▲日本霸天少女隊通過3D錄製參與VR演出

然後，Beatday通過將虛擬場地與現實演唱會相結合的方式，打造一個全息演唱會，並提供紀念門票、商品等。

觀眾也可以通過創建一個自己的虛擬形象來參加演唱會，甚至可以在虛擬場地上飛行。

率先用於PC和手機，

Beatday或推出VR完全版

劉思銘表示，Beatday將會提供兩個不同形式的初代版本，一個適用於PC端，一個適用於移動設備上，而VR版本可能會根據市場情況推出。

“我們首先會在PC和移動終端上推出Beatday，來吸引一些年輕的用戶。當我們在市場上達到一定規模後，我們會發布一個VR版本，解鎖真正的高端體驗。”

有關價格方面，HTC表示一張門票的價格可能在60到130人民幣左右，並且他們還提供音樂會的入場劵以及定制頭像。此外，HTC還將通過付費的服裝和配飾來創造營收。

04 Continue reading →

Nature重磅：復旦團隊研發新型智能夾克，可為手機無線充電、實時監測身體健康

小時候，你是否有過這樣一個夢想：

就像鋼鐵俠一樣，只需要按下胸前衣服上的按鈕，就能瞬間披上戰甲，變得無所不能。也許在未來，我們擁有“特異功能”也並非一件不可能的事。
（來源：Pixabay）

如今，在智能手機的創新逐漸走弱及其市場容量也接近飽和的大背景下，智能可穿戴電子設備已經成為智能終端產業的下一個熱點。而柔性可穿戴電子設備是未來智能可穿戴電子設備發展的熱點研究方向之一。但是，對於柔性可穿戴電子設備而言，電池對其設計和功能有很大影響，由於常規鋰電池比較笨重，難以在可穿戴電子設備中大規模使用。因此，在過去的數10 年中，如何提高可彎曲鋰電池（紡織鋰電池）的能量密度、柔韌性、機械強度和循環穩定性等性能，一直是科學家爭相研究的熱點課題。近日，由複旦大學高分子科學系彭慧勝教授領銜的研究團隊，為解決短纖維鋰離子電池（長度只有幾厘米）在連接中會損害纖維的能量密度和穩定性的問題，研發出了一種長纖維鋰離子電池（fibre lithium-ion batteries，FLIB），並製作了一種不僅可以為手機等外部設備充電、還可以監測人體健康的智能夾克。

（來源：Nature）

相關研究論文以“Scalable production of high-performing woven lithium-ion fibre batteries” 為題，發表在權威期刊Nature 上。復旦大學高分子科學系、先進材料實驗室的彭慧勝教授和陳培寧青年副研究員為該論文的共同通訊作者。

下一代電子通訊工具？

可穿戴電子設備，即直接穿在身上，或整合到衣服或配件上的一種便攜式設備。而智能可穿戴電子設備，則可以通過軟件支持、數據交互、雲端交互來實現強大的功能。如今，隨著現代黑科技的飛速發展，越來越多的可穿戴電子產品出現在我們的日常生活中，為我們提供了極大的便利。例如，早在2012 年就出現的谷歌眼鏡（Google Glass），它擁有與智能手機一樣的功能，可以聲控拍照、視頻通話、上網衝浪，以及處理文字和電子郵件等功能。

（來源：Glass）

當前，可穿戴電子設備的主流產品形態主要包括以手腕為支撐的watch 類（手錶、腕帶等）、以腳為支撐的shoes 類（鞋、襪子或者其他腿上佩戴產品）和以頭部為支撐的Glass 類（眼鏡、頭盔、頭帶等）；非主流產品形態則包括智能服裝、書包、拐杖、配飾等。而柔性智能可穿戴電子設備一般是指具有機械柔性、可以直接或間接與皮膚緊密貼合的電子設備，就像奧特曼、鎧甲勇士的“皮套”一樣，除了具備一定的交互功能，還非常貼合人體。例如，今年3 月份彭慧勝教授團隊發明了一種新奇的智能電子織物在測試中，這種織物展現出了優異的可拉伸性、透氣性和耐用性，同時該織物還能作為大面積顯示屏，根據不同的數字信號輸入呈現出多元化的內容。相關研究論文也已發表在Nature 上。

圖｜由“智能織物”製成的衣服可顯示出不同的字樣（來源：Nature）

未來，基於纖維或者紗線的柔性電子設備將是下一代多功能柔性可穿戴電子的重點研究方向，這類電子設備不僅具有增強的光電性能和力學性能，還可以實現最小功耗和可持續的自我功能，在集成更多功能後，也有望塑造下一代電子通訊工具。

打破以往認知

在此項研究中，研究人員在生產長纖維鋰離子電池方面進行了初步嘗試，在商用鋁線周圍塗覆鋰鈷氧化物以形成正極，並在銅線周圍塗覆石墨以形成負極。而且，為防止出現短路的情況，負纖維電極用商用隔離膜包裹。

圖｜用於產生連續纖維鋰離子電池的裝置原理圖。鈷酸鋰（紅色）和石墨（藍色）漿料分別塗覆在鋁和銅集流器上。乾燥後，用分離器將負極纏繞，然後以優化的節距與正極擰在一起，通過擠壓將其封裝在聚合物複合管中。（來源：該論文）

圖｜a.扭曲結構的纖維鋰離子電池原理圖；b.纖維鋰離子電池的照片；c.可拆卸的纖維鋰離子電池顯示正極、負極、隔膜、封裝管等部件。（來源：該論文）

研究人員手動將正極和隔膜包裹的負極纖維電極纏繞在一起，製成了不同長度（0.1、0.2、0.5 和1 Continue reading →

每滴水用3.5次，台積電用水有多摳？近9成是再生水

我國台灣地區今年可謂多事之秋，新冠肺炎疫情遲遲未解，剛剛熬過百年一遇的嚴重干旱，又面臨洪澇災害。而連遭天災暴擊的台灣最大晶圓廠、全球芯片代工一哥、島內最大用水用電企業——台積電，卻沒怎麼被危機影響生產進度，就連在同樣遭遇嚴重干旱的美國亞利桑那州所建新廠，當前建設計劃也未受影響。

這背後，台積電多年打磨的企業風險管理措施功不可沒。另據奧地利數據公司World Data Lab統計，已有24億人生活在水資源貧乏的地區。聯合國亦指出，2030年，水資源短缺將使7億人流離失所。全球範圍內，缺水危機頻頻上演，提前預警防範這些突發災害已是各大半導體廠商必行之策。

通過近期台積電設施部高級總監Arthur Chuang發表的一篇文章，我們提煉了台積電處理水資源短缺問題的要點以及台積電的綠色製造措施，看看台積電用水到底有多“摳”？

一、晶圓廠日用水超1.5萬升，特別工作組應對供水風險

在全球缺芯的當下，水是芯片製造的基本要素之一。美國水處理設備廠商Water Technology的數據顯示，一家晶圓廠每天需要消耗2000萬加侖到4000萬加侖（約7570萬升-1.5億升）的水來清潔矽片和冷卻設備。如果發生缺水問題，將會嚴重地影響到芯片廠商的生產能力。

因此為了避免水資源短缺的風險，台積電很早之前就建立了包含供水風險在內的企業風險管理系統。

台積電還有氣候相關財務披露特別工作組（TCFD）來確定氣候相關的風險。針對不同的缺水階段，台積電設立了不同的反應程序，以處理短缺情況。

而隨著半導體技術的進步，芯片製造的材料和流程也更加複雜，很多化學用品都是芯片製造的重要原料，極大地增加了晶圓廠對水資源質量和數量的要求。

在這樣的情況下，每一滴水都十分寶貴。Arthur Chuang稱，無論節水效果如何，台積電都不能忽視任何節約用水的機會。

每滴水用3.5次，台積電用水有多摳？近9成是再生水 ▲台積電每日用水和可用水資源對比（來源：EE Times）

二、避免有毒溶劑使用，150只螢火蟲安家晶圓廠

Arthur Chuang在文中寫道，水資源的消耗其實是晶圓廠能源消耗的一個單獨問題。如果想要實現綠色製造，晶圓廠需要能源管理和廢水排放上堅持高標準。

具體到晶圓廠內部，台積電在整個晶圓廠內部建立了能源管理系統，系統中台積電採用了較為高效的IE3和IE4電機和熱回收設備，可以準確地了解每個設施所消耗的能源情況。

同時，台積電開始在晶圓生產中開始減少或避免使用有毒溶劑。據Arthur Chuang分享，如今台積電已不在晶圓清洗環節使用NMP（N-甲基吡咯烷酮）溶劑。該溶劑選擇性強、穩定性好，經常在高精密電子、電路板或鋰電池中用作清洗劑，但是對人體和環境具有一定的毒性。

為了保護水源，台積電還擁有一套可以根據廢水特性和濃度運行的廢水排放分離系統，並禁止使用任何無法自然分解或從水中去除的化學品。

每滴水用3.5次，台積電用水有多摳？近9成是再生水 ▲台積電水處理槽（來源：台積電）

在這樣的努力下，台積電的環境保護策略已經取得了一定成績。台積電Fab 15位於台中大渡山腳下，與自然環境較為貼合。Fab 15在2020年獲得了可持續水資源管理標準（AWS Standard）的白金證書，這使台積電成為了全球第一家連續2年獲得AWS白金認證的半導體企業。

由於螢火蟲的生長對環境要求較高，尤其是水資源的潔淨程度對其成蟲相當重要。2020年7月，台積電的Fab 15廠區發現了第一隻水生黃螢；截至2021年2月底，Fab 15中已培育了150餘隻蘆生窗螢。這些小生命的出現，側面肯定了台積電對晶圓廠環境的維護。

每滴水用3.5次，台積電用水有多摳？近9成是再生水 ▲台積電Fab 15中的螢火蟲（來源：台積電）

三、再生水廠今年運行，每天可回收5000立方米

水處理和回收是台積電節水的重要一環，當前台積電所使用的水源中，85%-90%都是再生水。

去年，台積電位於中國台灣南部科學園區的再生水廠開工，計劃在今年投入使用，以回收工廠廢水，補充城市水源。該再生水廠是中國台灣的首家民營水廠。如果水廠建成，每天可回收5000立方米的水源；到2023年，台積電預計每天回收再生的水資源將達到2萬立方米。

每滴水用3.5次，台積電用水有多摳？近9成是再生水 ▲台積電再生水廠和Fab 6、Fab Continue reading →

首款AR隱形眼鏡要來了！能閉眼看片，還能無線充電

據外媒報導，美國初創公司Mojo Vision開發的自家首款隱形AR眼鏡的相關原型已經通過了毒理學檢測。如果一切順利，Mojo Vision有望於今年公佈一款功能齊全的隱形AR眼鏡原型裝置。目前，市面上尚未出現類似的產品。

▲Mojo Lens

位於美國加州的初創公司Mojo Vision，是一家致力於開發隱形計算技術的公司，在2020年9月與日本隱形眼鏡製造商美尼康（Menicon）簽署了智能隱形眼鏡聯合開發協議，合作開發隱形眼鏡。

已通過毒理學測試，

完整版產品有望年內推出

8月24日，Mojo Vision介紹了與美尼康合作開發的隱形AR眼鏡項目的最新進展。首席技術官Mike Wiemer在Hot Chips處理器大會上詳細介紹設計的時候說：“我們已經幾乎完成了所有工作，非常接近（完整版產品）”。該AR隱形眼鏡產品原型已經通過了毒理學測試，Mojo預計今年會推出一個功能齊全的原型。

▲Mojo Lens中的畫面

Mojo Lens的核心是一個不到半毫米寬的六邊形顯示器，每個綠色像素的大小只有紅細胞寬度的四分之一。該AR隱形眼鏡使用一種名為“femtoprojector”的放大系統，用來擴展圖像並將其發送到視網膜的中央斑塊上。

▲Mojo Lens顯示器

Mojo Lens的鏡片上環繞著多種電子設備。包括一個捕捉外部世界的相機。一個用來處理圖像的電腦芯片，控制顯示器控制顯示器並與外部設備（例如手機）進行無線通信。一個補償眼球運動的運動追踪器。該設備由電池供電，可以像智能手錶一樣在夜間進行無線充電。

▲Mojo Lens的鏡片環繞有多種設備

Mojo的計劃是拋棄笨重的頭戴設備，例如微軟的HoloLens。如果該項目成功，Mojo Lens可以幫助視力有問題的人，比如在文本中高光字母，或者讓文字的邊緣更明顯（使文字更加“清晰”）。該產品還可以幫助運動員在不使用其他設備的情況下，了解自己騎了多遠或者心跳有多快。

閉著眼也能看見畫面

▲Mojo Lens畫面中的數據標識

Mojo Lens的一個關鍵部分是其眼動追踪技術，可監控眼球的運動軌跡並相應的調整圖像。如果沒有開啟眼動追踪功能，Mojo Lens會在視野的固定中心區域顯示圖像。例如，當使用者只是快速掃視，而不是閱讀文本，那麼只會看到文本塊隨著眼球視線移動。這個眼球追踪技術借鑒了從智能手機行業汲取的加速計（accelerometer）和陀螺儀（gyroscope）等技術。

Mojo Lens依靠一個叫做繼電器附件的外部設備來處理和控製圖像，並提供用戶界面。但顯示器和投影儀並不會干擾使用者的真實世界視覺，“你根本看不見顯示器，這不會影響你對現實世界的視覺”，Wiemer說，“你甚至可以閉著眼睛看書或者看電影。”

Mojo是最接近上市的AR隱形眼鏡

Mojo Vision在其產品上市前還有很長的路要走。該設備必須通過監管機構的審核並且還要能讓大眾所接受。互聯網巨頭谷歌曾經嘗試將AR技術融入到眼鏡之中，這也是大眾所熟知的谷歌眼鏡，但該項目從2012年開始到2015年關閉僅持續了三年，這其中就有著社會對其侵犯隱私疑慮的影響。 Continue reading →

矽谷提出租賃機器人新方案，幫小型工廠一年節省數万美元

根據調查，路透社發現美國矽谷科技產業區針對美國小型工廠勞動力短缺給出了新的解決方案：租賃機器人。

租賃機器人模式就是機器人企業製造然後出租機器人，客戶按小時或者月度付費，同時機器人企業還負責保養維護出租出去的機器人。

這種模式的出現是因為隨著技術進步和用工成本的增加，美國各地的大型工廠購買機器人的數量激增；但規模較小的工廠因為擔心購買機器人產生的高昂前期成本，以及工廠中也沒有機器人工程人才，所以很少購買機器人。

很多投資者看好租賃機器人這種金融模式，截止到現在今年已有多家機器人創企獲得融資。

2021年老虎環球基金投資科技創企最多

薩曼·法里德（Saman Farid）之前是一位風險投資人，在機器人領域投資了有十多年，他知道將機器人推銷進工廠的挑戰。

後來，法里德在兩家美國風險投資機構Lux Capital和Initialized Capital（美國自動駕駛初創公司Cruise的早期投資者）的支持下，成立了租賃機器人公司。

Initialized Capital的合夥人譚

但有個問題是機器人技術人員和小公司老闆之間不一定互相了解，因此美國製造技術協會因為這個問題專門在美國舊金山設立辦事處，將各技術人員和各公司老闆聚集在一起，增加聯繫和理解

支持機器人創企的行業組織美國Silicon Valley Robotics說，在過去，資金一直是個挑戰。

租賃模式給機器人創企帶來了很大的財務負擔，這些初創公司會出現合作的製造商終止合同或更換產品的風險，以及小型工廠通常會生產少量定制產品，這些並不值得使用一個機器人。

儘管了解租賃機器人產業發展可能存在風險，一些著名的投資者還是會對其進行投資。

路透社報導稱，其中美國投資公司老虎環球基金（Tiger Global Management）是今年到現在最大的科技創企投資者，七個月內投資了三家提供機器人租賃服務的機器人創企，分別是美國倉庫自動移動機器人的生產商Locus Robotics、美國自動焊接機器人製造商Path Robotics和美國機器操作機器人公司Rapid Robotics。

其中，Locus Robotics是在2021年2月獲得由老虎環球基金和美國投資者BOND Capital領投的1.5億美元（約9.70億元人民幣）融資，然後，2021年7月美國自動焊接機器人製造商Path Robotics獲得了由老虎環球基金領投的1億美元（約6.47億元人民幣）融資。

8月美國機器操作機器人公司Rapid Robotics獲得老虎環球基金領投的融資，領投的還有美國投資公司Kleiner Perkins，此次共融資3760萬美元（約2.43億元人民幣）。

此外，美國倉庫和工廠自動駕駛機器人企業Fetch Robotics在七月被美國自動標識公司Zebra Technologies收購。

02 Continue reading →

計算機視覺的“慘勝”：反思大型圖像數據集

誕生於第二次世界大戰、恐怖納粹統治時期的1947年紐倫堡法案和隨後的1964年赫爾辛基宣言，幫助人們建立起了知情同意原則（Informed Consent），該原則建立在人類尊嚴和控制關於自己信息傳播的基礎上。

在接下來的數十年間，知情同意原則指導了醫學、心理學等學科收集實驗對像數據的方式。

儘管這一原則尚不完善，但是它仍然在一定程度上保護了大數據時代的個人隱私保護。

然而，在這個大數據時代，知情同意、隱私或個人代理的基礎已經逐漸被侵蝕。政府機構、學術界和工業界都在未經同意的情況下，以匿名的名義積累了數以百萬計的人類圖像，通常是出於未聲明的目的。

這些說法具有誤導性，因為總體而言，匯總數據的匿名性和隱私性較弱，更重要的是，人臉圖像不是可以匯總的數據類型。從表1可以看出，在同行評議的文獻中發現了數千萬人的圖像，這些圖像是在未經個人同意或知情的情況下獲得的，也沒有得到IRB（強制性機構審查委員會）的批准。

表1. 包含人類圖像的大規模數據集

在此背景下，UnifyID AI Labs的Vinay Uday Prabhu， The Irish Software Research Centre的Abeba Birhane，將目光關注最著名和最規範的大規模圖像數據集之一：ImageNet數據集。

從有問題的圖像來源方式到圖像中的人類標籤，再到使用這些圖像訓練人工智能模型的下游效應，ImageNet和大規模視覺數據集(下文簡稱“LSVD”)，構成了計算機視覺的代價巨大的勝利。

在他們的論文LARGE DATASETS: A PYRRHIC WIN FOR COMPUTER VISION?中，兩人指出，這場胜利是以損害少數群體為代價的（數據實戰派後台回复“ImageNet”獲取論文下載鏈接）。

這個高質量但低隱私的計算機視覺行業新起點，變相助長了在這之後數年技術對個人和集體隱私、同意權的侵蝕。

ImageNet數據集的出現被廣泛認為是深度學習革命的關鍵時刻，這場革命徹底改變了計算機視覺(CV)和人工智能(AI)。

在ImageNet之前，計算機視覺和圖像處理研究人員在小數據集上訓練圖像分類模型，如CalTech101 (9k圖像)、PASCAL-VOC (30k圖像)、LabelMe (37k圖像)和SUN (131k圖像)數據集。

ImageNet擁有超過1400萬張圖像，分佈在21,841個synsets中，包含1,034,908個邊界框註釋，彌補了以前規模方面的缺失，主導了曾經的計算機視覺奧運會，擁有6000萬個參數的捲積神經網絡(CNN)在這個數據集中大放異彩。

ImageNet創建於十多年前，迄今仍是最具影響力和最強大的圖像數據庫之一。在它創建的多年後進行事後審判，似乎是多餘的，但ImageNet確實對其他大規模數據集的持續性和計算機視覺領域的文化培養起到了關鍵作用。

威脅在哪？

從ImageNet出發，這篇論文總結了缺乏謹慎倫理考慮、對負面社會後果預期的數據集管理實踐的潛在危害和威脅。 Continue reading →

解密：波士頓動力如何用算法構建Atlas機器人的感官世界

波士頓動力一周前發布了一個長達90秒的視頻。在視頻中，Atlas完美地跑完了複雜的障礙賽。

於是有很多網友好奇是什麼黑科技讓機器人可以如此智慧。

機器人該怎麼樣才能像運動員一樣奔跑、翻轉、跳躍？創造這些高能演示的是一個有趣的挑戰，但波士頓的技術目標不僅僅是創造一場華麗的表演。在Atlas項目中，他們以跑酷為實驗主題，通過動態運動，感知和控制之間的聯繫，來研究相關的問題。這些問題的解決有助於機器人更加順暢地運行。

機器人對跑酷的感知

機器人感知算法會被用到相機和激光雷達等傳感器的數據轉換對策和規劃物理行動中。雖然Atlas使用IMU、關節位置和力傳感器來控制其身體並感受地面獲得平衡，但Atlas還需要感知算法來識別障礙物，如圖1中看到的木箱和窄橋：

圖1：這個動畫顯示了一個Atlas機器人深度相機生成的點雲旋轉視圖。

Atlas使用深度相機以每秒15幀的速度生成環境點雲。點雲是距離測量數據的集合。Atlas的感知軟件使用多平面分割的算法從點雲中提取表面。接著算法輸出的數據被輸入地圖系統，最後系統幫助Atlas用相機看到不同物體建立模型。

圖2：具有感知輸出的Atlas渲染。

圖2顯示了Atlas感知到的物體，並經過反饋與計算規劃行動。左上角是深度相機拍攝的紅外圖像。主圖像中的白點形成點雲。橙色輪廓標記了跑酷障礙物檢測到的矩形面，這些矩形面隨著時間的推移被傳感器跟踪。從而幫助Atlas設置特定的行為。例如，綠色的腳印標記下一步在哪裡跳躍和慢跑。

為了擴展跑酷課程，機器人被導入一張高級地圖，其中包括命令它去哪裡，以及路上應該做什麼動作。這張高級地圖與實際課程不完全一致，它是對障礙物位置和一些主要動作的簡要描述。所以Atlas會使用這些簡要的信息來導航，同時使用實時感知數據來填充細節。例如，Atlas尋找一個可以跳躍的盒子，如果盒子移動到側面0.5米，Atlas會在那裡找到並調整姿勢。如果盒子移動得太遠，系統找不到它就會停下來。

圖3：展示機器人對跑酷課程中伙伴的感知的動畫。

這是一個3D可視化動圖，展示了機器人在跑酷障礙跑道上看到的內容和機器人通過內容反饋的計劃。主動跟踪的物體被繪製成綠色，當物體的距離超過感知範圍時，圖標就會從綠色變成紫色。跟踪系統也會不斷跟進物體的姿態傳給導航系統，導航系統會通過地圖上的信息設計好對應物體的綠色腳印。

行為庫

你在跑酷程序中看到Atlas 執行的每個動作都來自“軌跡優化離線設計”創建的模板。這些模板庫，允許科研人員往庫中添加新的軌跡，添加新的功能。

軌跡優化離線設計，可以讓工程師交互探索機器人能力的極限，並減少機器人的計算量。例如，機器人如何收起四肢做後空翻，這些成就對項目的推進有莫大的幫助。因為這樣可以幫助機器人做到最合理的驅動。科研人員可以利用離線優化捕捉重要的發力點，並使用控制器在線調整它們的動作。

圖4：這種跳馬行為是使用離線軌跡優化設計的複雜全身行為的一個例子。

模型預測

確定了機器人前面盒子、坡道和障礙的位置，並設計了一系列越過它們的動作。剩下的挑戰是填寫機器人執行計劃所需的細節問題。

Atlas的控制器被稱為模型預測控制器（MPC），因為它使用機器人動力學模型來預測運動將如何演變。控制器的工作原理是優化計算出現在最應該做的事情是什麼，從而盡可能形成好的運動姿態。

如上所述，行為庫中的每個模板都向控制器提供了最優的解決方案。控制器調整力、姿勢和行為時機等細節，應對環境幾何形狀、腳滑或其他實時因素。這樣就可以擁有能夠偏離模板運動的控制，自我創建運動過程。這種解決方案也大大減少了機器人可能需要的場景行為模板。例如，從52厘米的平台上跳下來和40厘米的平台跳下來，MPC會自動弄清楚細節。

圖5：顯示感知和計劃路徑的第一人稱視圖。藍色箭頭對應於MPC對機器人在路線中移動時質心和動量的預測。

MPC的預測特性允許Atlas跨越行為界限。比如，知道跳躍後是後空翻，控制器可以自主創建一個平穩過渡的動作。這也簡化了行為創建問題，研究人員不需要再提前考慮可能的行為序列。不過，MPC的創新是有限度的。例如，試圖從慢跑運動過渡到後空翻是行不通的。

為未來奠定基礎

他們對Atlas系統中創建和控制動態行為（也包括舞蹈）有了深刻的理解。但更重要的是，創造了一個可擴展軟件系統的機會，也讓Atlas系統通過感知自身環境做出改變，這個系統將與他們的團隊一起成長。

全球首例！世界最大芯片解鎖“人腦級”AI模型，集群頂配1.63億核心

那個打造出世界最大計算芯片的矽谷明星創企Cerebras Systems，正將“做大做強”的戰略貫徹到極致！
今日凌晨，Cerebras Systems宣布推出世界上第一個人類大腦規模的AI解決方案，一台CS-2 AI計算機可支持超過120萬億參數規模的訓練。相比之下，人類大腦大約有100萬億個突觸。
此外，Cerebras還實現了192台CS-2 AI計算機近乎線性的擴展，從而打造出包含高達1.63億個核心的計算集群。

Cerebras成立於2016年，迄今在14個國家擁有超過350位工程師，此前Cerebras推出的世界最大計算芯片WSE和WSE-2一度震驚業界。

WSE-2採用7nm工藝，是一個面積達46225平方毫米的單晶圓級芯片，擁有2.6萬億個晶體管和85萬個AI優化核，無論是核心數還是片上內存容量均遠高於迄今性能最強的GPU。

WSE-2被集成在Cerebras CS-2 AI計算機中。隨著近年業界超大規模AI模型突破1萬億參數，小型集群難以支撐單個模型的高速訓練。
而Cerebras最新公佈的成果，將單台CS-2機器可支持的神經網絡參數規模，擴大至現有最大模型的100倍——達到120萬億參數。

在國際芯片架構頂會Hot Chips上，Cerebras聯合創始人兼首席硬件架構師Sean Lie詳細展示了實現這一突破的新技術組合，包括4項創新：
（1）Cerebras Weight Streaming：一種新的軟件執行架構，首次實現在芯片外存儲模型參數的能力，同時提供像片上一樣的訓練和推理性能。這種新的執行模型分解了計算和參數存儲，使得擴展集群大小和速度更加獨立靈活，並消除了大型集群往往面臨的延遲和內存帶寬問題，極大簡化工作負載分佈模型，使得用戶無需更改軟件，即可從使用1台CS-2擴展到192台CS-2。
（2）Cerebras MemoryX：一種內存擴展技術，為WSE-2提供高達2.4PB的片外高性能存儲，能保持媲美片上的性能。借助MemoryX，CS-2可以支持高達120萬億參數的模型。

（3）Cerebras SwarmX：是一種高性能、AI優化的通信結構，將片上結構擴展至片外，使Cerebras能夠連接多達192台CS-2的1.63億個AI優化核，協同工作來訓練單個神經網絡。
（4）Selectable Sparsity：一種動態稀疏選擇技術，使用戶能夠在模型中選擇權重稀疏程度，並直接減少FLOP和解決時間。權重稀疏在機器學習研究領域一直頗具挑戰性，因為它在GPU上效率極低。該技術使CS-2能夠加速工作，並使用包括非結構化和動態權重稀疏性在內的各種可用稀疏性類型在更短的時間內生成答案。

Cerebras首席執行官兼聯合創始人Andrew Feldman稱這推動了行業的發展。阿貢國家實驗室副主任Rick Stevens亦肯定這一發明，認為這將是我們第一次能夠探索大腦規模的模型，為研究和見解開闢廣闊的新途徑。

Weight Streaming：存算分離，實現片外存儲模型參數

使用大型集群解決AI問題的最大挑戰之一，是為特定的神經網絡設置、配置和優化它們所需的複雜性和時間。軟件執行架構Cerebras Weight Streaming恰恰能降低對集群系統編程的難度。

Weight Streaming建立在WSE超大尺寸的基礎上，其計算和參數存儲完全分離。通過與最高配置2.4PB的存儲設備MemoryX結合，單台CS-2可支持運行擁有120萬億個參數的模型。

參與測試的120萬億參數神經網絡由Cerebras內部開發，不是已公開發布的神經 Continue reading →