探秘迪士尼人形機器人:“樹人”格魯特表情生動,蜘蛛俠秀空中表演

你印像中的迪士尼是一家怎樣的公司?動畫公司?電影公司?還是遊樂園公司?其實它還是一家“機器人公司”。

近日,《紐約時報》記者Brooks Barnes探訪了迪士尼的一個秘密研發部門“幻想工程(Imagineering)”,在這裡看到了 他

一、從熒幕中走出的格魯特,會難過還會跳舞

Brooks Barnes剛進入迪士尼的隱秘倉庫就被驚呆了,《銀河護衛隊》中的經典角色“樹人”格魯特睜著大大的眼睛迎面向他走來。這只格魯特大約90厘米高,它上下打量著Brooks Barnes,並說出了那句經典台詞“I am Groot”。

探秘迪士尼人形機器人:“樹人”格魯特表情生動,蜘蛛俠秀空中表演▲迎面走來的格魯特

Brooks Barnes沒有對格魯特的歡迎做出回應,它的神態頓時發生了變化,雙肩下垂,用一種可憐的眼神看著他。Brooks Barnes隨後對它說道:“別難過。”這時,格魯特再次露出了微笑,並向他跳了一段舞,甚至還表演了“金雞獨立”。

探秘迪士尼人形機器人:“樹人”格魯特表情生動,蜘蛛俠秀空中表演▲跳舞的格魯特

這可不是什麼CG特效,而是一個實打實的機器人。迪士尼幻想工程承諾的會走路、會說話、表情豐富的格魯特已經跳出屏幕走到了現實世界中。

“我們的電子動畫領域出現了一種新的趨勢,那就是更高的智能化水平。”幻想工程高級主管Jon Snoddy說道。他看著格魯特接著說道:“它代表了我們的未來。”

二、迪士尼發現自己落後於時代,欲創造更新穎體驗

從上世紀60年代起,機器人一直是迪士尼主題樂園的一部分,當時迪士尼推出了“音頻電子動畫(audio-animatronics)”,那是一系列被精心編排了動作的機械人物,比如在大海中四處劫掠的加勒比海盜和正在發表葛底斯堡演說(Gettysburg Address)的總統亞伯拉罕·林肯(Abraham Lincoln)。

這項技術大受歡迎,讓幾代兒童為之著迷,並幫助加利福尼亞的迪士尼樂園和佛羅里達的迪士尼世界成長為了一個龐大的企業。

迪士尼在全球的14個主題樂園在2019年吸引了1.56億遊客,迪士尼樂園和迪士尼的體驗和產品部門共創造了260億美元的收入。過去的一年中,新冠疫情的全球流行打斷了這一切,儘管現在遊客正在回歸,但迪士尼仍將面臨長期困境。

日常生活節奏的變快、技術的進步以及迅速變化的媒介格局正在重塑遊客對主題公園的需求。迪士尼知道,如果想繼續吸引全世界的家庭來迪士尼樂園度假,就必須設計出植根於技術的新一代壯觀景點。

自尼克鬆成為美國總統以來,迪士尼樂園的機械人物一直在循環做著同樣的事情。與此同時,技術在飛速發展,世界上的孩子們都已經成長為了技術愛好者,他們在各種應用程序、在線遊戲世界、甚至是增強現實遊戲中成長。顯然已經越來越多的對迪士尼樂園失去了興趣。

在這樣的情況下迪士尼該如何競爭?他們在上世紀的時候令人眼花繚亂,現在卻有些落後於時代了。

迪士尼樂園、體驗和產品部門主席Josh D’Amaro曾在4月份的以此活動中說:“我們考慮了很多,認為我們有義務為了我們的粉絲和客戶繼續發展,創造看起來更加新穎的體驗並將他們吸引過來。”同時他承認:“這些都是有風險的,人們可能更加喜歡原來的東西,但是我們會繼續努力,讓一切變得更好。”

探秘迪士尼人形機器人:“樹人”格魯特表情生動,蜘蛛俠秀空中表演▲正在開發中的機器人原型

三、機器人動作要連貫流暢,讓遊客沉浸於童話世界

長期以來,開發和改進新的電子動畫角色一直是迪士尼的重要組成部分。隨著電影製作技術的進步,比如計算機生成動畫,以及真人鏡頭與數字效果的混合等給迪士尼帶來了壓力,要求他們的機器人必須更加真實生動,以具有更高的說服力。

最近他們推出了可以與遊客交談的機器人角色,這些角色的動作極其優雅,以至於一些遊客誤以為它們是視頻投影。

迪士尼幻想工程機械工程師Kathryn Yancey說:“你知道冰雪奇緣中艾莎公主的動作是多麼優雅,孩子們一遍又一遍地觀看這部電影,甚至可能在來游樂園的路上還在看。因此我們的艾莎機器人的動作必須連貫流暢且真實,不能是笨手笨腳的。”

探秘迪士尼人形機器人:“樹人”格魯特表情生動,蜘蛛俠秀空中表演▲工作人員正在調試的艾莎公主

6月初,迪士尼的電子動畫技術實現了飛躍。迪士尼樂園的最新遊樂設施“蜘蛛俠冒險(WEB Slingers: Continue reading

Facebook推出能用“數字人”開會的VR會議軟件,加碼元宇宙建設

圖片

Facebook在上週四推出了一款名為Horizon Workrooms的新VR會議軟件,目前在公測階段。在這個數字空間中,Oculus Quest 2用戶可以用“數字人”分身進行線上會議。
扎克伯格將元宇宙其描述為“實體互聯網(embodied internet)”,此次發布的Workrooms將是未來元宇宙的前奏。Facebook幾年前就曾提出建立一個虛擬現實的元宇宙世界,並命名為Horizon。此次的Workrooms是Facebook為Oculus構建的Horizon項目的一部分。

图片

▲扎克伯格正在舉行VR會議

Facebook的Workrooms應用程序的Beta測試版在上一年已經投入使用,因為新冠疫情蔓延並且政府發布了居家辦公的行政命令,許多公司開始了在家工作的政策,並且這項政策逐漸成為正常的辦公形式之一。據扎克伯格稱,Facebook在內部使用Workrooms進行會議已有大約六個月的時間。
01
真正的同一空間VR會議
根據外媒報導,近日,在其首個完整的VR新聞發布會上,該公司展示了Workrooms用戶如何設計自己的“數字人”,如何在虛擬現實會議室見面,以及如何在共享白板或文檔上進行協作。並且,在進行VR會議的時候可以與自己的現實桌面和與虛擬桌面進行交互,實時共享電腦屏幕。

图片

▲Workrooms

這得益於Quest的手控系統和前置攝像頭,用戶的屏幕下方會有一個實體鍵盤的虛擬畫面,可以在Facebook為記筆記和管理日曆而設計的一個簡單的網絡應用程序中輸入信息。
該VR會議空間目前最多可以容納16人一起參與,另外34個人可以通過視頻通話的形式加入到會議當中。
據扎克伯格稱,Facebook在公司內部使用Workrooms進行會議已有大約六個月的時間。“在Workrooms中,你可以真正感受到與其他人存在同一空間,我認為這種互動方式比我們在手機或電腦上構建的平面社交更加豐富。”他說。
02
Facebook在VR、AR領域加碼
扎克伯格在上個月的採訪中表示,他希望Facebook在五年內能轉型成一個元宇宙公司,並表示有一天我們所有人都將在一個完全沉浸式的數字空間中度過大量時間。或者用扎克伯格的話來說,這是一個“實體互聯網(embodied internet)”。
這家全球最大的社交網絡企業,近年來在VR與AR領域動作頻頻,目前已經開發Oculus VR頭盔等硬件,也正在朝開發AR眼鏡和腕帶技術邁進,而且還收購了一大批虛擬現實遊戲工作室,包括BigBox VR。
Facebook認為取得VR與AR領域的主導地位,將使其未來減少對蘋果等其他硬件製造商的依賴,並且認為這會成為下一個大型計算平台(big computing plastform)。
Facebook現實實驗室副總裁Andrew Bosworth表示,新的Workrooms應用程序讓人“很好地了解(a good sense)”了該公司對元宇宙元素的設想。
03
結語:科技巨頭加碼元宇宙
Facebook新推出的Workrooms帶給了人們更具沉浸感的會議體驗,該軟件目前最多能夠容納16人同時以“數字人”身份登入。
目前各大科技巨頭都在加碼元宇宙,認為其在社交層面能夠帶給使用者更富的體驗。百度負責人在近期的世界大會VR分會場中提到,元宇宙離我們還比較遙遠,恐怕還有5到10年的距離,但是這也意味著,隨著科技的發展與大公司的不斷投入,元宇宙一定會有到來的一天。

鰻魚機器人登Science子刊封面,展示超強抗控制系統故障能力​

圖片

能游泳的機器人又有新突破,瑞士洛桑聯邦理工學院研究人員開發的鰻魚機器人登上Science Robotics封面。
該鰻魚機器人利用其各部分裝有的傳感器裝置,能在中央控制系統損壞情況下,從水中獲得傳感反饋信號來協調其運動,為研究人員開發更簡單、堅固的移動機器人開闢了一個新方向。

图片

該研究論文題目為《基於局部水動力傳感的魯棒自組織波動游動的出現(Emergence of robust self-organized undulatory swimming based on local hydrodynamic force sensing)》,於8月11日發表在Science Robotics上。
論文鏈接:
https://robotics.sciencemag.org/content/6/57/eabf6354
01
原有游泳機器人依靠中央系統控制
機器人學和生物學之間關係密切,既有研究人員參考生物體設計機器人的情況,也有研究人員使用複制了生物體傳感和控制系統的機器人,來幫助其了解生物體是如何完成一些運動的。
在設計、研究游泳機器人推進系統過程中,洛桑聯邦理工學院研究人員對鰻魚在水中感知周圍流體的能力產生了興趣,也就是鰻魚在水中游動時身體感受到的壓力狀況。
一些鰻魚類動物要完成波浪式起伏運動,需要靠其神經系統中的脊髓來控制,以及一組被稱為神經振盪器(neural oscillators)的神經元來產生相應的有節奏的肌肉活動。除中央神經系統外,動物身體上還會有一些外周神經系統,由感覺神經元組成,向中樞神經提供身體和環境狀態的信息。
因為在活體動物上進行實驗較難,為此研究人員設計了一種名為AgnathaX的機器人。

图片

▲AgnathaX在水中游動

該機器人是研究人員在一種名為AmphiBot的蛇形兩棲機器人基礎上,重新設計優化的。AmphiBot機器人也是洛桑聯邦理工學院研究人員設計,能在水中游動。

图片

▲AmphiBot機器人

AmphiBot機器人實現水下運動是靠中央模式生成器(central pattern generator,CPG)來實現。CPG是一種神經迴路(一種生物體模式)序列,會產生像鰻魚類動物運動時出現振盪節奏。
02
模塊化設計實現機器人水動力感應
AgnathaX機器人是由驅動關節連接的剛體節段組成,每一剛體節段都帶有獨立的電路(包括振盪器和耦合器)、左右對抗肌和一對側向力學傳感器。
該機器人的核心由10個伺服電機組成,配有一台Linux計算機、一個電池和一個被動尾部模塊。
研究人員組裝AgnathaX機器人時,先將機器人核心部件放入防水泳衣中;然後將力學傳感器模塊通過磁鐵從外部固定,這些模塊通過電氣連接(電力和通信)到相鄰的模塊,最後與機器人頭部相連;最後在每個模塊頂部安裝一個帶有嵌入式LED的、用於運動跟踪的浮動元件。
其中力學傳感器模塊由通信電路、帶有相應放大器的測壓元件和纖維板組成,可以實現機器人的水動力感應。

图片

▲AgnathaX機器人模型

03 Continue reading

谷歌安卓上新功能:用臉就能控製手機

圖片

據外媒報導,谷歌最近更新了其安卓無障礙(輔助功能)套件(Android 
有了這一功能,用戶可以用張嘴、微笑、揚眉、向左看、向右看和向上看這6種表情來操控手機,執行“選擇”、“下一步”、“返回”等十幾種操作。
開關訪問功能用於設置用戶操控手機的快捷方式,比如通過藍牙、USB連接,用戶可以設置無線耳機、外接鍵盤等設備如何操控手機,現在谷歌又增加一種“非接觸式”操控方式——用臉。

图片

用戶可以選擇使用“One Switch”或“Two Switchs”。
默認情況下,該功能會要求用戶設置代表“下一步”、“選擇”和“暫停”的表情。手動選擇“One Switch”後,用戶可以使用一個表情來開始自動掃描操作屏幕上的項目,自動移動高亮提示通過項目。用戶做出同樣表情來選擇屏幕上的項目,用戶還可以增加第二個表情來暫停攝像頭開關功能。

图片

選“Two Switchs”則可以設置更多表情。

图片

▲用戶可選擇一個表情代表“下一步”操作

六種面部動作可映射到十多種手機操作。用戶可以設置可被識別的面部表情幅度大小。

图片

除了“下一步”、“選擇”和“暫停”,可用面部表情動作完成的手機操作還包括“上一步”、“觸摸並按住”、“向前/向後滾動”、“回到主頁”、“返回”、“通知”、“快速設置和視圖/多任務處理”等。
當攝像頭開關功能激活時,屏幕上方中間會出現一個符號提示,告訴用戶攝像頭正在使用中。谷歌還在設置頁面增加了一項說明,提示使用該功能會使用額外的電池電量。

图片

谷歌還指出所有這些處理過程都是在用戶設備上完成的,人臉圖像不會被發送給谷歌。
根據外媒XDA Portal & Forums的報導,該功能並非Android 12手機獨有,通過加載安裝包可能可以在Android 11手機上使用。
不過,目前用表情控製手機的功能僅適用於谷歌的Pixel手機。
結語:隔空操作設備方式逐漸多元
通過聲音控制設備是相對常見的一種隔空控制方法,人們通過一些智能語音助手,就可以實現文件搜索、開關智能家居產品。
之前還有一些通過隔空識別人類動作來完成任務的應用,如英國沃達丰公司製作的開源應用EVA Facial Mouse通過點頭、搖頭等晃動頭部的動作,來隔空操控手機。
來源:9to5Google、Engadget、XDA Portal & Forums

美國官方曝網絡攝像頭大漏洞超8300 萬台設備受影響

本週二,美國聯邦網絡安全和基礎設施安全局 (CISA) 公佈了一個影響數以千萬計的物聯網設備的嚴重漏洞,攻擊者不僅能夠通過該漏洞看到安全網絡攝像頭等設備拍攝的實時視頻,還能利用該漏洞控制這些設備。

美國網絡安全公司Mandiant 在2020 年末發現了這一漏洞。該公司稱,這一漏洞影響了超過8300 萬台網絡設備,不過他們無法確定受到漏洞影響的產品和公司的完整名單。

一、SDK 出漏洞,8300 萬台智能設備受影響

一個漏洞潛伏在包括網絡攝像頭等多種智能設備中,可能會使攻擊者通過互聯網訪問其實時視頻和音頻流,甚至遠程獲得該設備的完全控制權。更糟糕的是,這個漏洞不僅限於單個製造商,它出現在一個軟件開發工具包(SDK) 中,這個工具包滲透到超過8300 萬台設備之中,每個月都產生超十億次互聯網連接。

有問題的SDK 是ThroughTek Kalay, 它提供了一個即插即用的系統,用於將智能設備與其相應的移動應用程序連接起來。Kalay 平台為智能設備和其相應的應用程序提供代理,可以處理身份驗證,並來回發送數據和命令。

▲ Kalay 工作原理示意圖

美國網絡安全公司Mandiant 的研究人員在2020 年底發現了這個漏洞,並於本週二與CISA 一起公開披露了這個漏洞。

Mandiant 的主管Jake Valletta 說:“Kalay 為這些智能設備提供必要的連接和相應的功能,然而攻擊者可以隨意連接到這些設備,檢索音頻和視頻,然後使用遠程API 執行注入觸發固件更新、更改相機角度或重啟設備等操作,並且用戶還不會知道發生了什麼問題。”

二、攻擊者可獲取用戶賬號密碼,用戶無法重置設備擺脫入侵

該漏洞存在於設備與其移動應用程序之間的註冊程序中。研究人員發現,這種設備與應用程序的連接取決於每個設備的UID, 這是一個唯一的Kalay 標識符。據Valletta 所說,攻擊者可以很容易的從製造商的其他網絡漏洞中獲取到這些UID。

擁有設備UID 並對Kalay Continue reading

騙過人臉識別系統?AI造出9張“萬能人臉”,可冒充超40%的人

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

近日,以色列特拉維夫大學研究人員證明了一種創建“萬能人臉(master face)”的方法。

研究人員通過圖像生成系統StyleGAN先生成假的人臉圖像,然後通過算法和分類器對比篩選出與真實人臉相似度最高的圖像,最終獲得9張“萬能人臉”圖像。

這種計算機生成的“萬能人臉”作用就像萬能鑰匙一樣,可以模仿多個身份,通過基於人臉識別的身份驗證。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

該研究論文題目為《利用網絡輔助的潛在空間演化生成字典攻擊的萬能人臉(Generating Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution)》,已提交至論文預印本發布平台arXiv上。

論文鏈接:

https://arxiv.org/pdf/2108.01077.pdf

一、萬能指紋技術帶來靈感

由於其方便性,生物識別認證,特別是人臉識別認證,已日益成為主流,因此現在成為攻擊者的主要目標。

攻擊一般的計算機認證系統時,有破解者會採取字典式攻擊,通過連續嘗試多個輸入來嘗試通過認證系統。

而在現實世界的生物識別系統中,人們通常只能嘗試幾次輸入,然後系統就會鎖定。並且使用生物統計學進行的匹配並不精確,加之生物學統計數據的空間分佈不均勻,這表明可能少量樣本可以覆蓋更大的人口比例。

特拉維夫大學研究人員從“萬能指紋”研究中獲得了靈感,他們開發了一種“萬能人臉”,來繞過人臉識別軟件。

二、通過算法分類對比,選出9張“萬能人臉”

研究人員首先使用人工智能領域廣泛使用的生成模型StyleGAN,來進行“萬能人臉”的製作。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

▲“萬能人臉”訓練過程

然後研究人員然後使用算法和神經網絡來優化。有限內存矩陣自適應進化策略(LM-MA-ES)算法是非常適合高維黑匣子優化的,但是還需要增加一個組件,來推斷哪些人臉是交叉身份認證的最佳候選選項。

所以,研究人員創建了一個“成功預測器(Success Predictor)”神經分類器,將大量候選人臉圖像篩選出合適、可完成繞過人臉識別軟件任務的人臉圖像。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

▲“成功預測器”神經分類器原理

研究人員使用算法和分類器將每一個系統輸出的虛假人臉都與Labeled Faces in the Wild(LFW)數據庫中5749個不同人的真實照片進行比較,並給出平均集覆蓋率(Mean Set Coverage,MSC)分數,只保留分數高的虛假人臉圖像。

其中對圖像比較得到的分數會用於訓練進化算法,幫助研究人員使用StyleGAN,創建出越來越多看起來像數據集中真實存在的人臉圖像。最終得到9張“萬能人臉”圖像。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

▲九張“萬能人臉” Continue reading

工業機器人發展全球前十的丹麥,失業率為何僅為3.7%?

本文整理自《利益相關者》 

作者:[德]克勞斯•施瓦布等著 

曾有一篇新聞報導的標題非常引人注目:“丹麥在機器人領域躋身世界前十。”

這篇新聞報導的出處來源於丹麥金屬行業工人工會,該工會所代表的是丹麥金屬製造與加工行業的藍領工人。很顯然,工會對於這項成就頗為自豪。
“在這個行業,越來越多的工人和機器人並肩作戰。”這篇新聞報導中寫道,“丹麥金屬行業工人工會的目標是,到2020年,使丹麥的工業機器人數量達到1萬台左右。”

我通過實地走訪和閱讀資料發現,無論在世界上的其他地方,還是歷史上的其他時期,更多的情況是工人會抵制新技術,尤其當新技術對他們的就業產生威脅時。

在這個自動化時代,我同樣為勞動者的就業前景感到擔憂。早在2015年時,我意識到我們即將迎來一個嶄新的時代——一個擁有人工智能、先進的機器人技術以及信息物理融合系統的嶄新時代,這些先進技術共同構成了第四次工業革命。我們還目睹了其他很多新技術的誕生,包括3D打印、量子計算、精密醫療等。我逐漸認識到,這些新技術就相當於第一次工業革命中的蒸汽機、第二次工業革命中的內燃機和電力、第三次工業革命中的信息技術和計算機技術。它們將擾亂勞動力市場,改變我們的工作性質,同時也會改變我們的身份。

但是,來自丹麥的那則新聞報導似乎表明,這種恐懼可以被克服,這些高新技術未必會取代工人,說不定還能起到幫助作用。這怎麼可能呢?

圖片

“我們應該擔心的是’舊’技術”

丹麥金屬行業工人工會主席克勞斯•延森首先為我們提供了一個具有說服力的論據。“你聽說過有國家或公司是利用’舊’技術致富的嗎?他認為這絕不可能。他也不認同某些人對未來就業形勢的悲觀看法。“或許奇點大學的那些人會認為所有人都將被技術取代,”他說,“或許他們認為所有人都將茫然而不知所措,只能眼睜睜地看著機器人做著一切。無論是基於他的個人經驗,還是基於過去150年裡該工會的歷任主席們的經驗,這種看法都是不對的。“過去,我們每次將新技術引進丹麥,”他說,“都會創造出更多的就業崗位。“我們不應該對’新’技術感到恐懼,”他說,“我們應該擔心的是’舊’技術。

丹麥金屬行業工人工會首席經濟學家托馬斯•斯瑟比談到:“人們從不擔心失業問題,因為他們有接受再培訓的機會。我們有一套行之有效的製度體系。如果你失業了,我們工會的人會在一兩天內給你發電子郵件或打電話。我們會安排一次會面,談談你的具體情況,看看你是否需要提高技能,以及附近是否有公司在招聘。在幫助工會成員再就業方面,無論是立刻找下一份工作還是經過再培訓後再找工作,我們一直做得很成功。我們在全國各地建立了很多學校,課程安排由雇主和員工決定。開設這些學校就是為了讓勞動力接受再培訓和再教育。”

員工與企業之間這種具有建設性的、相互信任的關係,正在給丹麥帶來回報。儘管丹麥早已不再是“世界造船工廠”——這一地位被韓國、日本、中國和土耳其的大型企業取代,但它仍在為穿梭於世界各地的新式及老式輪船製造發動機。

雖然因為員工工資高失去了成本優勢,但它從員工的高生產力以及積極的工作態度中得到了補償。在2020年初遭到新冠肺炎疫情衝擊之前,丹麥的失業率僅為3.7%,僅就金屬行業工人工會而言,失業率甚至低至2%。或許更重要的是,丹麥的工資水平較高且相對平等。

據斯瑟比所言,丹麥金屬行業工人工會的成員一年能賺到60000~70000美元,每週工作時長不超過40個小時,工會參與率為80%左右。總的來說,丹麥在收入方面是世界上最平等的國家之一,儘管近幾年不平等的趨勢有所抬頭。

丹麥的故事之所以更加引人矚目,是因為它與其他工業化國家形成鮮明對比。

失業率上升與再培訓機會缺失

最讓斯瑟比感到震驚的國家是美國。

美國在前兩次工業革命中都處於主導地位。在“偉大社會”的願景下,那裡曾是一個藍領工人也能實現“美國夢”的國度。但如今,美國不再是工人階層的聖地——至少在斯瑟比看來不是。當然,製造業的衰退和服務業的興起是全球大趨勢。這一趨勢持續了數十年,對整個工業化世界都產生了影響。但美國製造業工人的失業速度異常之快。

據《金融時報》統計,1990—2016年,美國製造業減少了近560萬個工作崗位。所有工業化城市的就業數量都大幅削減。一些完全依賴一家工業企業提供就業崗位的城市遭受的打擊尤為嚴重。儘管其中一些崗位並未消失,只是被轉移到了中國或墨西哥,但的確有一半的崗位被先進的自動化技術徹底取代。相對沒那麼糟糕的情況是,低工資的服務崗位取代了高工資的藍領崗位。最糟糕的情況是,壓根兒就沒有新崗位可提供給工人,至少沒有新崗位可提供給不具備大學學歷的工人。在某些行業,經通貨膨脹調整後的工資自1980年以來幾乎沒有上漲過。

此外,儘管在新冠肺炎疫情暴發以前,美國官方公佈的失業人數一直很少,但其勞動力參與率從2000年超過67%的歷史高位,下降至2020年的62%左右,這意味著很多人已經徹底放棄找工作。相比之下,丹麥的勞動力參與率始終保持在70%左右,甚至在2020年初遭到疫情衝擊後,依然保持著這一水平。

為什麼會發生這種情況呢?“美國經濟存在的一個重要問題是,”斯瑟比說,“缺乏對勞動力的教育。”不同於丹麥,美國沒有一個涵蓋範圍廣泛的工人培訓制度。這一問題在經合組織的數據中體現得很明顯。在經濟合作與發展組織成員中,丹麥在所謂的“積極的勞動力市場政策”方面的人均支出最多,該政策旨在幫助失業者重返勞動力市場。相對而言,美國的這一支出只有丹麥的1/15。此外,丹麥的製度還更加包容且更具彈性。最重要的是,在所有經合組織成員中,丹麥的製度最能適應勞動力市場需求,而美國在32個研究對像中僅排第19名。

這導緻美國勞動力市場長期存在供需不匹配的情況。據《華盛頓郵報》財經記者希瑟•朗所言,即使現在美國為勞動者提供再培訓機會,勞動者也往往沒有意願報名參加,因為他們擔心就算參加培訓也找不到工作;或者只是報名學習一些最基礎的IT課程,比如如何使用微軟的辦公軟件。

托馬斯•斯瑟比認為:“我理解工人為什麼會對新技術和機器人有抵觸情緒。因為他們一旦失業,就很難再找到工作。他們所掌握的技能只適用於特定的公司。如果沒有一套再教育或提陞技能的培訓制度,工人就會怨聲載道。這個問題很難解決,而且他們試圖解決這個問題的方法不對。他們需要做的是完善教育、發展工會”。除了斯瑟比之外,在大西洋彼岸的華盛頓特區,以約瑟夫•斯蒂格利茨為代表的經濟學家和以美國經濟政策研究所為代表的智庫也提倡這一措施。

通過對比丹麥和美國這兩個案例可以發現,工業化國家最好還是重新採納以利益相關者為出發點的解決方案,並擴大對公共教育的投資。

以利益相關者為出發點,直面技術衝擊

視線轉回亞洲,以利益相關者為出發點的解決方案在亞洲同樣有效,以新加坡為例。

20世紀60年代,作為“亞洲四小龍”之一的新加坡,經濟開始迅猛發展。在早期階段,新加坡把重心放在勞動密集型製造業上,將其視為經濟增長的重要支柱,並且大獲成功。很多日本公司和其他跨國公司為了尋找廉價的製造業中心而進駐新加坡,使許多新加坡人獲得了體面的藍領工作,促進了該國經濟迅速發展。但隨著中國等亞洲新興經濟體緊隨其後發展起來,新加坡想要發展更加以服務和知識為導向的經濟,向價值鏈上游進軍,實現向發達國家之位的躍升。為此,新加坡早在20世紀80年代就已經需要對工人進行再培訓。

儘管新加坡已是過去半個世紀中經濟發展最突出的國家之一,但這個東南亞國家明白,在當今的全球化經濟中,新技術和服務業崗位變得比以往更加重要,國家需要不斷調整以適應變化。這也是新加坡政府牽頭設立“技能創前程”計劃的原因所在。通過這一終身學習體系,任何年齡段的新加坡人都能學習新技能,為進入第四次工業革命中的就業市場做好準備。

在我們觀察新加坡模式時,還有一個重要特點值得一提。這一模式的成功離不開三個利益相關者:政府、企業以及工會。

自1965年起,這個“鐵三角”組合在所有的勞動力市場和產業政策決策中都發揮了重要作用,而且沒有對經濟活動造成重大干擾。儘管新加坡的勞動力市場流動性很大(僱用和解僱都相對容易),經濟發展至少經歷過兩次成功的轉型——一次是20世紀六七十年代向製造業轉型,另一次是20世紀八九十年代向服務業轉型,但罷工在這個國家極其罕見。

《日經亞洲評論》最近的報導稱,這種極具建設性的積極態度在未來仍然很重要,因為“在東南亞,技術的顛覆性影響將會給新加坡帶來前所未有的高失業率”。但有跡象表明,這波即將到來的技術衝擊不會摧毀新加坡的社會和經濟。普華永道會計師事務所的一項調查發現,“超過90%的新加坡受訪者表示,他們會抓住老闆提供的任何機會來掌握或使用新技術”。

這表明,像美國和西歐國家這樣的經濟體面臨著三重挑戰:政府和企業必須在員工持續性再培訓方面加大投資;工會必鬚髮展壯大,同時與企業和政府進行合作;工人自身也應當保持積極、靈活應變,不懼自己及國家將要面臨的經濟挑戰。

展望未來,我們應該記住,技術本身沒有完全的好壞之分,一切都取決於我們如何使用它。從政府到企業,再到整個社會,每一個利益相關者都負有各自的責任。事實上,即使企業家的出發點是好的,其公司的影響最終也有可能弊大於利。而且,儘管在自由市場上運營的創新型企業是經濟發展的強大引擎,但也離不開同樣富有創新力且強大的政府這個最佳聯盟——政府會始終把社會的最大利益放在首位。

歸根結底,對於創新及其推動者,我們除了擁抱和接受以外別無選擇。但是,對於那些曾經名不見經傳但富有創新精神的企業家,我們應當給予更多鼓勵,使其保持初心,避免膨脹成為壟斷者。技術只有在被廣泛共享時,才能發揮出最大的潛能。在人工智能時代,這一點將比以往任何時候都更加重要。

跟福爾摩斯搶活干!AI“讀圖會意”技能首超人類,刷新VQA挑戰記錄

圖片

從下面這張圖,你能立即猜出用電腦工作的這個人是否有車、有沒有結婚嗎?

图片

AI可以迅速鎖定胳膊下壓著的車鑰匙和左手無名指上的戒指,由此推斷出可能的答案:有車、已婚。
除了秒辨圖片裡有哪些內容外,AI已經開始挑戰更高階的“學霸”行為,即在看圖和理解問題後,立即給出對應的關聯信息。
這一高階任務屬於機器視覺問答(Visual Question Answering)領域。過去數年間,AI一直在挑戰新的能力巔峰:2015年在視覺分類任務上超越人類成績,2016年擊敗世界人類頂尖棋手,2018年文本閱讀理解能力超人類基準……
如今,就在本週,AI終於在視覺問答VQA這一高階任務上,取得了超越人類水平的最新突破。
在國際權威機器視覺問答榜單VQA Leaderboard上,阿里巴巴達摩院深度語言模型體系AliceMind以81.26%的準確率創造了新紀錄,讓AI在“讀圖會意”上首次超越人類基準線80.83%。第一位得分超越人類的AI選手誕生了。

图片

▲達摩院AliceMind在VQA Leaderboard上創造首次超越人類的紀錄

01
VQA考卷有多難?
堪稱“變態”的偵探級推理
什麼是視覺問答(VQA)?簡單來說,給AI一張照片,AI不僅能用文字回答圖片裡有什麼,還能通過推理回答出更多增量信息。
比如,下面這張圖中,你能看見暖黃的燈光下,一個戴著眼鏡的男子正枕在白色枕頭上張嘴酣睡,他的左手側,一隻漂亮的貓咪正凝視著你。

图片

那麼問題來了,這隻貓是什麼品種?
AI能做到秒答:暹羅貓。
看圖問答只是基本操作,AI的視覺問答能力範疇還包括:看見車胎就能回答其汽車品牌,看見一隻熊就知道它的品種,看見士兵玩具和戰斗場景就知道它出自星球大戰電影……

图片

VQA,這個將計算機視覺與自然語言技術交融的多模態領域前沿研究方向,對研發通用人工智能有重要意義。
但要讓AI具備像偵探一樣細緻的觀察能力、像百科全書一樣全面的知識儲備,可不是容易的事。
為了攻克這一難題,全球計算機視覺頂會CVPR從2015年起連續6年舉辦VQA挑戰賽,形成了國際上規模最大、認可度最高的VQA數據集,其包含超20萬張真實照片、110萬道考題。
在測試中,AI需根據給定圖片及自然語言問題,生成正確的自然語言回答。

图片

說起來簡單,但要取得漂亮的成績,AI不僅要修煉好圖像識別、文本識別、文本理解等基本功,還要解鎖計數、讀鐘錶、推理認知等附加技能。
基於此,AI首先獲知所有圖像信息,再結合對文本問題的理解,學習圖文的關聯性、精准定位相關圖像信息,最後根據常識及推理回答問題。
當然,擁有百科全書的豐富常識,是能做到秒答問題的前情提要。
VQA考題有多難呢?舉個例子,下圖中的這些玩具是用來做什麼的?

图片

人類尚需通過觀察和思考才能給出答案,而AI在檢索圖片後,根據小熊玩具上的禮服裝飾,推斷出一個可能的答案:婚禮。
微軟、Facebook、斯坦福大學、阿里巴巴、百度等眾多全球頂尖機構均在參與VQA挑戰賽。

图片

▲自2015年以來VQA技術的進展

今年6月,阿里達摩院在VQA 2021 Challenge的55支提交隊伍中奪冠,成績領先第二名約1個百分點、去年冠軍3.4個百分點。
兩個月後,就在本週,達摩院再次以81.26%的準確率創造VQA Leaderboard全球紀錄,首次超越人類基準線80.83%。
這意味著,在封閉數據集內,AI的VQA表現已經媲美人類水準,向認知智能邁進關鍵一步。
在更開放的現實世界,AI雖然面臨著更多挑戰,但已經有相當方便的應用,正改變人們的生活。
02
從生活Tip到電商問答 Continue reading

跟福爾摩斯搶活干!AI“讀圖會意”技能首超人類,刷新VQA挑戰記錄

圖片

AI的“讀圖會意”能力首超人類基準線。
作者 |  心緣
編輯 |  漠影
從下面這張圖,你能立即猜出用電腦工作的這個人是否有車、有沒有結婚嗎?

图片

AI可以迅速鎖定胳膊下壓著的車鑰匙和左手無名指上的戒指,由此推斷出可能的答案:有車、已婚。
除了秒辨圖片裡有哪些內容外,AI已經開始挑戰更高階的“學霸”行為,即在看圖和理解問題後,立即給出對應的關聯信息。
這一高階任務屬於機器視覺問答(Visual Question Answering)領域。過去數年間,AI一直在挑戰新的能力巔峰:2015年在視覺分類任務上超越人類成績,2016年擊敗世界人類頂尖棋手,2018年文本閱讀理解能力超人類基準……
如今,就在本週,AI終於在視覺問答VQA這一高階任務上,取得了超越人類水平的最新突破。
在國際權威機器視覺問答榜單VQA Leaderboard上,阿里巴巴達摩院深度語言模型體系AliceMind以81.26%的準確率創造了新紀錄,讓AI在“讀圖會意”上首次超越人類基準線80.83%。第一位得分超越人類的AI選手誕生了。

图片

▲達摩院AliceMind在VQA Leaderboard上創造首次超越人類的紀錄

01
VQA考卷有多難?
堪稱“變態”的偵探級推理
什麼是視覺問答(VQA)?簡單來說,給AI一張照片,AI不僅能用文字回答圖片裡有什麼,還能通過推理回答出更多增量信息。
比如,下面這張圖中,你能看見暖黃的燈光下,一個戴著眼鏡的男子正枕在白色枕頭上張嘴酣睡,他的左手側,一隻漂亮的貓咪正凝視著你。

图片

那麼問題來了,這隻貓是什麼品種?
AI能做到秒答:暹羅貓。
看圖問答只是基本操作,AI的視覺問答能力範疇還包括:看見車胎就能回答其汽車品牌,看見一隻熊就知道它的品種,看見士兵玩具和戰斗場景就知道它出自星球大戰電影……

图片

VQA,這個將計算機視覺與自然語言技術交融的多模態領域前沿研究方向,對研發通用人工智能有重要意義。
但要讓AI具備像偵探一樣細緻的觀察能力、像百科全書一樣全面的知識儲備,可不是容易的事。
為了攻克這一難題,全球計算機視覺頂會CVPR從2015年起連續6年舉辦VQA挑戰賽,形成了國際上規模最大、認可度最高的VQA數據集,其包含超20萬張真實照片、110萬道考題。
在測試中,AI需根據給定圖片及自然語言問題,生成正確的自然語言回答。

图片

說起來簡單,但要取得漂亮的成績,AI不僅要修煉好圖像識別、文本識別、文本理解等基本功,還要解鎖計數、讀鐘錶、推理認知等附加技能。
基於此,AI首先獲知所有圖像信息,再結合對文本問題的理解,學習圖文的關聯性、精准定位相關圖像信息,最後根據常識及推理回答問題。
當然,擁有百科全書的豐富常識,是能做到秒答問題的前情提要。
VQA考題有多難呢?舉個例子,下圖中的這些玩具是用來做什麼的? Continue reading

模擬變色龍,軟體機器人也能實時根據背景變色!依賴溫度實現,研究登上Nature子刊

 

圖片

動物永遠是人類的創新靈感來源。

有科學家從蜻蜓大腦中看到了未來導彈防禦的高效應用,有科學家從蝙蝠超聲波中受到啟發,研發出了新的掃描系統,用來檢測輸油管道的腐蝕情況……

現在,科學家們對世界最可愛物種之一的變色龍“下手”了。

我們知道,“變色龍”這一名字的由來和它們能跟隨環境變化隨時改變身體的顏色有關,這樣的功能能如何被利用呢?

8月10日,韓國首爾國立大學和漢陽大學的研究人員在Nature Communications期刊發表了題為Biomimetic chameleon soft robot with artificial crypsis and disruptive coloration skin的研究論文。

論文中寫到,研究人員以變色龍為靈感開發了一個軟體機器人,該機器人能根據背景實時變色,就像這樣:

图片
图片

從上圖可以看到,變色龍機器人在不同顏色的條紋背景上行走,能夠實時改變自己身上的顏色。

對於這項技術,研究人員表示,這項研究或對下一代可穿戴偽裝技術具有啟示意義。

图片

論文鏈接:

https://www.nature.com/articles/s41467-021-24916-w
讓機器人擁有變色龍的“超能力”

根據目前科學界的普遍看法,變色龍的變色能力和它們皮膚表層的微小晶體有直接的關係,通常來說,它們只需要利用肌肉來實現擴張和收縮即可。

要將這項生物技能複製成一項科學技術,卻沒有想像中簡單。

此前,這種人造裝置通常需要依賴於微流體裝置,即使用微小的通道來控制內部流體的流動。

但該項目卻另闢蹊徑,根據研究人員的說法,他們,主要使用了一種可根據溫度改變顏色的薄液晶層。

研究人員在晶體層下方堆疊了幾層納米線加熱器(nanowire heaters)。納米線層包含不同的圖案,從點到網格,選擇性加熱層會創建彩色圖案,幫助機器人更好地模仿其周圍環境。

機器人內置的顏色傳感器和反饋系統會檢測局部背景顏色,然後轉換其皮膚的顏色以匹配。

图片

該研究的作者之一、首爾國立大學熱工程學教授 使用加熱速度非常快的納米線加熱器幫助解決了這個問題:人造皮膚升溫得足夠快,以與真實動物相似的速度改變顏色。

“構建第一個原型的過程是非常緩慢的。”Hwan Ko說。

首先他們需要確定機器人是模仿脊椎動物還是無脊椎動物,比如魷魚或章魚。在最初的構想中,由於無脊椎動物模型能有更多的活動自由,團隊計劃模仿章魚,但最終證明這個想法是過於美好了。

在對不同的設計和材料結構進行細緻研究後,該團隊最終決定以變色龍為基礎,以更簡單的方式複制這項生物技能。通過將納米線塑造成由點、線或鱗片形狀組成的簡單圖案,他們創造出瞭如今的效果。

图片

目前,這款變色龍機器人長約38厘米,寬約15厘米,重約0.9公斤,與動物相似,但和最初設計的尺寸還存在差異,研究人員希望能夠縮小規模。

此外,由於該技術依賴於溫度,在極冷的情況下變色效果不盡如人意,這樣變色龍機器人難以實現對全光譜顏色的複制。隨著信號處理和數據驅動科學的進步,團隊表示,這一局限將會得到彌補,同時,變色龍機器人還會以更高的分辨率反射背景表面的紋理。 Continue reading

聯絡我們

地址
香港九龍觀塘鴻圖道57號南洋廣場1808室
Rm.1808, Nanyang Plaza, 57 Hung To Road., Kln. HK

電話
23091888

電郵
info@iothk.net