騙過人臉識別系統?AI造出9張“萬能人臉”,可冒充超40%的人

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

近日,以色列特拉維夫大學研究人員證明了一種創建“萬能人臉(master face)”的方法。

研究人員通過圖像生成系統StyleGAN先生成假的人臉圖像,然後通過算法和分類器對比篩選出與真實人臉相似度最高的圖像,最終獲得9張“萬能人臉”圖像。

這種計算機生成的“萬能人臉”作用就像萬能鑰匙一樣,可以模仿多個身份,通過基於人臉識別的身份驗證。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

該研究論文題目為《利用網絡輔助的潛在空間演化生成字典攻擊的萬能人臉(Generating Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution)》,已提交至論文預印本發布平台arXiv上。

論文鏈接:

https://arxiv.org/pdf/2108.01077.pdf

一、萬能指紋技術帶來靈感

由於其方便性,生物識別認證,特別是人臉識別認證,已日益成為主流,因此現在成為攻擊者的主要目標。

攻擊一般的計算機認證系統時,有破解者會採取字典式攻擊,通過連續嘗試多個輸入來嘗試通過認證系統。

而在現實世界的生物識別系統中,人們通常只能嘗試幾次輸入,然後系統就會鎖定。並且使用生物統計學進行的匹配並不精確,加之生物學統計數據的空間分佈不均勻,這表明可能少量樣本可以覆蓋更大的人口比例。

特拉維夫大學研究人員從“萬能指紋”研究中獲得了靈感,他們開發了一種“萬能人臉”,來繞過人臉識別軟件。

二、通過算法分類對比,選出9張“萬能人臉”

研究人員首先使用人工智能領域廣泛使用的生成模型StyleGAN,來進行“萬能人臉”的製作。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

▲“萬能人臉”訓練過程

然後研究人員然後使用算法和神經網絡來優化。有限內存矩陣自適應進化策略(LM-MA-ES)算法是非常適合高維黑匣子優化的,但是還需要增加一個組件,來推斷哪些人臉是交叉身份認證的最佳候選選項。

所以,研究人員創建了一個“成功預測器(Success Predictor)”神經分類器,將大量候選人臉圖像篩選出合適、可完成繞過人臉識別軟件任務的人臉圖像。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

▲“成功預測器”神經分類器原理

研究人員使用算法和分類器將每一個系統輸出的虛假人臉都與Labeled Faces in the Wild(LFW)數據庫中5749個不同人的真實照片進行比較,並給出平均集覆蓋率(Mean Set Coverage,MSC)分數,只保留分數高的虛假人臉圖像。

其中對圖像比較得到的分數會用於訓練進化算法,幫助研究人員使用StyleGAN,創建出越來越多看起來像數據集中真實存在的人臉圖像。最終得到9張“萬能人臉”圖像。

騙過人臉識別系統? AI造出9張“萬能人臉”,可冒充超40%的人

▲九張“萬能人臉” Continue reading

工業機器人發展全球前十的丹麥,失業率為何僅為3.7%?

本文整理自《利益相關者》 

作者:[德]克勞斯•施瓦布等著 

曾有一篇新聞報導的標題非常引人注目:“丹麥在機器人領域躋身世界前十。”

這篇新聞報導的出處來源於丹麥金屬行業工人工會,該工會所代表的是丹麥金屬製造與加工行業的藍領工人。很顯然,工會對於這項成就頗為自豪。
“在這個行業,越來越多的工人和機器人並肩作戰。”這篇新聞報導中寫道,“丹麥金屬行業工人工會的目標是,到2020年,使丹麥的工業機器人數量達到1萬台左右。”

我通過實地走訪和閱讀資料發現,無論在世界上的其他地方,還是歷史上的其他時期,更多的情況是工人會抵制新技術,尤其當新技術對他們的就業產生威脅時。

在這個自動化時代,我同樣為勞動者的就業前景感到擔憂。早在2015年時,我意識到我們即將迎來一個嶄新的時代——一個擁有人工智能、先進的機器人技術以及信息物理融合系統的嶄新時代,這些先進技術共同構成了第四次工業革命。我們還目睹了其他很多新技術的誕生,包括3D打印、量子計算、精密醫療等。我逐漸認識到,這些新技術就相當於第一次工業革命中的蒸汽機、第二次工業革命中的內燃機和電力、第三次工業革命中的信息技術和計算機技術。它們將擾亂勞動力市場,改變我們的工作性質,同時也會改變我們的身份。

但是,來自丹麥的那則新聞報導似乎表明,這種恐懼可以被克服,這些高新技術未必會取代工人,說不定還能起到幫助作用。這怎麼可能呢?

圖片

“我們應該擔心的是’舊’技術”

丹麥金屬行業工人工會主席克勞斯•延森首先為我們提供了一個具有說服力的論據。“你聽說過有國家或公司是利用’舊’技術致富的嗎?他認為這絕不可能。他也不認同某些人對未來就業形勢的悲觀看法。“或許奇點大學的那些人會認為所有人都將被技術取代,”他說,“或許他們認為所有人都將茫然而不知所措,只能眼睜睜地看著機器人做著一切。無論是基於他的個人經驗,還是基於過去150年裡該工會的歷任主席們的經驗,這種看法都是不對的。“過去,我們每次將新技術引進丹麥,”他說,“都會創造出更多的就業崗位。“我們不應該對’新’技術感到恐懼,”他說,“我們應該擔心的是’舊’技術。

丹麥金屬行業工人工會首席經濟學家托馬斯•斯瑟比談到:“人們從不擔心失業問題,因為他們有接受再培訓的機會。我們有一套行之有效的製度體系。如果你失業了,我們工會的人會在一兩天內給你發電子郵件或打電話。我們會安排一次會面,談談你的具體情況,看看你是否需要提高技能,以及附近是否有公司在招聘。在幫助工會成員再就業方面,無論是立刻找下一份工作還是經過再培訓後再找工作,我們一直做得很成功。我們在全國各地建立了很多學校,課程安排由雇主和員工決定。開設這些學校就是為了讓勞動力接受再培訓和再教育。”

員工與企業之間這種具有建設性的、相互信任的關係,正在給丹麥帶來回報。儘管丹麥早已不再是“世界造船工廠”——這一地位被韓國、日本、中國和土耳其的大型企業取代,但它仍在為穿梭於世界各地的新式及老式輪船製造發動機。

雖然因為員工工資高失去了成本優勢,但它從員工的高生產力以及積極的工作態度中得到了補償。在2020年初遭到新冠肺炎疫情衝擊之前,丹麥的失業率僅為3.7%,僅就金屬行業工人工會而言,失業率甚至低至2%。或許更重要的是,丹麥的工資水平較高且相對平等。

據斯瑟比所言,丹麥金屬行業工人工會的成員一年能賺到60000~70000美元,每週工作時長不超過40個小時,工會參與率為80%左右。總的來說,丹麥在收入方面是世界上最平等的國家之一,儘管近幾年不平等的趨勢有所抬頭。

丹麥的故事之所以更加引人矚目,是因為它與其他工業化國家形成鮮明對比。

失業率上升與再培訓機會缺失

最讓斯瑟比感到震驚的國家是美國。

美國在前兩次工業革命中都處於主導地位。在“偉大社會”的願景下,那裡曾是一個藍領工人也能實現“美國夢”的國度。但如今,美國不再是工人階層的聖地——至少在斯瑟比看來不是。當然,製造業的衰退和服務業的興起是全球大趨勢。這一趨勢持續了數十年,對整個工業化世界都產生了影響。但美國製造業工人的失業速度異常之快。

據《金融時報》統計,1990—2016年,美國製造業減少了近560萬個工作崗位。所有工業化城市的就業數量都大幅削減。一些完全依賴一家工業企業提供就業崗位的城市遭受的打擊尤為嚴重。儘管其中一些崗位並未消失,只是被轉移到了中國或墨西哥,但的確有一半的崗位被先進的自動化技術徹底取代。相對沒那麼糟糕的情況是,低工資的服務崗位取代了高工資的藍領崗位。最糟糕的情況是,壓根兒就沒有新崗位可提供給工人,至少沒有新崗位可提供給不具備大學學歷的工人。在某些行業,經通貨膨脹調整後的工資自1980年以來幾乎沒有上漲過。

此外,儘管在新冠肺炎疫情暴發以前,美國官方公佈的失業人數一直很少,但其勞動力參與率從2000年超過67%的歷史高位,下降至2020年的62%左右,這意味著很多人已經徹底放棄找工作。相比之下,丹麥的勞動力參與率始終保持在70%左右,甚至在2020年初遭到疫情衝擊後,依然保持著這一水平。

為什麼會發生這種情況呢?“美國經濟存在的一個重要問題是,”斯瑟比說,“缺乏對勞動力的教育。”不同於丹麥,美國沒有一個涵蓋範圍廣泛的工人培訓制度。這一問題在經合組織的數據中體現得很明顯。在經濟合作與發展組織成員中,丹麥在所謂的“積極的勞動力市場政策”方面的人均支出最多,該政策旨在幫助失業者重返勞動力市場。相對而言,美國的這一支出只有丹麥的1/15。此外,丹麥的製度還更加包容且更具彈性。最重要的是,在所有經合組織成員中,丹麥的製度最能適應勞動力市場需求,而美國在32個研究對像中僅排第19名。

這導緻美國勞動力市場長期存在供需不匹配的情況。據《華盛頓郵報》財經記者希瑟•朗所言,即使現在美國為勞動者提供再培訓機會,勞動者也往往沒有意願報名參加,因為他們擔心就算參加培訓也找不到工作;或者只是報名學習一些最基礎的IT課程,比如如何使用微軟的辦公軟件。

托馬斯•斯瑟比認為:“我理解工人為什麼會對新技術和機器人有抵觸情緒。因為他們一旦失業,就很難再找到工作。他們所掌握的技能只適用於特定的公司。如果沒有一套再教育或提陞技能的培訓制度,工人就會怨聲載道。這個問題很難解決,而且他們試圖解決這個問題的方法不對。他們需要做的是完善教育、發展工會”。除了斯瑟比之外,在大西洋彼岸的華盛頓特區,以約瑟夫•斯蒂格利茨為代表的經濟學家和以美國經濟政策研究所為代表的智庫也提倡這一措施。

通過對比丹麥和美國這兩個案例可以發現,工業化國家最好還是重新採納以利益相關者為出發點的解決方案,並擴大對公共教育的投資。

以利益相關者為出發點,直面技術衝擊

視線轉回亞洲,以利益相關者為出發點的解決方案在亞洲同樣有效,以新加坡為例。

20世紀60年代,作為“亞洲四小龍”之一的新加坡,經濟開始迅猛發展。在早期階段,新加坡把重心放在勞動密集型製造業上,將其視為經濟增長的重要支柱,並且大獲成功。很多日本公司和其他跨國公司為了尋找廉價的製造業中心而進駐新加坡,使許多新加坡人獲得了體面的藍領工作,促進了該國經濟迅速發展。但隨著中國等亞洲新興經濟體緊隨其後發展起來,新加坡想要發展更加以服務和知識為導向的經濟,向價值鏈上游進軍,實現向發達國家之位的躍升。為此,新加坡早在20世紀80年代就已經需要對工人進行再培訓。

儘管新加坡已是過去半個世紀中經濟發展最突出的國家之一,但這個東南亞國家明白,在當今的全球化經濟中,新技術和服務業崗位變得比以往更加重要,國家需要不斷調整以適應變化。這也是新加坡政府牽頭設立“技能創前程”計劃的原因所在。通過這一終身學習體系,任何年齡段的新加坡人都能學習新技能,為進入第四次工業革命中的就業市場做好準備。

在我們觀察新加坡模式時,還有一個重要特點值得一提。這一模式的成功離不開三個利益相關者:政府、企業以及工會。

自1965年起,這個“鐵三角”組合在所有的勞動力市場和產業政策決策中都發揮了重要作用,而且沒有對經濟活動造成重大干擾。儘管新加坡的勞動力市場流動性很大(僱用和解僱都相對容易),經濟發展至少經歷過兩次成功的轉型——一次是20世紀六七十年代向製造業轉型,另一次是20世紀八九十年代向服務業轉型,但罷工在這個國家極其罕見。

《日經亞洲評論》最近的報導稱,這種極具建設性的積極態度在未來仍然很重要,因為“在東南亞,技術的顛覆性影響將會給新加坡帶來前所未有的高失業率”。但有跡象表明,這波即將到來的技術衝擊不會摧毀新加坡的社會和經濟。普華永道會計師事務所的一項調查發現,“超過90%的新加坡受訪者表示,他們會抓住老闆提供的任何機會來掌握或使用新技術”。

這表明,像美國和西歐國家這樣的經濟體面臨著三重挑戰:政府和企業必須在員工持續性再培訓方面加大投資;工會必鬚髮展壯大,同時與企業和政府進行合作;工人自身也應當保持積極、靈活應變,不懼自己及國家將要面臨的經濟挑戰。

展望未來,我們應該記住,技術本身沒有完全的好壞之分,一切都取決於我們如何使用它。從政府到企業,再到整個社會,每一個利益相關者都負有各自的責任。事實上,即使企業家的出發點是好的,其公司的影響最終也有可能弊大於利。而且,儘管在自由市場上運營的創新型企業是經濟發展的強大引擎,但也離不開同樣富有創新力且強大的政府這個最佳聯盟——政府會始終把社會的最大利益放在首位。

歸根結底,對於創新及其推動者,我們除了擁抱和接受以外別無選擇。但是,對於那些曾經名不見經傳但富有創新精神的企業家,我們應當給予更多鼓勵,使其保持初心,避免膨脹成為壟斷者。技術只有在被廣泛共享時,才能發揮出最大的潛能。在人工智能時代,這一點將比以往任何時候都更加重要。

跟福爾摩斯搶活干!AI“讀圖會意”技能首超人類,刷新VQA挑戰記錄

圖片

從下面這張圖,你能立即猜出用電腦工作的這個人是否有車、有沒有結婚嗎?

图片

AI可以迅速鎖定胳膊下壓著的車鑰匙和左手無名指上的戒指,由此推斷出可能的答案:有車、已婚。
除了秒辨圖片裡有哪些內容外,AI已經開始挑戰更高階的“學霸”行為,即在看圖和理解問題後,立即給出對應的關聯信息。
這一高階任務屬於機器視覺問答(Visual Question Answering)領域。過去數年間,AI一直在挑戰新的能力巔峰:2015年在視覺分類任務上超越人類成績,2016年擊敗世界人類頂尖棋手,2018年文本閱讀理解能力超人類基準……
如今,就在本週,AI終於在視覺問答VQA這一高階任務上,取得了超越人類水平的最新突破。
在國際權威機器視覺問答榜單VQA Leaderboard上,阿里巴巴達摩院深度語言模型體系AliceMind以81.26%的準確率創造了新紀錄,讓AI在“讀圖會意”上首次超越人類基準線80.83%。第一位得分超越人類的AI選手誕生了。

图片

▲達摩院AliceMind在VQA Leaderboard上創造首次超越人類的紀錄

01
VQA考卷有多難?
堪稱“變態”的偵探級推理
什麼是視覺問答(VQA)?簡單來說,給AI一張照片,AI不僅能用文字回答圖片裡有什麼,還能通過推理回答出更多增量信息。
比如,下面這張圖中,你能看見暖黃的燈光下,一個戴著眼鏡的男子正枕在白色枕頭上張嘴酣睡,他的左手側,一隻漂亮的貓咪正凝視著你。

图片

那麼問題來了,這隻貓是什麼品種?
AI能做到秒答:暹羅貓。
看圖問答只是基本操作,AI的視覺問答能力範疇還包括:看見車胎就能回答其汽車品牌,看見一隻熊就知道它的品種,看見士兵玩具和戰斗場景就知道它出自星球大戰電影……

图片

VQA,這個將計算機視覺與自然語言技術交融的多模態領域前沿研究方向,對研發通用人工智能有重要意義。
但要讓AI具備像偵探一樣細緻的觀察能力、像百科全書一樣全面的知識儲備,可不是容易的事。
為了攻克這一難題,全球計算機視覺頂會CVPR從2015年起連續6年舉辦VQA挑戰賽,形成了國際上規模最大、認可度最高的VQA數據集,其包含超20萬張真實照片、110萬道考題。
在測試中,AI需根據給定圖片及自然語言問題,生成正確的自然語言回答。

图片

說起來簡單,但要取得漂亮的成績,AI不僅要修煉好圖像識別、文本識別、文本理解等基本功,還要解鎖計數、讀鐘錶、推理認知等附加技能。
基於此,AI首先獲知所有圖像信息,再結合對文本問題的理解,學習圖文的關聯性、精准定位相關圖像信息,最後根據常識及推理回答問題。
當然,擁有百科全書的豐富常識,是能做到秒答問題的前情提要。
VQA考題有多難呢?舉個例子,下圖中的這些玩具是用來做什麼的?

图片

人類尚需通過觀察和思考才能給出答案,而AI在檢索圖片後,根據小熊玩具上的禮服裝飾,推斷出一個可能的答案:婚禮。
微軟、Facebook、斯坦福大學、阿里巴巴、百度等眾多全球頂尖機構均在參與VQA挑戰賽。

图片

▲自2015年以來VQA技術的進展

今年6月,阿里達摩院在VQA 2021 Challenge的55支提交隊伍中奪冠,成績領先第二名約1個百分點、去年冠軍3.4個百分點。
兩個月後,就在本週,達摩院再次以81.26%的準確率創造VQA Leaderboard全球紀錄,首次超越人類基準線80.83%。
這意味著,在封閉數據集內,AI的VQA表現已經媲美人類水準,向認知智能邁進關鍵一步。
在更開放的現實世界,AI雖然面臨著更多挑戰,但已經有相當方便的應用,正改變人們的生活。
02
從生活Tip到電商問答 Continue reading

跟福爾摩斯搶活干!AI“讀圖會意”技能首超人類,刷新VQA挑戰記錄

圖片

AI的“讀圖會意”能力首超人類基準線。
作者 |  心緣
編輯 |  漠影
從下面這張圖,你能立即猜出用電腦工作的這個人是否有車、有沒有結婚嗎?

图片

AI可以迅速鎖定胳膊下壓著的車鑰匙和左手無名指上的戒指,由此推斷出可能的答案:有車、已婚。
除了秒辨圖片裡有哪些內容外,AI已經開始挑戰更高階的“學霸”行為,即在看圖和理解問題後,立即給出對應的關聯信息。
這一高階任務屬於機器視覺問答(Visual Question Answering)領域。過去數年間,AI一直在挑戰新的能力巔峰:2015年在視覺分類任務上超越人類成績,2016年擊敗世界人類頂尖棋手,2018年文本閱讀理解能力超人類基準……
如今,就在本週,AI終於在視覺問答VQA這一高階任務上,取得了超越人類水平的最新突破。
在國際權威機器視覺問答榜單VQA Leaderboard上,阿里巴巴達摩院深度語言模型體系AliceMind以81.26%的準確率創造了新紀錄,讓AI在“讀圖會意”上首次超越人類基準線80.83%。第一位得分超越人類的AI選手誕生了。

图片

▲達摩院AliceMind在VQA Leaderboard上創造首次超越人類的紀錄

01
VQA考卷有多難?
堪稱“變態”的偵探級推理
什麼是視覺問答(VQA)?簡單來說,給AI一張照片,AI不僅能用文字回答圖片裡有什麼,還能通過推理回答出更多增量信息。
比如,下面這張圖中,你能看見暖黃的燈光下,一個戴著眼鏡的男子正枕在白色枕頭上張嘴酣睡,他的左手側,一隻漂亮的貓咪正凝視著你。

图片

那麼問題來了,這隻貓是什麼品種?
AI能做到秒答:暹羅貓。
看圖問答只是基本操作,AI的視覺問答能力範疇還包括:看見車胎就能回答其汽車品牌,看見一隻熊就知道它的品種,看見士兵玩具和戰斗場景就知道它出自星球大戰電影……

图片

VQA,這個將計算機視覺與自然語言技術交融的多模態領域前沿研究方向,對研發通用人工智能有重要意義。
但要讓AI具備像偵探一樣細緻的觀察能力、像百科全書一樣全面的知識儲備,可不是容易的事。
為了攻克這一難題,全球計算機視覺頂會CVPR從2015年起連續6年舉辦VQA挑戰賽,形成了國際上規模最大、認可度最高的VQA數據集,其包含超20萬張真實照片、110萬道考題。
在測試中,AI需根據給定圖片及自然語言問題,生成正確的自然語言回答。

图片

說起來簡單,但要取得漂亮的成績,AI不僅要修煉好圖像識別、文本識別、文本理解等基本功,還要解鎖計數、讀鐘錶、推理認知等附加技能。
基於此,AI首先獲知所有圖像信息,再結合對文本問題的理解,學習圖文的關聯性、精准定位相關圖像信息,最後根據常識及推理回答問題。
當然,擁有百科全書的豐富常識,是能做到秒答問題的前情提要。
VQA考題有多難呢?舉個例子,下圖中的這些玩具是用來做什麼的? Continue reading

模擬變色龍,軟體機器人也能實時根據背景變色!依賴溫度實現,研究登上Nature子刊

 

圖片

動物永遠是人類的創新靈感來源。

有科學家從蜻蜓大腦中看到了未來導彈防禦的高效應用,有科學家從蝙蝠超聲波中受到啟發,研發出了新的掃描系統,用來檢測輸油管道的腐蝕情況……

現在,科學家們對世界最可愛物種之一的變色龍“下手”了。

我們知道,“變色龍”這一名字的由來和它們能跟隨環境變化隨時改變身體的顏色有關,這樣的功能能如何被利用呢?

8月10日,韓國首爾國立大學和漢陽大學的研究人員在Nature Communications期刊發表了題為Biomimetic chameleon soft robot with artificial crypsis and disruptive coloration skin的研究論文。

論文中寫到,研究人員以變色龍為靈感開發了一個軟體機器人,該機器人能根據背景實時變色,就像這樣:

图片
图片

從上圖可以看到,變色龍機器人在不同顏色的條紋背景上行走,能夠實時改變自己身上的顏色。

對於這項技術,研究人員表示,這項研究或對下一代可穿戴偽裝技術具有啟示意義。

图片

論文鏈接:

https://www.nature.com/articles/s41467-021-24916-w
讓機器人擁有變色龍的“超能力”

根據目前科學界的普遍看法,變色龍的變色能力和它們皮膚表層的微小晶體有直接的關係,通常來說,它們只需要利用肌肉來實現擴張和收縮即可。

要將這項生物技能複製成一項科學技術,卻沒有想像中簡單。

此前,這種人造裝置通常需要依賴於微流體裝置,即使用微小的通道來控制內部流體的流動。

但該項目卻另闢蹊徑,根據研究人員的說法,他們,主要使用了一種可根據溫度改變顏色的薄液晶層。

研究人員在晶體層下方堆疊了幾層納米線加熱器(nanowire heaters)。納米線層包含不同的圖案,從點到網格,選擇性加熱層會創建彩色圖案,幫助機器人更好地模仿其周圍環境。

機器人內置的顏色傳感器和反饋系統會檢測局部背景顏色,然後轉換其皮膚的顏色以匹配。

图片

該研究的作者之一、首爾國立大學熱工程學教授 使用加熱速度非常快的納米線加熱器幫助解決了這個問題:人造皮膚升溫得足夠快,以與真實動物相似的速度改變顏色。

“構建第一個原型的過程是非常緩慢的。”Hwan Ko說。

首先他們需要確定機器人是模仿脊椎動物還是無脊椎動物,比如魷魚或章魚。在最初的構想中,由於無脊椎動物模型能有更多的活動自由,團隊計劃模仿章魚,但最終證明這個想法是過於美好了。

在對不同的設計和材料結構進行細緻研究後,該團隊最終決定以變色龍為基礎,以更簡單的方式複制這項生物技能。通過將納米線塑造成由點、線或鱗片形狀組成的簡單圖案,他們創造出瞭如今的效果。

图片

目前,這款變色龍機器人長約38厘米,寬約15厘米,重約0.9公斤,與動物相似,但和最初設計的尺寸還存在差異,研究人員希望能夠縮小規模。

此外,由於該技術依賴於溫度,在極冷的情況下變色效果不盡如人意,這樣變色龍機器人難以實現對全光譜顏色的複制。隨著信號處理和數據驅動科學的進步,團隊表示,這一局限將會得到彌補,同時,變色龍機器人還會以更高的分辨率反射背景表面的紋理。 Continue reading

憑什麼AI能在東京奧運會上免費看排球比賽?

 

圖片

8月8日晚,第32屆夏季奧林匹克運動會正式閉幕。

圖片

由於疫情原因,本次奧運會沒有開放觀眾入場,偌大的比賽場上能清楚聽到選手的吶喊和喘息聲。

但在一些比賽場上,比如沙灘排球,除了教練和隊友,還有這麼一群特殊的“觀眾”。

“我們使用帶有計算機視覺技術的攝像頭來跟踪運動員和排球,”Omega Timing的負責人Alain Zobrist說,“這是我們將相機技術和人工智能結合實現的”。

自1932年以來,
最讓人印象深刻的,可能是1948年在倫敦推出的第一台光電照相機Magic Eye,在此之前,裁判都是用人眼與秒錶,結合判定哪個運動員最先越過終點線。

多年來,Omega Timing除了一直提高準確性,還實時開發了對新項目的判定方法。比如,競技
但其中,最有趣的應當要數

據了解,Omega Timing的研發部門由180名工程師組成,開發過程從內部定位系統和運動傳感器系統開始。他們的目標是,這些數據在賽事期間的測量、處理和傳輸時間必須少於十分之一秒,以便呈現給屏幕前的觀眾。

對於沙灘排球來說,這意味著採用定位和運動技術,並訓練人工智能來識別各種擊球類型,比如擊球到攔網到扣球的變化,以及傳球類型和球的飛行路徑,然後將這些數據與從球員衣服上的陀螺儀傳感器收集的信息結合起來。這些傳感器能夠讓系統知道運動員的運動方向,跳躍高度和速度等。
處理完畢後,相關信息和數據就會用於直播、評論或以屏幕上的圖形進行展示。

“有時,球會被運動員的身體部位遮住,有時在電視畫面外,因此,如何在看不見球的時候進行追踪,讓軟件預測球的運動軌跡,然後,當球再次出現時,重新計算這段時間的差距,自動填補缺失的數據,並再度實現追踪”。

Zobrist說,

Omega Timing 然而,達勒姆大學計算機視覺和圖像處理教授Toby Breckon表示,關鍵還在於,系統是否會被種族和性別的差異所欺騙。

“這些已經完成的工作相當令人印象深刻,你需要一個大的數據集來訓練人工智能”,Breckon說,“但其中一個問題是準確性。在這些不同的動作方面,它有多長時間會出錯?它多長時間會失去對球的追踪?還有,如果它在所有種族和性別上都能統一工作,比如說,對美國女隊的準確率是99%,系統對加納女隊的準確率仍然是99%嗎?”

Zobrist “重要的是,不管是對於計分運動,還是計時運動,我們都不能讓成績的解釋和最終結果之間出現差異”。

至於未來的計時和跟踪升級,Zobrist諱莫如深,但他說2024年的巴黎奧運會將是關鍵。

“你會看到一套全新的設備。它仍將圍繞計時、計分,以及運動傳感器和定位系統,當然也可以期待一下2028年的洛杉磯,我們還將有更為有趣的項目,雖然我們才剛剛開始”。

蘋果新專利:動動眼睛就能“移動”光標,手機電腦AR眼鏡都能用

圖片

據外媒AppleInsider報導,近日蘋果公佈一項新專利申請,該項新專利可以讓你動動眼睛就能移動光標,方便你輸入文本信息。該項專利不但可以應用於iPhone、iPad等我們常用的移動設備中,而且還可以用在VR/AR等頭顯設備上。
“用凝視來選擇文本輸入的區域(selecting a text input field using eye gaze,以下簡稱’凝視選擇’)”功能指的是當用戶注視某個軟件或者網站的文本框時,光標就會移動到該文本框,用戶就可以直接填寫相關信息。這意味著未來的用戶可能只需看一眼就可以在某個文本框裡輸入文本。
專利文件顯示,該功能將通過尋找“用戶瞳孔的中心,或者用戶眼球的旋轉中心”,來確定“用戶眼睛的視軸(visual axis)”,了解用戶正在看向屏幕的哪一塊區域,從而移動到該區域選中文本。
此次專利由三位研究人員共同發明,其中包括Earl M. Olson,他此前曾參與研究過AR環境中如何確定虛擬對象相對於真實物理對象的位置。

图片

▲蘋果新專利“用凝視選擇文本輸入區域”功能(來源:美國專利商標局)

01
用注視來移動光標
與常見選擇文本輸入區域方式不同
“凝視選擇”功能與常見選擇文本輸入區域的方式不同,前者只需要注視不同的文本框即可移動光標,後者則需要手動選擇某個文本框。
我們平常填寫某個表單時,需要不斷地將光標從一個文本框中移動到另一個文本框時,這樣瀏覽器能知道我們正在填寫哪一塊區域。而擁有“凝視選擇”功能後,我們只需要注視某個文本框,該處文本框就會彈出光標,讓我們直接輸入文本信息。
“光線會分別沿著用戶的左眼和右眼的視軸投射(例如投影)”,蘋果表示,“並且可以用於確定用戶的注視方向或光線投射中的凝視深度。”

图片

▲AppleInsider網站公佈蘋果的“用凝視選擇文本輸入區域”新專利

02
關注你的“視線”
頭顯將用傳感器監測凝視目標
專利文件表示,該功能不但可以應用於台式電腦、筆記本電腦、平板電腦等傳統設備上的用戶界面,而且還能“用於虛擬現實、增強現實和混合現實設備和應用……”。
但它也提到這兩種設備會有不同之處,比如說,在AR設備中,執行注視跟踪功能(gaze tracking)的設備是頭顯,像“Apple Glass”等,它將通過頭顯中位於眼睛附近的傳感器來確認凝視的目標,而傳統設備如iPhone、iPad需要在距離眼睛較遠的地方實現注視跟踪功能。
03
實時掃描你的眼球
看別人iPhone也會彈窗嗎?
外媒AppleInsider認為,蘋果可能會讓設備不斷掃描用戶的眼睛,來確認用戶注視的位置變化。無論用戶何時激活該項“凝視選擇”功能,該功能都會尋找到眼睛凝視的特定區域,並確定“用戶的注視方向或註視深度”。
蘋果還提到,系統應該會要求用戶在激活該項功能時設置一定使用時間,這樣的話,當你走在蘋果體驗店時,不會每一台蘋果設備都在你看向它的時候,都彈出光標讓你去填寫訂單的詳細信息。
04
結語:視覺交互技術應用前景廣闊
蘋果新專利“凝視選擇”功能主要通過確認用戶的視線軸來確認用戶選擇輸入哪塊區域的文本框。用戶只要通過注視即可移動光標,這不但能方便我們日常輸入文本,省去移動光標的時間,而且會在VR/AR上帶來新的應用場景。
與“凝視選擇”的原理相似,如今市場上還存在一種眼動追踪(Eye tracking)技術。眼動追踪技術可以通過測量眼睛的注視點的位置或者眼球相對頭部的運動而實現對眼球運動的追踪,從而確定眼睛注視的方向。
據全球研究公司Marketsand Markets認為眼動追踪技術的市值在2023年或許會達到14億美元。由此可見,諸如“凝視選擇”、眼動追踪這類視覺交互技術,不但能夠提高人機交互的流暢性,還擁有較為廣闊的發展前景。

機器人也能有觸覺!北航造了根機器手指,紋理識別準確率100%

圖片

北京航空航天大學的一個研究團隊最近開發了一種新的觸覺傳感技術,能夠讓機器人擁有像人一樣的觸覺,感受到物體表面的紋理是什麼樣的,還能感受到物體有多硬。
這項技術可以應用於由柔軟材料製成的機器人上,為仿生假肢和類人機器人的製造提供幫助。研究者稱該研究的靈感來自於人類及哺乳動物的本體感覺機制,這是一種讓人類及哺乳動物能夠感知或意識到自身位置和運動的生物機制。
研究團隊對他們創建的原型系統進行了一系列測試評估其觸覺傳感技術,發現該系統在物體紋理和剛度識別方面分別達到了100%和99.7%的準確率。
該研究已在論文預印本發布平台arXiv上預發表,論文題目為《用肌腱驅動的軟機器人手指進行觸覺感知(Tactile Sensing with a Tendon-Driven Soft Robotic Finger)》

圖片

論文鏈接:
https://arxiv.org/ftp/arxiv/papers/2107/2107.02546.pdf
01
研究者從人體得到靈感,
讓機器手擁有觸覺
近年來,全球眾多機器人專家都在嘗試開發出一種可以復制人類觸覺的機器人系統,同時也在嘗試使用柔軟材料替代剛性結構,創造出更加逼真、更加先進的仿生肢體和類人機器人。
柔軟材料在採集觸覺信息方面具有紋理採集上的優勢,但是由柔軟材料製成的機械手臂通常無法收集更廣泛的感官信息。迄今為止,複製人類收集物體觸覺信息的生物機制仍是極具挑戰性的一件事。
過去的研究中往往使用剛性手指測量接觸剛度(contact stiffness),這些方法根據手指的運動學模型估計手指和物體間的接觸力和手指的位移,來對接觸剛度進行計算。然而這一方法很難被用到軟體機器人手指上,因為軟體機械手過於柔軟,運動學建模很困難,且結果通常不太準確。
而北京航空航天大學的這個研究團隊從在人類身上發現的本體感覺框架(proprioception framework)上得到靈感,開發出了新的觸覺傳感技術,使軟體機器手擁有了觸覺,能夠感知物品的紋理與剛度。
“當你蒙上眼睛並捂上耳朵時,仍可以感覺到你的手部姿勢、手臂位置或手裡提的食品袋的重量,這種能力就被稱作本體感覺。我們一直在進行一個假手研究項目,並努力尋找讓假手擁有觸覺反饋的辦法。”這項研究的參與者之一Chang Cheng說。
02
有觸覺的機器手指紋理識別
準確率可達100%
在過去,機器人研究者通常不會將本體感覺與觸覺相關聯,因為人類的本體感覺機制並不會有特別精確的反饋。然而工業傳感器比人類本體感受器官靈敏的多,將它們用於機器人手指可以幫助研究者收集更精確的觸覺反饋。
北航的這個研究團隊創建的機器手原型系統由線性執行器(linear actuator)、肌腱/電纜(tendon/cable)、應變傳感器(strain sensor)和一個軟體機器人手指組成,另外還有一個用聚氨酯製成的套子套在在手指的末端,以模仿人的指尖。

图片

▲機器手原型系統

機器手指的肌腱與執行器相連,應變傳感器則被安裝在肌腱的中間位置。當執行器被驅動時,它會拉動肌腱讓手指彎曲或伸直,肌腱上的應變(strain)也會相應的產生變化。當手指觸摸不同的物體時,傳感器會輸出一系列應變信號來表徵所觸摸的物體。
研究者用8個不同的紋理板和4個不同剛度的圓柱體對機器手指進行試驗。
觸覺感應測試中,研究者讓機械手指以較慢的速度劃過紋理板表面,由此產生的肌腱應變則被記錄下來,每個紋理板上共進行了60次試驗。
剛度感應測試實驗中,用於試驗的圓柱體被放置在手指下方,手指被激活後便會對物體施加壓力,這種狀態會保持4秒鐘。實驗中肌腱應變的各階段數據同樣會被記錄。
之後,研究團隊利用機器學習模型對這些數據進行分析,最終可識別出相應的物體紋理或物體剛度。經過驗證,該方法在物體紋理的識別上達到了100%的準確度,在物體剛度識別方面準確度也達到了99.7%。

图片

▲進行紋理和剛度感應測試的試驗過程

03 Continue reading

FRL:即使帶著VR 頭盔,現在也能與外界進行眼神交流了

導語:VR 透視頭盔,三年經過了兩次迭代

Facebook 現實實驗室(FRL)在VR 頭盔的研究上,又有了一個創新。

本週早些時候,FRL 發布了一篇關於“反向透傳VR(reverse passthrough VR)”的論文,這是一種可以將你的面部呈現在頭盔前端顯示屏的功能。

具體來看,“反向透傳VR”指的是一種通過頭戴式設備攝像頭,讓用戶在戴著VR 設備的情況下,也能直接看到外面的真實世界的功能。

例如,當用戶退出VR 遊戲或視頻時,Facebook 的Oculus Quest 平台就會向他們發出一個“切換到現實世界畫面”的提示,對於想快速退出VR 的用戶來說非常有用。

得益於該方案,用戶還可以將虛擬對象添加到相機源,從而啟用AR。

不過FRL 指出,儘管戴著這種VR 頭盔的用戶,可以看到真實世界,但是身邊的人卻無法與他們進行眼神交流。

第一代眼神透傳VR 頭盔誕生

基於前面論文中提到的“交流缺陷”,FRL 科學家內森·松田(Nathan Matsuda) 開始了他的研究。

一篇博客文章顯示,內森·松田從2019 年開始在Oculus Rift S 頭盔上安裝3D 顯示器,頭盔的屏幕可以顯示松田上半張臉的虛擬圖像,定制的眼球追踪傳感器可以捕捉到了松田的視線,這樣屏幕內外的眼睛就可以朝向同一個方向,以此來實現眼神交流。

不過,這樣造成的結果是,內森·松田基本上是戴著一個大型平板電腦進行娛樂。外界看來,在頭盔上面顯示的人臉非常尷尬。

FRL:即使帶著VR 頭盔,現在也能與外界進行眼神交流了

對此,FRL 首席科學家邁克爾·阿布拉什(Michael Abrash)表示,這個想法並不實用。

他說:“我的第一反應是,這是一個愚蠢的想法,頂多算是新奇。但我不會告訴研究人員不能這樣做,因為如果沒有嘗試新事物的自由,那就沒有了創新。” Continue reading

“一家人”卻用四種不同接口,蘋果放棄Lighting很難嗎?

“一家人”卻用四種不同接口,蘋果放棄Lighting很難嗎?

據外媒報導,Mark Gurman發表文章稱蘋果應該修改其設備的充電器策略(device charger strategy),減少蘋果設備數據線的種類。

目前蘋果設備的數據線種類越來越多,即使你使用的是蘋果“全家桶”,你所需要的充電線也可能多達四條。

一、手機、平板、手錶和筆電的數據線各不相同

Gurman表示,如果一個蘋果用戶擁有iPhone、iPad Pro、Apple Watch以及即將推出下一代Mac等蘋果設備,他可能需要四種不同的充電線為它們充電。對於一家以提供智能的方式、多設備協同工作而自豪的公司,這顯得有點“反常”。蘋果目前的數據線有多種格式:

Lighting:所有型號的iPhone、入門級iPad、iPad mini、iPod touch、Apple TV遙控器、MagSafe Duo和所有AirPods產品。以上所有蘋果設備都需要通過Lighting數據線充電。

USB-C:蘋果在當前的MacBook Pro、MacBook Air、iPad Pro和iPad Air上使用USB-C接口的數據線來充電。

適用於iPhone的MagSafe:蘋果去年為iPhone 12 系列設計的無線“快充”充電器。

適用於Apple Watch的MagSafe:自2015年第一款型號以來,Apple Watch一直使用相同的MagSafe。

適用於Mac的MagSafe:今年的24英寸iMac上,增加了MagSafe磁吸充電的圓形連接器(round connector)。Gurman預計今年的新款MacBook Pro和明年重新設計的MacBook Air將採用另一種MagSafe設計。

“一家人”卻用四種不同接口,蘋果放棄Lighting很難嗎?

▲AirPower

幾年前,蘋果公司曾在無線充電技術上發力,希望這可以簡化其充電器的數量。蘋果曾在2018年嘗試推出了AirPower,這本來是一個可以為iPhone、AirPods和Apple Watch提供無線充電的設備,但是在2019年因為無法滿足硬件標準而宣布取消。

去年,Apple推出了MagSafe Duo,它可以讓蘋果用戶同時為Apple Watch和iPhone 12充電,但是該產品沒能引起市場的興趣。

二、換USB-C利大於弊,統一接口將更像“蘋果”

Gurman表示,蘋果應該改變其連接器產品線(connector lineup),從五種不同的充電器減少到三個。他認為這將有助於簡化蘋果的產品線並更好的管理其他的蘋果產品,而且第一步應該從將Lighting替換成USB-C開始。 Continue reading

聯絡我們

地址
香港九龍觀塘鴻圖道57號南洋廣場1808室
Rm.1808, Nanyang Plaza, 57 Hung To Road., Kln. HK

電話
23091888

電郵
info@iothk.net