視覺語言導航:造就高智商機器人
有專家這樣說,人類開發人工智能的未來目標,如同現在科幻電影所呈現的場景一樣,智能機器可以獨立“看、聽、思、行”,具備像人類一樣的語言理解系統、視覺感知系統、自我理解與行動的能力,最終成為人類的完美“替身”。
如今,世界科技飛速發展,視覺語言導航技術日臻成熟,高智商的機器人正向我們走來。
視覺語言導航,指的是讓智能體跟著自然語言指令進行導航,同時理解指令與視角中可以看見的圖像信息,然後在環境中對自身所處狀態加以調整、修復,做出對應的動作,最終到達目標位置。比如,我們把機器人放置在一間臥室裡,讓它去取放在另一間臥室裡的足球。因為房間無法通視,機器人需要走出房間,經過走廊、客廳等場所,並通過推算看到的每一處環境信息,來判定下一步行進方向,最終定位找到足球。
由此可見,視覺語言導航涉及計算機視覺、自然語言處理和自主學習三大核心技術。
先進的科技成果往往備受軍事領域的青睞。世界許多國家已開始致力於視覺語言導航在人工智能上的拓展運用,打造智能戰爭機器,搶占打贏明天戰爭的前沿高地。
計算機視覺,讓智能機器“看清”世界
計算機視覺是一個跨領域的交叉學科,包括計算機科學、數學、工程學、物理學、生物學和心理學等。
在人工智能裡,計算機視覺可以類比人類的眼睛,是在感知層上最為重要的核心技術之一。它能讓智能機器人靈敏地辨識“眼”前的一切,並對捕捉到的圖像數據信息進行分析識別、檢測、跟踪等。嵌入計算機視覺技術的智能武器,可以通過視覺系統,精準辨識和區分目標的主次、真偽,大大提升作戰效率。
據悉,現在技術人員讀取由無人機傳回的戰場態勢數據,每天的工作時間要超過10個小時。這與瞬息萬變的未來戰場不相適應。然而,當計算機視覺技術應用於戰場智能偵察裝備前端時,可從海量信息中有效過濾無關信息,向作戰人員提供甄別處理後的視覺態勢圖,指揮決策效率隨之提升。
當前,世界發達國家的部分裝備已經開始應用該項技術。如美軍搭載計算機視覺技術的iRobot偵察機器人,就是其中之一。它可以警告作戰人員有伏擊或其他危險,經過處理的態勢感知,能夠明確指出目標坐標,或提示危險等級。該偵察機器人還可準確傳回有價值的態勢視頻與相關建議指令,縮短己方在戰場上的決策週期,從而把握行動優勢。
近年來,俄軍也在大力開發人工智能係統。其自主研製的陸戰機器人,可在遙控下完成巡邏、偵察、追踪、阻截、攻擊等任務;形似軍犬、快速奔跑的機器人,可供火線運輸彈藥給養;鏟車式機器人,可將戰場上的傷員用鏟斗送回後方等。俄軍部分導彈也已裝有人工智能設備,在導彈飛向預定目標時,若人工智能設備在途中甄別出價值更大的目標,導彈可自動轉向進行攻擊。在這些先進的武器中,都能看到計算機視覺的影子。
在民用領域,計算機視覺技術已陸續應用到安防、自動駕駛、醫療、消費等活動中。這也是當前人工智能細分領域中發展最快、應用最廣、炙手可熱的技術之一。
隨著算法的更迭、硬件算力的升級、數據的大爆發,以及5G帶來的高速網絡,無論在民用領域還是軍用領域,計算機視覺技術的應用將會有更大的空間。
自然語言處理,讓智能機器“聽懂”指令
簡單地說,自然語言處理就是用計算機來處理、理解以及運用人類語言(如中文、英文等),它屬於人工智能的一個分支,是計算機科學與語言學的交叉學科,又常被稱為計算語言學。
自然語言處理的歷史發展大致經歷了3個階段:20世紀40年代到20世紀50年代屬於萌芽期,英國科學家艾倫·麥席森·圖靈的計算機算法模型為現代計算機科學奠定了基礎;20世紀60年代到20世紀80年代屬於發展期,機器翻譯技術日漸成熟,並被應用於實際生活;20世紀90年代後屬於繁盛期,隨著計算機計算量、計算速度以及萬維網的爆炸式發展,自然語言處理技術也隨之在更多方面得到長足進步。
眾所周知,語言是人類區別於其他動物的根本標誌之一,沒有語言,人類的思維也就無從談起。所以,自然語言處理技術體現了人工智能的最高任務與境界。也就是說,只有當智能機器具備了處理自然語言的能力,才算實現了真正的智能。這樣,人類才能與機器人進行無障礙語言溝通。
如今,自然語言處理在軍事上的應用越來越多。比如,在指揮控制上,通過高辨識度的語音系統,指揮員可以在作戰中直接用語音實時控制雷達、無線電、火力等作戰單元,省去繁瑣的指揮流程,集中精力專注於作戰謀劃;在通信保障上,語音增強技術能夠減弱噪聲對智能機器語音信號的干擾,減少聽話人的疲勞和溝通失誤;在人機交互上,典型代表是人機口語對話系統,人類通過自然口語與復雜的智能機器系統進行交互,包括語音識別、語言理解、語言生成、語音合成、對話管理和知識庫等。
提起“颱風”戰鬥機,相信軍迷們都不會陌生。它是由英國、德國、西班牙、意大利聯合研發的,最大的技術亮點是搭載了直接語音輸入系統,飛行員可以通過語音下達命令,控制戰機的傳感器、武器以及自衛系統。
除此之外,自然語言處理在不少國家的醫學、互聯網監控、執法部門的犯罪預防以及大數據反恐應用等領域也很受歡迎,極大地提升了任務執行效率。
自主學習,讓智能機器“蛻變”成長
嬰兒剛出生時,只會用眼神、哭泣、歡笑與周圍的人交流。隨著一天天長大,他們不斷擴大接觸觀察範圍,學會了走路、說話、做遊戲等,慢慢建立起自己的思維體系。這就是人類的一個自我學習成長過程。人類大腦擁有860億個神經元、數万億個傳遞信息的結構——神經突觸。神經突觸的重要特徵是具有可塑性,即允許神經元對記憶進行編碼、學習和自我修復。
人工智能的自主學習技術,就是讓機器人像擁有人類大腦、甚至超越人類大腦一樣,可以通過思考學習實現自我完善。在很多人眼裡,自主學習能力是人工智能與人類智能的天然鴻溝。當前,伴隨該項技術的發展,這一鴻溝正在被逐漸填平。
2019年11月,在捷克布拉格召開的第二屆計算機視覺與模式識別國際會議上,評分第一的論文主要貢獻就是為智能機器提供了自主學習反饋機制,讓其自主導航時能夠實時詢問自己的知識儲備。
“這條路對嗎?”“到目的地了嗎?”……擁有學習反饋機制的智能機器,根據預設環境信息與實際對比,在行動過程中形成“是非”觀念,讓智能機器真正變成有思想的“機器人”。
究其根本,智能機器“是非觀”的形成,離不開強化學習,這種學習方式是當今人工智能最熱門的研究領域之一。
說到這裡,我們不能不提無師自通的“圍棋高手”阿爾法元(AlphaGo Zero),它的一鳴驚人也正是利用了新的強化學習方式。從一個對圍棋“零”儲備的神經網絡開始,接著與強大的搜索算法相結合,神經網絡在博弈中不斷被調整更新後,與搜索算法再次重新組合,循環往復,系統性能經過每一次迭代持續提高,使得神經網絡預測越來越精準,阿爾法元也擁有了“戰無不勝”的本領。可以說,它也讓人工智能離“像人類一樣”更近了一步。
如果把自主學習技術應用於軍事無人裝備上,並按照戰鬥力水平劃分等級,那麼自主學習級和智能對抗級應該屬於“王者”級別。自主學習級,就是不再局限於人為提供的學習樣本,可以邊執行任務邊組織學習,並且遇強更強,靈活應對任務過程中出現的未知事件;智能對抗級,是指無人裝備在具備自主學習智能水平的基礎上,形成自身的核心價值,能夠短時間內適應未知的任務環境,迅速理解周圍局勢並做出判斷,完成作戰任務。
從近幾年的技術突破來看,智能機器感知環境、識別語言、自主學習的能力越來越強大。這些能力的提升,不僅使智能機器成為人類分擔任務的得力幫手,也或將讓它成為未來戰場的主角。