【新興領域：5月焦點7】是誰在敲打我窗：AI行為辨識的應用|FINDIT:臺灣新創募資第一站

行為辨識是藉由AI判斷人們做了什麼動作，以及預測下一步可能採取的行為。本文蒐集全球相關案例，以說明此項技術如何應用在日常生活中，並且可以觀察到此技術主要深耕於醫療照護與保全監控領域。前半部分主要以全球新創企業案例為主，後半部分則為介紹台灣採用此技術的新創企業以及總結。

一、前言

在AI領域中，視覺辨識可以說是最廣為人知的應用了，其中「行為辨識」(Action Recognition)的技術，使得機器能夠協助人類工作業務的執行，對於人力成本節省有直接的影響效果。行為辨識技術除了對於圖片中物件得以做出辨識、分類之外，在現有的幾張圖片下，演算法還可以對於影像可能下一步發生的動作做出預測。

行為辨識技術在產業領域的應用中也得到良好的應用，例如在安防保全方面，透過行為影像可以縮減保全人員人力配置；在醫療照護方面，病患/老人/新生兒的行為辨識，可以在醫護人員能將時間與精力透入在發生意外的時點，而非全時段地投入。綜合上述，無論是人力資源的配置，或是既有勞動力的投入，人工智慧的行為影像偵測均可直接獲得成效。

隨著科技日新月異的進步，新穎技術在傳統產業的應用，催生出煥然一新的商業模式。然而，技術的演進對於產業產生的是效益還是衝擊，而市場中對新技術應用的接受度都是值得探討的議題。本文將從商業案例出發，並掃描全球與台灣市場相關案例，同時從中提點行為影像相關技術應用，冀以提供資訊給相關技術研發單位尋找我國缺口之參考。

二、國外案例介紹

人工智慧技術在過去幾年以強大的應用能力深入各產業領域，除了簡化繁雜的工作流程外，也另外提供高效率的業務服務，重塑整個產業發展型態，而行為影像監控技術目前大量應用在安防保全、醫療照護等多個領域，以下用案例的形式引領讀者審視該項技術發展性。

(一) 安防保全

1. 群眾行為監控-日本電氣

日本電氣(NEC)獨步全球研發「群眾行為解析技術」，這項技術是利用蒐集到的群眾即時影像進行分析，即可掌握目前街道、車站等人潮擁擠時的狀況，並且偵測是否有異常情形發生。

為什麼這項技術重要？讓我們思考傳統監控群眾異常狀況的流程(如下圖)，首先是需要一位監控人員緊盯著攝影機，管控人群擁擠環境情況、是否有意外事件發生，若發生異常狀況時則指派維安人員至現場處理。這作法對於人力成本負擔大，且時常無法第一時間解決問題。

資料來源：NEC

圖7-1 傳統監控流程

若將人工智慧技術引入來取代傳統人力監控作法，是將監控攝影機所拍攝的影像分為多個區塊，分析各別區塊的群眾密度、該區塊占有多少人。由於攝影機受限於固定的角度，因此群眾在行走過程時常發生影像阻擋、重疊的情況，使得對於個別行人影像一一監控有所困難，因此需要藉由「影像區塊」的方式，對於畫面上固定區域的影像作辨識。

要讓人工智慧模型判斷特定區域的影像上人數有多少，首先需要資料的支撐，使得模型得以判斷在小綠方框上有一個人、兩個人、五個人等的影像會是如何。NEC事先聘請超過一百位的演員協助相關影像的拍攝，再藉由影像自動合成技術，創造出超過幾十萬張的影像，再使用該資料作為AI模型的訓練，判斷的準確率高達九成。

資料來源：NEC

圖7-2 群眾行為解析技術說明

AI模型得以判斷各方塊區域的群眾密度後，藉由密度的大小得以掌握行人的擁擠程度，並及早進行判斷。對於異常狀況發生時，群眾突然間的聚集或疏散也會導致人群密度的大幅改變，而得以進行安全監控。

資料來源：NEC

圖7-3 群眾行為解析技術應用

2. 異常監控-海康威視

杭州海康威視數位技術股份有限公司成立於2001年，是一家位於中國杭州的影像監控設備供應商，主要控股方為中國電子科技集團。其提供的解決方案領域從安全防護科技、能源、交通，一直到金融業，是一家以影像監控為核心業務的智慧物聯網、大數據供應商。

舉例來說，在社會秩序安全防護上，藉由投入Smart2.0智慧監控系統，其原理是透過在普通監控攝影機中嵌入多種智慧辨識演算法，給相關攝影器材添加上智慧大腦，在不增加任何附加成本的情況下，實現了對監控系統智慧技術的革新，簡要原理如圖下所示。

Smart智慧攝影機能夠自動發現各種異常情況(如：越界、進入/離開區域、區域入侵、徘徊、人員聚焦、快速移動、非法停車、物品遺留/拿取等)，並可將報警信息傳送至Smart平台，實現主動式的安全防護。

資料來源：海康威視

圖7-4 Smart攝影機系統原理圖

3. 異常監控-Verkada (https://pse.is/MQ7EW)

Verkada成立於2016年，是一家位於美國的新創企業。該公司設計的產品是企業安防系統，藉由該公司開發具有圖像辨識系統的監視器，無須另外設置VPN、更新防火牆或原廠設置，直接藉由人工智慧系統運算和分析，可以逕由該公司開發的App隨時在平板、手機上查看監視畫面，此外，也可以設置多個監視錄影器，於後台點擊要查詢錄影地點就可以即時獲得清晰的全彩圖像，監控各地的情形。

資料來源：Verkada官網

圖7-5 Verkada的產品與行為偵測的示意圖

產品具有智慧功能，其利用監視器和演算法來發揮智慧化的效果，如目標檢測和主動報警，在發生異常活動時觸發，如超過工作時間後仍在企業內遊蕩的人、或停在裝貨碼頭的無法識別的陌生車輛，使得諸如此類監視管理工作都能藉由機器完成，省去人力作業時間。

Verkada的端到端解決方案在靜止、傳輸和雲中加密數據。基於雲端管理系統與大多數主流單點登錄(SSO)的商業性整合，確保授權人員無需安裝本地軟件和服務器即可輕鬆從單個控制台訪問和管理攝影頭。

Verkada在2019年4月25日募集4,000萬美元的B輪投資，投資人包括：Sequoia Capital、Next47、Meritech Capital Partners、First Round Capital。迄今獲得3輪的股權投資，總獲投達5,890萬美元。

(二) 醫療健康照護

1. 老年照護-Cherry Home (https://pse.is/NA969)

Cherry Home是2016年成立的美國企業，其核心業務產品為預防老年人跌倒的AI家居系統，透過視覺感測器和麥克風偵測和追蹤用戶，裝備包括一組可用於夜視的感測器，攝影機藉Wi-Fi 將影片和聲音傳輸到電腦端，即可進行即時儲存和分析資料。

利用該公司開發的專利演算法，可透過人臉、四肢的長度、衣服頭髮的色彩，或者是行走步態或站立姿勢變化來分辨用戶的位置所在，就得以監視視野中用戶的位置。而這些資訊會傳給醫生和護理人員，幫助他們評估是否有必要調整治療方式或讓病患再入院檢查。並自動將統計資料整理到一儀表板，有許可權的用戶可在上面檢視「異常」短片，比如絆倒、哭泣或呼喊，並可檢視生活日常活動軌跡。

資料來源：Cherry Home官網

圖7-6 Cherry Home產品示意圖

當前Cherry Home已獲得690萬美元的股權投資。最近一次獲投事件發生在2018年12月20日，金額為520萬美元，屬於A輪的股權獲投。

2. 嬰兒照護-Nanit (https://pse.is/MUTS9)

該公司成立於2015年，是一家位於美國的新創企業。設計的產品是嬰兒的監控器，藉由安裝該公司的設備於嬰兒床的上方，以記錄每日嬰兒的動態情形，藉此產生數據資料的蒐集並經過彙整後，得以為新手爸媽在手機上提供即時性的監控，在不打擾寶寶的睡眠狀況，也能給予無微不至的照顧。該產品不需在嬰兒身上穿戴電子性產品，只要藉由Nanit Breathing Wear與Nanit Plus的搭配，即可追蹤寶寶的呼吸頻率、翻身狀況等。

Nanit產品如下圖所示，其配有一智慧型調燈以配置柔和的光線協助嬰兒入眠，並且在產品柱狀部分為感測器，可以即時性的偵測寶寶的活動狀況、睡眠品質，並且可以透過內建的麥克風等音源設備即時接收聲音與說話。在將上述蒐集的數據整合至手機App當中，使得家長得以憑藉手機就得以瞭解嬰兒的睡眠狀況。

資料來源：Nanit官網

圖7-7 Nanit展示圖

Nanit在2018年5月21日募集1,400萬美元的B輪投資，投資人包括：Vulcan Capital、Vaal Investment Partners、Upfront Ventures、RRE Ventures、Jerusalem Venture Partners (JVP)。迄今獲得3輪的股權投資，總獲投2,860萬美元。

三、國內案例介紹

1. 嬰兒照護- Cubo

對於嬰兒照護商機，臺灣也有業者在當中布局。Cubo是一家成立於2017年，產品具有「寶寶口鼻覆蓋偵測＋危險區域偵測＋AI 自動拍照」三大特色，由AI 團隊及小兒科葉勝雄醫師共同研發。

資料來源：雲云科技官網

圖7-8 Cubo產品示意圖

寶寶口鼻覆蓋偵測結合人工智慧科技技術，Cubo是第一台能主動偵測如「口鼻被異物覆蓋、翻身」等睡床潛在危險事件的嬰兒監視器，並於第一時間透過手機發送「預警通知」搭配「鳥叫聲」，讓爸媽隨時掌握寶寶狀況，為寶寶打造第一道安全防線。與前述提到的Nanit業務模式相仿，Cubo AI也是需要透過將感測器、攝影鏡頭等硬體與AI模型以及App的串流與整合，達到嬰兒安全防護。

資料來源：雲云科技官網

圖7-9 口鼻被異物覆蓋的偵測

危險區域偵測守護寶寶從0至3歲以上，當寶寶會爬會走後，爸媽還可在Cubo App上自行設定「危險偵測」，一旦偵測寶寶接近，就會即時發送通知！搭配移動式支架，Cubo 就能變為能從孩子 0 歲開始使用到 3 歲以上的寶寶監視器。

資料來源：雲云科技官網

圖7-10 危險區域的設定

自動辨識可愛動作協助拍下漏網鏡頭，寶寶的每一天是由好多不同的「第一次」組成的，一旦偵測到「哭哭、笑笑或其他大幅度的可愛動作」，Cubo 就會自動拍下，並依照寶寶年齡大小彙整成時光相簿，自動保存及更新寶寶最近 10 天的動態。

憑藉著獨創的商業模式而深受投資人的青睞，2019年5月國發基金、益鼎創投與閎泰科技共同投資的A輪新台幣1.3億元，此輪資金將用於進軍美國市場的研發與行銷人才招募、建立國際品牌以及量產產品。

2. 自動提款機風險管控-中信智慧ATM

中國信託在金融科技的上應用眾多，並且在詐欺防護上有建立一套機制。由於多數詐騙受害人都是在電話中聽從詐騙者的指示而受騙，因此對於這類型的受害人在轉帳過程中會出現有「邊講電話邊轉帳」之行為；另一方面，詐騙歹徒在從事ATM犯罪行為時都會戴口罩或安全帽遮蔽臉部，對上述兩行為中信藉由AI模型的判別，以達到詐騙風險的管控。

而中信智慧ATM藉由與內政部警政署的合作，透過相關AI動作辨識模型訓練機器判斷民眾轉帳時是否出現同時講電話的行為，當智能ATM偵測到民眾邊講電話邊進行轉帳，智慧ATM會有所警示並提醒客戶留心交易。

同時對於戴口罩或安全帽遮蔽臉部的民眾，機器也能藉由事前的圖形訓練，判斷影像中的臉孔是否受口罩等物件所遮蔽，並請客戶拿下遮蔽物再行提款，提升交易安全。

四、結論

綜觀上述案例，AI行為辨識技術在民眾安全防護、異常監控以及醫療照護上得到良好的應用，舉凡人流管制、異常狀況判斷、老年與嬰兒的監控照護。那麼台灣在這個領域上有哪方面可以發展？首先要解的難題還是得回歸到法條上，過去台灣鐵路建置「智慧型影像監控系統工程」，主要透過影像提供鐵路場站安全防護，應用在月台人員落軌偵測、人群異常停留或逗留、禁制區域闖入、遺留物及時偵測告警等。但是由於各界對於人臉辨識所涉及的隱私方面表達高度擔憂，因此在爭議下取消了這項鐵路影像的智慧監控系統。

另一方面，從日本電氣的例子中可以看到數據的重要性，若要使AI有良好的運作，首先必須依賴的是資料。要能完好的藉由AI技術進行動作辨識，需要的是完整且數量龐大的資料，而且資料是要有統一標準規格化的。對此我們可以想的是，臺灣是否有足夠的資料支撐？對於異常現象的圖片與影像若缺乏開源性的圖形資料庫，企業就必須建置相關圖片、影像作為AI模型訓練的輸入資料。同時動作識別技術也需要感測器才能完成物體的辨識與偵測，感測器、攝影鏡頭與軟體之間的軟硬整合也是AI行為辨識領域所需的要素。

劉聖元（台灣經濟研究院研究六所/助理研究員）

參考資料

NEC，「全球首創群眾行為解析技術！在群眾影像中偵測擁擠狀況及異常情況」，2019，https://pse.is/J8TFH
Crunchbase-各家新創企業，https://www.crunchbase.com/
Cubo，https://tw.getcubo.com/

【新興領域：5月焦點7】是誰在敲打我窗：AI行為辨識的應用

圖7-9 口鼻被異物覆蓋的偵測

相關熱門文章推薦

名家觀點

立即訂閱