FINDIT
2022.06.21

【新興領域/2022.6焦點】CB INSIGHTS《2022年值得關注的人工智慧趨勢》到底說了啥?

國際知名投資分析機構CB Insights在2022年5月25日發布了「2022年值得關注的人工智慧趨勢」(AI trends to watch in 2022)研究報告,並在報告中提出七項人工智慧發展的重要趨勢。本文就上述研究報告進行摘要整理,並將相關知識作為背景資料進行彙整,以協助讀者快速掌握研究報告的重點。

 

趨勢一:保護隱私的合成數據(Synthetic data for privacy)

從醫療保健到金融領域的應用,企業正在兼顧遵守「通用資料保護規範」(General Data Protection Regulation;GDPR)和其他隱私保護法的前提下,正透過合成資料來實現數據共享和協作的目的。「合成資料」的出現,是為了保護原始資料所可能帶有的隱私資料或機敏資料,或是因法規或現實之限制而無法取得或利用研究所需資料的情況下,透過統計學方法、深度學習、或自然語言處理等方式,讓電腦以「模擬」方式生成研究所需之「合成資料」並進行後續研究跟利用,透過這個方法,資料科學家可以在無侵犯隱私的疑慮下,使合成資料所訓練出來的分類模型(classifiers)不會比原始資料所訓練出來的分類模型差。

由於獲得充足的真實數據來訓練AI,在各個產業應用領域中是可遇不可求的;例如:在行車環境中的行人、汽車、號誌、人行道上的硬體設施等,因為考量隱私權問題,會造成影像可能遮蔽或部分數據的缺失,進而影響人工智慧的訓練與判讀。因此,實務上需要以電腦模擬或演算法產生出含有註釋資訊的合成資料,以補充資料在蒐集上缺漏的問題。儘管合成資料在安全性與隱私方面有其優點,但與真實資料相比難免存在些微落差(至於該落差是否關鍵,就須視應用場景而定了),但科技公司仍對於合成資料技術開發感到興致勃勃。

成立於1988年的美國生技公司Illumina,正與新創公司合作,使用合成基因數據Gretel進行醫學研究。過往個人基因是個人隱私,而合成數據中包含個人的敏感數據,但無法被識別或追溯是那些個人,因此可以規避法律以及繞過患者同意等障礙。

關於金融領域的應用,摩根大通正在利用合成資料訓練財務AI模型,而西班牙電信公司Telefónica則使用Mostly AI創建符合GDPR的客戶合成資料,形成能反映出真實客戶的特徵數據;以避免過去在電信客戶中,有高達85%的真實客戶資料因缺乏同意,導致該電信業者無法使用,造成行為分析和預測困難。

在新創公司的案例方面,2022年3月,以色列醫療數據新創MDClone獲得6,300萬美元的投資,主要投資者為Warburg Pincus、Viola Growth、aMoon、LightSpeed Venture Partners和OrbiMed等。MDClone所開發的獨家數據庫,可以生成結合真實和虛擬患者的數據,並貼合實際數據的特徵;在不暴露患者隱私下(去識別化,也無法用交叉驗證識別出患者),讓業者應用醫療數據進行測試。

目前合成資料的產生仍處於早期階段;但數據匿名化、能規避隱私權限制和低度偏差的特性,使其成為人工智慧解決方案供應商有吸引力的選擇。

 

趨勢二:670億美元的晶片之戰(The $67B chip race

人工智慧已逐漸深入各行各業中,除結合各式的軟體與雲端服務外,對於硬體的需求,如雲端數據中心、邊緣設備等都需要晶片的支援。

由NVIDIA生產的GPU晶片,不但為人工智慧、數據分析和高性能運算應用程式的數據分析提供動力外,也開啟了價值678億美元人工智慧晶片市場。

Google所開發的Pixel 6手機使用了自家開發的處理器Tensor,嘗試透過硬體找到人工智慧應用的優勢。另一個科技巨頭亞馬遜則於2021年第4季推出基於Arm架構設計的人工智慧推理應用晶片「Graviton3」。除了上述大型科技公司外,新創公司也加入了晶片市場的競爭。

成立於2015年的Cerebras Systems在2019年發布發表了一款有史以來最大的半導體運算晶片,擁有2.6T電晶體和85萬內核的AI工作負載;該公司分別在2019年11月獲得2.72億美元E輪投資,又在在2021年第4季獲得2.5億美元的投資,合計股權募資7.2億美元,估值達43.5億美元。

然而,對於許多日常的AI應用來說,由於空間和能量的限制,龐大的晶片並不實用;因此越來越多的科技公司正持續開發低功耗的人工智慧晶片,以應用於汽車、相機儲存、自動化工廠的機器人等。硬體設備上的AI處理器可以實現低延遲、高度隱私保護的體驗。新創公司如Syntiant和Kneron等,各自募集了超過1億美元的資金用於開發這項技術。此外,Untether AI和HOUMO.AI等新創公司也正投入於記憶體內運算(Computing in Memory);這種技術可說是AI處理器架構的一種,數據先在記憶體進行運算,再將運算結果傳至處理器,集運算與儲存功能的於一體的元件。

另一個AI晶片獨角獸是一家總部位於英國的Graphcore,於2022年3月初推出了一款新的人工智慧處理器Bow IPU,是使用台積電的3D WoW(Wafer-on-Wafer)的創新製程技術,同時堆疊同質或異質晶片,並且縮小產品晶片尺寸,使得訓練神經網絡的速度提高了40%,功耗降低了16%,大幅提升系統效能。除了在封裝技術的精進,也有科技公司轉向光子處理器來改善晶片,新創公司如Lightmatter、Luminous Computing積極投入在矽光子晶片的研究,以應用於能夠處理特別繁重的演算法。最新例子是,研發矽光子技術的新創公司Ayar Labs,其矽光子(silicon photonics)晶片技術,可使用光訊號取代銅線作為晶片間的訊號互聯(也稱為optical I/O),較現行I/O技術具有高頻寬、低延遲性及低耗電等優點,可實現新式異質、分解式運算系統設計及統一記憶體架構。在今年4月26日Ayar Labs宣布已從包含輝達(Nvidia)在內的投資者籌得1.3億美元資金。根據PitchBook的數據,矽光子新創公司去年籌資超過7.5億美元,較2020年增加一倍,也遠高於2016年的1,800萬美元,前景看佳。

展望未來,新技術的出現將使這些晶片效能更好,功耗更低;未來量子電腦與量子運算等尖端技術也將結合機器學習,運行人工智慧的的效率將有機會大幅提升。

 

趨勢三:虛擬世界的秩序維護(Protecting virtual worlds

在暗網世界(Dark Web)中充斥著各式有害的內容,有時也在社群平台以不同的樣貌呈現與流傳;虛擬世界作為網路的新疆土,也開始有不安全或不道德的資訊內容在此散播。為此,也開始有科技公司使用人工智慧的解決方案,嘗試偵測遊戲和其他虛擬空間中的有害行為。在美國,參與線上遊戲的人數不斷增加;在此之中,美國線上遊戲人口中有78%都是18歲以下的青少年,這引發了人們對兒童或青少年可能接觸到不適當或充滿仇恨的內容感到不安。

檢測線上仇恨言論並不是一個新議題;例如:Meta在2016年至2021年期間,在內容審核上花費了130萬美元,而TikTok則在2020年宣稱投入10,000人力從事內容審閱工作。

有鑒於網路平台與遊戲內的不適當行為所造成的困擾,新創公司Spectrum Labs嘗試透過自然語言處理方式(Natural Language Processing;NLP)將音訊和文字對話內容進行查核,除降低50%的工作量,識別出的不當內容也提升了10倍以上。成立於2020年的遊戲管理新創公司Good Game Well Played(GGWP)嘗試在遊戲中插入審核系統,針對遊戲內語音和遊戲進行的熱度來進行審查的強化。該公司於2022年3月獲得來自Makers Fund、Griffin Gaming partners、Sony Innovation Fund以及Riot Games等投資單位1,200萬種子輪的資金。另一案例則是成立於2013年致力於社交平台內容審核解決方案的Hive;透過訓練資料庫的建立以API方式進行串接,使用者可得以用低度的程式編輯與Hive的人工智慧模型進行整合,以自動檢驗影片、圖片、文案等內容(針對玩家仇恨言論、網路霸凌等內容)。2021年4月,Hive獲得D輪8,500萬美元的投資,估值來到20億美元;主要投資者包括:Glynn Capital(領投5,000萬美元)General Catalyst、Tomales Bay Capital、Jericho Capital以及Bain & Company等。

由於內容審核與檢驗的重要性,大型科技公司也在此領域搶占解決方案市場;例如:2021年10月微軟收購了從事人工智慧內容審核服務的新創公司Two Hat,Two Hat主要為線上社群平台提供保護措施,其AI支持的內容審核平台每月對超過1,020億人次的互動進行分類和過濾,包括消息、用戶名、圖像和視訊。

要做到完美的內容審查是非常困難的一件事,隨著線上遊戲與社群不斷的調整與規避平臺的審查,檢核難度將越來越高;透過以人工智慧為基礎的檢驗方式,將有助於平臺在不適當內容的爭戰中取得優勢。

 

趨勢四:消滅深度偽造(Weeding out deepfakes

「合成媒體」(Synthetic media)為影視內容(如:影片、圖片、聲音等)的合成變造,其使用AI來生產或編輯影像、聲音或文字,在疫情帶動的數位化風潮中逐漸普及,不但可以透過AI創造或合成人類與動畫製作成虛擬人物,用來直播或播送新聞內容,也可用來協助消費者進行虛擬穿搭體驗,在消費者無法實際進入零售商店時刺激銷售。

「合成媒體」如果用於惡搞或是娛樂,能讓人產生會心一笑;然而透過與部分事實的資訊混合,卻可能形成暗示或甚至造成人或事件的傷害。2021年臺灣就出現網紅小玉(朱玉宸)利用人工智慧軟體的變臉技術,將高知名人士如:藝人、網紅與政治人物等族群之臉孔與腥羶影片進行合成,並透過社群網路進行渲染,進而影響選情,使知名人士的名譽受損。除了假新聞和假政治情報,企業可能是深度偽造的受害者之一,而消費者更可能落入網路釣魚和勒索詐騙的圈套之中。

CB Insights與日經新聞(Nikkei)報導,合成媒體這項新技術可以用快速且低成本方式,創造出具有高度擴展性的數位內容,可能對品牌廠商與零售業接觸消費者的方式帶來重大改變。但另一方面這項技術也能快速製作虛假內容而引起倫理上的爭議。

有鑑於假資訊所造成的問題,微軟在2020年發布了兩項重要工作。首先是一項名為「Microsoft Video Authenticator」的新技術,可以分析靜止的照片或影片,以提供媒體被人為操縱的機率或信心分數。另一個則是微軟與Adobe和BBC等合作夥伴一起推出的「Project Origin」,該項合作計畫除了可以偵測被變造過的內容,也可以確保媒體內容的真實性。

除了建立夥伴關係,微軟還分別與新創公司AI Foundation(美國人工智慧新創,為一個營利與非營利的雙重組織,其開發的人工智慧解決方案,都確保在不傷害人類或社會的前提下進行;該組織主要領導人包括:Twitter聯合創辦人 Biz Stone、Trion Worlds創辦人Lars Buttler等)合作。2020年AI Foundation獲得1,700萬美元的資金,用於構建深度偽造臉譜,同時還宣布推出深度偽造檢測平臺;與微軟的合作則是一項名為Reality Defender 2020(RD2020)計畫,美國廣播公司ABC、美國國土安全部和國防部都參與其中。

基於不同技術的解決方案,Truepic將密碼學和區塊鏈的技術應用於照片和影片識別;Truepic也支援高通晶片,加入了加密機制,可確保設備(如智慧手機)上照片的真實性。2021年Truepic獲得B輪2,600萬的投資,主要投資者為M12(微軟的創投基金)、Adobe、IGV(Sony的創新基金)、Hearst Ventures和Stone Point Capital等。

對於日益嚴重的威脅,科技公司持續加大對網路資料的驗證,但深度偽造的資訊無所不在,這將迫使科技公司持續尋找新方法來檢測和消弭這類資訊。

 

趨勢五:AI編程(Augmented coding)輔助工具

人工智慧的演算法需要層層的程式編輯,隨著開發人員以及「open source」的倡議,有越來越多的程式被工具化、操作介面更加友善;人工智慧軟體的新浪潮正逐漸湧向開發者以及企業內的軟體工程人員,愈來愈多人工智慧的編程工具出現。

Copilot(詳見:https://copilot.github.com/)是GitHub於2021年6月29日推出的AI程式碼工具,基於OpenAI加上GitHub上大量的原始碼,幫助軟體開發人員進行程式編寫。在你寫程式的時候依照內文給予你相對應的建議。官網聲稱可以達到四成以上的正確率,也就是說可以少寫四成以上的程式碼。GitHub在2018年被微軟收購,主要服務為線上軟體原始碼代管服務平臺,OpenAI是位於舊金山的人工智慧公司,2019年獲得微軟10億美元股權投資。

除了微軟的布局外,也有其他大型科技公司持續關注AI編程輔助工具。2022年2月,Google的DeepMind就發布了「AlphaCode」,一個可以自動生成程式碼的人工智慧工具。過去非軟體開發業者要應用人工智慧的解決方案,一則是自己公司內部聘請軟體人員進行開發,亦或是將該專案委託給軟體整合公司進行開發;無論是哪一個方案,跨業的解決方案開發,相當依賴產業內的知識以及開發人員的能力。編寫程式和理解產業的問題,需要取得溝通上的平衡。

相對於科技巨頭的布局,新創企業更專注於軟體檢測;該領域的代表性新創包括:Mabl(主要投資者為CRV以及前身為Google Ventures的GV)、Autify(主要投資者為Salesforce Ventures)和牛津大學的衍生公司Diffblue(2022年第一季獲得1,000萬美元的B輪投資)。目前看來自動編寫程式還處於起步階段,但對於近期Low-Code / No-Code(低代碼/無代碼)的發展有相乘的作用;非技術人員能在簡易編程或甚至無須編寫程式的條件下,導入人工智慧的解決方案於個別企業中,大大降低了技能差距並縮短生產週期。

 

趨勢六:多模態人工智慧(Multimodal AI

以人類的五感為例:人類可以透過「看」和「品嘗」蘋果,以進行水果種類的識別。如果蒙上眼睛,進行淺嚐,以能快速識別自己在吃蘋果;而即便只能看,也能識別出蘋果。如果將其變成蘋果泥,不具蘋果原本外觀,透過顏色、香氣、品嘗的口感,人類也可能驗證出自己面前的食物是蘋果。透過不同資訊的排列組合與判讀,讓多個人工智慧模型聯合推斷出更精準的結果即為「多模態人工智慧」。

「模態」(Modality)是德國理學家赫爾姆霍茨提出的一種生物學概念,即生物憑藉感知器官與經驗來接收資訊的管道,如人類有視覺、聽覺、觸覺、味覺和嗅覺模態。多模態是指將多種感官進行融合,而多模態互動是指人透過聲音、肢體語言、資訊載體(文字、圖片、音訊、視訊)、環境等多個管道與計算機進行互動,充分模擬人與人之間的交互方式。

在人工智慧的資料處理中,任務與訓練多半是單一的;例如進行圖像識別任務,以產生出描述圖像的單字或詞彙,如果只處理單一訊息AI的訓練較容易,如果要複雜成產生一個句子,就必須要考慮上下文的語意,以避免產生偏差的結果。

近年科技公司在多模態人工智慧發展方面取得了大幅的進步,讓工程人員可以從多種模式中應用AI模型,例如:結合影片、文字、2D圖片等內容來源,進行搜尋和內容建置的改善;換句話說,以影片做為資料訓練AI模型,進行影片內的預測,如能進一步搭配文字訓練的模型以及2D圖像等多個訓練模型,將單一個模型進行多緯度資訊的概念化,有助於對影片內容預測的表現。

 

 

關於多模態人工智慧近年的發展案例,在2021年1月,OpenAI訓練了一個名為DALL-E的模型,它可以根據文字描述生成圖像;2022年4月OpenAI發布了DALLE-2(詳見:https://openai.com/dall-e-2/),改善了原始模型的輸出圖像分辨率,比原本提高了4倍,製成的圖片也更加精緻和逼真。如果只依據文字描述,「TREE BARK」應該要出現「樹皮」的圖片,在不考慮文字上下文的語意下,可能出現的圖片是描述「對著樹吠的狗」;這段進步的過程就是多模態人工智慧所做出的貢獻。

2022年5月Google也推出了文字轉圖像模型「Imagen」,與OpenAI的DALL-E系列模型相比,其模型能對語文做出深度理解,依據文字所生成的圖像,與語意吻合度相當高,具有高度擴展性並能突破想像力的框架(詳見:https://imagen.research.google/)。

多模態人工智慧正在走出學術研究實驗室,邁向實際應用。例如:Google正在利用多模態人工智慧來改進搜尋引擎;未來使用者可以透過對自己的登山鞋拍照,透過上傳照片做出:「我的鞋適合用於在富士山健行嗎?」這類的延伸性諮詢問題。而AI模型則透過影像識別、網路上搜尋關於鞋子的結果、富士山的文字與圖像描述以及相關影片等數據,模擬出相關答案。

在新創公司方面,Twelve Labs在2021年3月獲得了512萬美元的種子輪投資;投資者包括:Index Ventures(領投)、Radical Ventures、Silvio Savarese、Index Ventures、Expa等機構投資人,以及人工智慧研究員史丹佛人工智慧研究室主任李飛飛等數位個人投資者。Twelve Labs正在開發的AI模型,能從影片中截錄出關鍵特徵,例如:動作、動物、物品、影片中字幕或文字、語音以及人物等;將資訊其轉換為向量,以支援延伸性的語意搜索。

 

 

趨勢七:端到端機器學習(End-to-end machine learning

物聯網市場破碎的特性,一直以來都是有待克服的障礙;這部分挑戰也在人工智慧應用與開發的過程中出現了。然而,隨著端到端機器學習的應用擴張,有助於數據管理的實踐,也對使用者更加友善。

這種人工智慧優先的策略,說起來容易做起來難。從數據採集開始,到隨後的資料建置、數據清理、訓練數據與參數調整,一路到模型開發、布署模型、後期的模型表現監控等;開發人員要將機器學習模型實際投入到生產的機器學習作業(Machine Learning Operations;MLOPs)過程,並非一蹴可幾,中間的步驟繁雜,為因應不同產業的硬生產流程差異,有時也需要在其中幾個步驟中重複測試與驗證。一旦方法論或數據驗證達不到標準,企業用以生產或運行分析可能會招致失敗或產生其他負面影響。端到端機器學習解決方案的供應商,需要整合多個AI生命週期管理流程中的步驟於單一個SaaS產品中,使得數據變得易於模型訓練和布署,得以推動大規模模型布署和訓練,而在數據監控管理、品質和合法性,乃至於資料與模型處理的過程可視化,甚至連接並運用更豐富的資料來源也都變得更加容易。

這類型的產品富有擴展性,可望成為企業布建人工智慧系統的最佳選擇之一。2021年5月Google即發布了一個端到端的AI開發平臺「Vertex AI」,其定位為一站式AI代管機器學習平臺,讓沒有機器學習經驗的人,能在較少的程式編撰下進行模型訓練。除科技巨人外,「DataRobot」,一家估值63億美元,成立於2012年並入選CB insights全球百大人工智慧公司,主要提供企業機器自動學習的預測分析平臺;DataRobot三大優勢為自動化、透明化、文件化,能根本解決演算法「黑箱」(Black Box)的特性,讓預測結果有能被解釋與更加劇可信度。DataRobot不斷積極擴展,CB Insights研究報導指出截至2022年DataRobot就進行了3次收購的交易,以獲取更大的企業人工智慧市場份額。

除上述重要事蹟外,DataRobot的機器學習平臺也在無程式碼和低程式碼功能的領域起了很大作用;透過隨插即用的功能來彌補AI人才缺口,讓非資科學的專家,也能運行人工智慧的專案。Databricks在2021年10月獲得投資時,估值達38億,也成為全球第二高估值的AI獨角獸;同時Databricks在2021年的第二筆並購交易中收購了德國無代碼公司8080 Labs(2020年6月Databricks於第一次的併購交易中收購了專注於數據可視化的以色列開源軟體公司Redash)。

 

結語

從上述趨勢報告可觀察到,人工智慧的七項趨勢多半處於萌芽期,具體應用雖逐漸明朗,但市場對於解決方案的願付價格仍處於朦朧不明的階段;未來在市場堆有很大的發展空間,對於臺灣的AI新創需持續關注上述七項重要趨勢未來發展的成長力道。科技巨頭已作為布局的重點,新創應以延續或合作的角度作為快速切入策略,並時時留意關鍵需求者,在市場中採用人工智慧解決方案的成長速度,方能掌握成長契機。

 

參考資料
  1. ETtoday新聞雲, “網紅「小玉」變臉A片賺1300萬起訴 最重可判30年徒刑”, 2022-03-17, https://www.ettoday.net/news/20220317/2209765.htm
  2. 微軟新聞中心(2022), ” 微軟打擊假資訊的新方法”, https://news.microsoft.com/zh-tw/features/new-steps-to-combat-disinformation/
  3. Alberto Romero (2022), “DeepMind’s AlphaCode Explained: Everything You Need to Know”, 2022-05-09, https://towardsdatascience.com/deepminds-alphacode-explained-everything-you-need-to-know-5a86a15e1ab4
  4. CB Insights, “AI trends to watch in 2022”, 2022-05-25, https://www.cbinsights.com/research/report/ai-trends-2022/
  5. MetAI,【AI 論文解析】擊敗近半數工程師 AlphaCode 背後的原理, https://www.youtube.com/watch?v=qHf_aHZXZCQ
  6. Techcrunch (2022), “Hive raises $85M for AI-based APIs to help moderate content, identify objects and more”, 2022-04-21, https://techcrunch.com/2021/04/21/hive-raises-85m-for-ai-based-apis-to-help-moderate-content-identify-objects-and-more/