FINDIT
2021.11.24

【新興領域:11月焦點8】疫情下企業AI轉型利器-談企業級人工智慧的發展與應用趨勢

人工智慧(AI)開始被視為繼網際網路與智慧型手機的發明之後,必將會帶來第三次重大改變人類生活的科技革命。相較於過去五、六年前,新創公司只要宣稱有用到AI技術,估值就一飛沖天,這種過度吹捧的現象,在愈來愈多新創湧進與市場的洗牌下,現在已不復存在。如今的AI新創的產品必須要隨插即用(Plug and play),快速、有效解決企業問題的商業價值,並讓企業或客戶買單,才能夠脫穎而出。然而在各方呼籲企業要導入AI,進行產業的數位轉型,但一般的企業公司若想要導入AI,該從何開始下手呢?究竟有哪些工具可以力助企業導入AI轉型?本文根據CB Insights「Enterprise AI Trends To Watch In 2021」一文,整理七個2021年當紅的企業級AI的發展趨勢,同時補充代表性的案例,讓大家能更能掌握這些力助企業解決問題的AI工具與商機。

產業應用人工智慧(Artificial Intelligence,AI)來創新營運模式,已經成為一股顯學,愈來愈多的企業正在加速轉型步伐,以便在競爭的環境中取得優勢。根據CB Insights「Enterprise AI Trends To Watch In 2021」一文,指出目前企業級AI技術的發展有七大趨勢:(1)無程式碼/低程式碼(No-code/Low-code) AI平台興起;(2)智慧維運AIOps協助IT和DevOps自動化,越來越受歡迎;(3)圖像神經網路(GNN)成為科技巨頭們最新的應用;(4)事件串流數據處理(Stream processing)-擷取即時物聯網數據作為AI應用;(5)分析供應商增加了對非結構化數據類型的支持;(6)機器學習語言Transformers促使企業自然語言處理(NLP)發展迅速;(7) 數據治理(Data governance)和可解釋的AI(explainable AI)日益重要。以下分別探討此七個趨勢的成因、解決方案與代表性供應商的案例。

 一、無程式碼/低程式碼(No-code/Low-code) AI平台興起

在AI浪潮席捲全球之際,要從硬體世界過渡到軟體世界的過程中,最困難的是莫過於人才難尋,大型企業可以花大錢延攬資料工程師、資料科學家、演算法工程師、領域專家,甚至乾脆收購AI新創,協助企業數位轉型。然而無論是搶人才或投資,往往是中小企業無法承擔。

(一)低程式碼或無程式碼的定義與優點

考量到企業的需求與痛點下,低程式碼或無程式碼的AI平台便因應而生,Low-Code的意思就是使用「較少的程式碼」進行開發,像是利用圖像化的使用者介面(UI),以及點擊、拖拉、選單等直覺、簡易的操作方式,取代部分程式碼的撰寫;No-Code則是更進一步,在「不需要寫任何一行程式碼」的狀況下,部署AI和機器學習模型。無程式碼/低程式碼的AI平台的簡易操作方式,最大的特色是隨插即用(Plug and play),可以協助非IT技術的人員,如業務、行銷、研發與倉儲採購人員快速上手,進行數據分類、資料分析、驗證並輕鬆構建準確的模型。

無程式碼/低程式碼AI平台的優點,包括:(1)時間與人力成本遠低於客製化AI:使用 No-code 平台建立一個AI模型,可能只需要不到一天的時間,但若從頭開始開發一個客製化的AI模型,一般需要幾週至幾個月的時間,並且需要聘用整個技術團隊才能達成。(2)容易調整使用情況:使用平台以及模組化的AI模型,可以根據不同公司的需求做出調整,雖然No-code 平台不會是完全客製化的服務,但通常可以滿足客戶的需求。(3)客戶支援與知識庫:No-code 供應商會提供技術支援,以及文字和影音形式的使用指南,協助解決用戶使用上的問題,公司也不須負擔維護的人力成本。

(二)市場潛力

潛力無窮的發展性帶來龐大市場商機,無程式碼平台是高速成長的市場,根據Gartner調查,2024年將有65%的企業將採用無程式碼平台進行企業轉型,而其中的75%將至少部署四種以上平台類型。Global Newswire認為至2030年,平台的年複合成長率將達31%,且整體產業的營收將達1,800億美元。

(三)新創案例

新創軟體業者擅長用底層技術開發無程式碼平台,打造各種上層應用工具以解決數據處理與建模人力不足的問題。

1.Obviously AI 提供視覺化平台,進行AI數據分析

Obviously AI創立於 2019年,總部位於美國加州,「不需要程式碼的數據科學」(Data Science without Code)為標語,2021年5月獲得種子輪360萬美元的投資。Obviously AI 使用了最先進的自然語言處理,來對使用者定義的 CSV 資料執行複雜的任務。你可以上傳資料集,選取要預測的欄位,並透過自然語言輸入問題來評估結果。這個平台可以為你選擇對的演算法,來訓練機器學習模型。使用者只需要點擊幾個按鈕,就可以獲得預測報告(像是預測收入或存貨需求),這可以幫助想踏入人工智慧領域、卻沒有專屬資料科學團隊的中小型企業。

2.詠鋐智能(Chimes AI)的無程式碼AI平台:Tukey

Tukey平台是成立未滿一年的詠鋐智能(Chimes AI)公司打造No-Code AI平台,協助台塑石化廠在短短三個月內監控400台不同廠牌、不同機型的機台,透過Tukey平台,加速建模速度,支援客戶自建演算法,讓AI專案的執行時間從180天縮短至3天。

Tukey的No-Code AI產品設計,提供非機器學習演算法專家 (譬如:銀行理財專員、電商營運專員) 簡單直覺的操作介面,讓直接面對營運問題的一線人員,迅速完成AI模型建置,提升工作效率。Tukey也可以完整追溯資料專案的資料歷程,在需要跨部門團隊協作的場合,彌平認知落差,亦可與他人進行跨平台的協同運作,增加工作的一致性與正確性,進而提升工作效率。

3.InfuseAI以MLOps平台成為各產業導入AI的動力

工合股份有限公司(InfuseAI)於2018年6月成立,由台灣知名自由軟體程式設計師、在零時政府g0v社群暱稱為高村長的高嘉良與知名售票網站KKTIX的營運長暨共同創辦人薛良斌共同創辦。因應人工智慧時代來臨,看準企業對打造AI工作環境的需求愈趨增加,提供易入門軟體解決方案,降低企業導入AI/ML技術門檻,無需繁複、枯燥的安裝過程,就能應用人工智慧技術、滿足所需應用。InfuseAI的核心產品首推MLOps平台-PrimeHub機器學習平台,涵蓋了AI 模型開發、訓練管理,到營運面的部署、監控,提供企業一站式產品服務,使用者導入MLOps流程,就能打通AI的各種環節,快速打造一體化機器學習環境,客戶包含玉山銀行、永豐金控、奇美實業等。其次,從2020年初,InfuseAI投入MLOps維運端解決方案的開發,發展出另一條產品線PrimeHub Deploy,透過提供更簡單易懂的管理介面大幅減輕了部署、營運和即時管理的負擔,在平台中串起從AI開發到維運的全生命週期循環,已經在去年上線。從PrimeHub到PrimeHub Deploy,InfuseAI要透過兩套產品串起從開發到維運的AI全生命週期循環。

深耕AI產業MLOps領域的InfuseAI於2021年4月6日宣布完成430萬美元的A輪募資。此輪募資由緯創領投,其餘投資人包括國內規模最大的益鼎創投、專注於早期AI與資料新創的蜂行資本(Hive Ventures)、矽谷台灣天使群(SVT Angels)、國際知名創投500 Startups,以及一些天使投資人等。成為臺灣首家挺進MLOps市場的本土新創。

4.行動貝果(MoBagel)的AutoML平台Decanter AI

創立於2011年,在2014年即開始轉型跨入AI領域,行動貝果主力產品AI數據分析系統「Decanter AI」,整合傳統機器學習演算法、時間序列以及深度學習演算法,可以大幅降低資料分析人員手動寫程式與優化參數所需時間,最多能將原本長達六個月的數據分析專案縮短至兩周左右,主要將用於行銷成效預估、庫存預測、生產線機器壽命預估等應用。

Decanter AI提供「自動資料清理與前處理」、「GUI 簡單直覺」、「全自動建模」、「APU 輕鬆對應各商用場景」、「API 串接」、「What-if Analysis 情境模擬」等功能,協助企業員工從耗時費神的重複性工作中解放出來。目前Decanter AI已經應用在零售服務業、製造業、廣告行銷、電信業、金融保險業、政府工部門等行業,協助上百家企業數位轉型,包括:中華電信、味全、研華、緯創等。

2019年行動貝果完成 A 輪募資1.5億新台幣,由世界前五大電子設計代工廠緯創資通領投,其他參與投資人包括群益創投、第一創投、交大天使基金等。累計募資近2.5億新台幣。

 

二、智慧維運AIOps協助IT和DevOps自動化,越來越受歡迎

(一)企業IT部門的痛點與智慧維運AIOps的定義

隨著企業IT基礎架構因為混合雲技術、分佈式數據庫、容器化和微服務架構變得越來越複雜,在這些環境中的應用程式和系統也會產生海量的資料。事實上,顧問公司Gartner 預估,企業 IT 基礎架構平均每年產生的 IT 作業資料會多出二至三倍。傳統的網域型 IT 管理解決方案無法跟上數量的增長速度,它們無法聰明地從如此巨量的資料中整理出重大事件。,也難以在彼此不同但相互依存的環境之間建立資料關聯。同時,也無法提供IT作業團隊所需的即時洞察及預測分析,以足夠快的速度來回應問題,進而符合使用者與客戶服務水準的期望。為解決此一問題,智慧維運AIOps(Artificial Intelligence for IT Operations)越來越受到重視。

何謂AIOps?根據IBM對AIOps的定義是以單一智慧型自動化 IT 作業平台來取代多個獨立的手動 IT 作業工具, 藉此讓 IT 作業團隊能夠更快速、甚至是更主動地回應減速和服務中斷情況,而且還能大幅減少工作。具體而言,AIOps 可使用大數據、分析及機器學習功能來執行下列作業:(1)收集並彙總由多個 IT 基礎架構元件、應用程式及效能監視工具所產生之大量且不斷增加的作業資料;(2)智慧地從「雜訊」中過濾出「信號」,以識別與系統效能及可用性問題相關的重要事件及型樣。(3)診斷主要原因並將其回報給 IT 以進行快速回應及補救,或在某些情況下,自動解決這些問題而無需人為介入。

(二) AIOps新創獲投

根據CB-Insights的統計,AIOps新創的總募資金額從2016年的1.02億美元成長到2020年6.2億美元,隨著企業數位轉型腳步加快,智慧維運的需求激增,也吸引投資人對AIOps新創的重視,投資金額逐年遞增。

圖8-1  AIOps新創募資金額與件數

 

(三)AIOPs的新創案例

1.Harness運用AI自動化消除DevOps瓶頸

Harness是一家舊金山AIOps新創,使用機器學習來自動化CI/CD(持續整合和持續交付,或處理頻繁的應用程式程式碼更改),Harness的平台可以減少90%的腳本編寫,將部署相關的錯誤減少95%~99%,並將DevOps效率提高四倍。這個平台部署新代碼所需的平均時間減少了88%(從兩天減少到兩小時),開發人員的新員工培訓時間減少了90%。

2.奔騰網路打造自動化維運平台「Marvin」

奔騰網路(Pentium Network)科技團隊自 2017 年成立,主要的產品是支援混合雲與多公有雲的的一站式AIOps自動化維運平台(Marvin AIOps Platform),結合DevOps、ChatOps與 AIOps等三種技術,為擁有龐大而複雜的IT基礎架構的企業客戶,提供開箱即用、一目瞭然的一站式自動化維運平台,搭配整合即時通信 (Instant messaging)可隨時隨地使用的交互式聊天維運機器人,滿足企業支持各種IT資源種類、各種公有雲服務、多種應用服務、以及多部門多專案的各種複雜排列組合下的維運管理需求,可以提升IT維護與營運的效率和品質。利用演算法、自動化腳本的檢測方法,當系統操作錯誤、電腦維護、程式版本相容處理或使用者軟體更新等情況發生,平台會在第一時間透過 ChatOps通知 IT 人員,IT 人員不用親自到現場進行確認,僅需要透過手機「一鍵式」就能遠端解決問題,大量降低了維運誤判的警報通知。

3.Snyk運用AI建構自動化開源程式碼安全平台

Snyk在2015年成立於英國倫敦,後續在波士頓、加州聖克拉拉、特拉維夫和渥太華、蘇黎世等都設有辦公室,目前總部設於波士頓,是以開發人員為主的應用程式安全專家。公司主要目標是幫助企業快速開發、擴展和保護其應用程式,具體的方式則是替開發人員修復開源代碼、開源庫、容器基礎設施以及應用程式的安全問題。

以Snyk官網最新發布的亞馬遜網路服務(AWS)CodePipeline合作案爲例,Snyk在幫助AWS CodePipeline在內部打造一個新的控制台,允許它的用戶無需離開AWS控制台,便可在自己部署的管道內建構自動化安全控制,並使他們在AWS上構建雲的原始應用程式時,能夠更有效地在開源軟體代碼中,發現並修復安全性漏洞。

到目前為止,全球已有超過2,700萬開發人員正在使用Snyk工具;此外,Snyk也提供開源工具,讓開發人員可運用各類工具找到程式裡的漏洞,甚至是替安全編碼人員提供了一個可推銷自己工具的Snyk平台。由於Snyk在開源程式碼安全領域位居領先者地位,備受投資人青睞。根據Crunchbase的數據,從2015年成立迄今股權累計獲投達12.3億美元,2020年完成C輪1.5億美元、D輪2億美元的募資,2021年也接續得到E輪1.75億美元、F輪6.05億美元超額認購。

 

三、圖像神經網路(GNN)成為科技巨頭們最新的應用

圖像神經網路(Graph Neural Network,以下稱GNN)是用於圖結構數據的深度學習架構,目的在於對圖片的編程進行處理與訓練。例如社交網路圖、交通路線圖、人物關係圖、分子結構圖等等。這些資料都可以作為圖神經網路的輸入。之後經過特定的神經網路結構,可以完成對於圖表示的分類,圖的節點或邊的預測等功能。GNN將端到端學習與歸納推理相結合,業界普遍認爲其有望解决深度學習無法處理的因果推理、可解釋性等一系列瓶頸問題,是未來3到5年的重點方向。

(一)圖像神經網路(GNN)的應用場景

GNN應用相當廣泛,包括:社會影響的預測、電子健康記錄建模、藥物發現和合成化合物、商品推薦系統、交通預測、反洗錢、反詐欺、生成場景關係圖、鏈接預測、點雲分類與分割、人物互動、文本分類、序列標簽、NLP中的關係提取、姿態估計、晶片設計、粒子物理等。舉例而言,深度學習圖像神經網絡的即時反詐欺系統架構,可用於電商網站、直播、棋牌遊戲、社交應用等各種場景。協助企業檢測網路詐騙集團造成的刷單炒作商家信用、數據爬取、帳戶盜用、虛假申貸等非正常業務行爲。

(二)科技巨頭的應用案例

1.Amazon推出Neptune ML用於顧客保留、金融詐騙等服務

2017年Amazon推出了名爲Neptune的數據庫,並在2020年年底推出了Neptune ML。 Neptune ML 可以自動完成爲圖數據選擇和訓練最佳模型的繁重工作。與使用非圖形方法進行預測相比,使用 Neptune ML可以將大多數圖形預測的準確性提高 50% 以上。以往的機器學習方法對圖形進行準確預測可能會很困難且耗時,需要專業技能幷且成效不如預期。通過使用Neptune ML可以在數小時內創建、訓練和應用Neptune上的數據,而且無需學習新工具和技術。

2.Google運用GNN模型改進地圖的預估到達時間

Google與母公司Alphabet旗下的DeepMind AI研究實驗室合作,運用GNN進一步降低預測抵達時間的失準率,已經提升柏林、雅加達、聖保羅、雪梨、東京和華盛頓特區的路況預測準確度,使Google地圖在真的塞車之前,就能夠預測車程是否會受影響。

3. Twitter 運用GNN提出大規模圖像學習架構

2019 年Twitter 收購了Fabula AI,這是一家構建GNN模型藉以檢測操縱社群網路的公司,希望能藉由Fabula AI擁有的專利演算法,揪出流傳在平台的假新聞,改善對話環境。此外,2021年Twitter發表了關於深度學習在動態圖像的應用研究,提出大規模圖像學習架構-SIGN,藉由Twitter的用戶關注關係圖,來發展社群網路、金融交易和推薦系統之用。

4.阿里巴巴運用GNN支援電子商務的商品推薦

2019 年,阿里巴巴發表了一篇關於AliGraph 的論文,這是一個內部部署的圖像神經網絡系統,用於支持個性化搜索和電子商務推薦。該技術還在 2020 年中國光棍節期間用於在阿里巴巴的電子商務網站淘寶上生成家具等物品的3D模型。

 

四、事件串流數據處理(Stream processing)-擷取即時物聯網數據作為AI應用

物聯網的普及,使得物聯網感測器即時或接近即時收集的資訊量也非常龐大。根據國際數據資訊 (IDC) 預測,物聯網裝置數量在2025年之前會達到557億台,生成73.1 ZB的超大資料量。如何即時擷取、處理及分析事件串流(Stream processing)數據,可能已非傳統的批次處理方法和批量分析所能因應,因為有可能導致企業錯失機會。根據CB Insights的預估,到了2027年事件串流分析的市場規模將達520億美元,2021年到2027年間的複合平均年成長率更是達24.9%,顯示企業越來越依賴即時分析和決策能力的處理。面對龐大的事件流數據,企業愈來愈依賴人工智慧來協助自動解析來自各種來源的數據,以發現隱藏的見解,並即時做出智慧決策。

(一)支持事件串流數據生態系統的技術

目前有許多支援處理龐大即時性的串流數據的技術,包括:開源工具(OPEN-SOURCE TOOLs)與記憶體內運算(IN-MEMORY COMPUTING)。Apache軟體基金旗下擁有多個分佈式串流數據平台,可以降低了將串流資料與分析整合入企業工作流(Work Flow)的開發人員進入門檻。而LinkedIn參與開發的Kafka是目前最流行的服務之一。Kafka 是Apache軟體基金會下一個開源流處理平台,由Scala和Java編寫。該專案的目標是提供一個分散式資訊引擎與事件串流處理平台,經常用做企業的資訊息匯流排(BUS)、實時資料管道,有的還把它當做儲存系統來使用。Apache Kafka 最初由Linkedin 所開發,後來捐獻給Apache 基金會為開源專案。此外,分散式運算廠商,包括Redis、Hazelcast提供快速的開放原始碼記憶體內資料存放區,可做為資料庫、快取、訊息代理程式和佇列使用,從而實現低延遲和高輸送量的資料存取。與傳統資料庫不同,記憶體內資料儲存不需要存取磁碟,從而將引擎延遲縮減到微秒。因此,記憶體內資料儲存能夠支援更大規模的操作,而且回應時間更快。這項優勢提供超快速的效能,平均讀取和寫入操作時間低於一毫秒,並支援每秒百萬個操作。

(二)以AI自動化處理事件串流的案例

1.Cloudera收購Eventador加速其公有雲和混合雲的事件串流資料處理平台能力

Eventador 在2016年創立於美國德州奧斯丁,為一家為企業級雲原生即時資料分析公司,該公司核心技術是讓用戶更簡潔地透過SQL的方式來處理即時資料,加速Dataflow產品的演進並且使其具備更多的能力來應對更廣泛的使用場景。在2020年10月美國大數據公司Cloudera宣佈收購Eventador,藉以讓Cloudera的客戶在解決即時資料處理中有更多的選擇來解決其業務場景。

2.Hazelcast 釋出高速串流與批次資料處理引擎Jet 0.6

Hazelcast Jet 是一個分散式計算平台,專為高效能流處理和快速批處理而構建。它在記憶體資料網格(IMDG)中嵌入Hazelcast,以提供輕量級的處理器包和可擴充套件的記憶體儲存。

Hazelcast Jet是Hazelcast公司開源的一款,提供彈性可擴展、高性能的分佈式記憶體計算。Hazelcast Jet具並行串流核心引擎具有高性能低延遲的特性,其基於開源記憶體內資料網格Hazelcast IMDG的可嵌入分散式運算平台,能安裝於數萬個叢集上,能以接近即時的速度,應付資料密集型的應用,專為高效能流處理和快速批處理而構建。

圖8-2  Hazelcast 分散式記憶體數據庫架構

 

五、分析供應商增加了對非結構化數據類型的支持

(一)非結構化數據的成長

數位革命和大數據的崛起為一般企業創造了相當龐大的資料。大數據的出現催生了公司必須管理和保護各式各樣的資料類型。據IDC研究表明,到2025年,全球數據量將會從2016年的16 ZB上升至163ZB。著名研究機構Garter也表示,全球訊息量正在以59%以上的年增長率快速增長。而在這些數據中,結構化數據僅占到全部數據量的20%,其餘80%都是以文件形式存在的非結構化和半結構化數據,日誌文件、機器數據等又占據非結構化數據的90%。因此,龐大非結構化數據管理和運用對於企業來說愈來愈重要。

非結構化數據在各行各業中占比越來越多,比如金融行業的「雙錄」資料、醫療行業的影像資料、教育行業的教學文檔、傳媒行業的音影片素材,稅務工商,社保等各類業務辦理機構影像資料,公安執法的影像存檔等等,越來越多行業的企業組織都需要長期存放海量非結構化數據,業務對數據的採集、管理、應用的訴求也越來越多樣化。傳統、單一、陳舊的數據管理方式存在的容量、性能需求瓶頸,訊息孤島,管理困難,一次性建設成本高等弊端也慢慢暴露出來,合規的要求日益嚴格,業務應用也要求數據更具備實時性和移動性。如何更好地掌握和利用非結構化數據,成爲衆多企業亟需解決的問題。所幸目前新創或既有的雲端大數據供應商都紛紛推出支援非結構化數據擷取、分析的產品。

(二)非結構化數據解決方案的提供廠商案例

1.Snowflake從雲數據倉庫擴展至數據雲端平台,增加對非結構化數據的支援

Snowflake為全球領先的雲數據倉庫廠商,有鑑於持續受益於數據量爆發以及全球數據管理軟體雲化、數據管理功能融合等趨勢,營收來源亦由當前數據倉庫逐步擴展至數據分析、數據交易、數據集成等領域,(1)Snowpark拓展編程語言的支持:Snowpark使得數據工程師、數據科學家和開發人員可以使用Sql、Java、Scala或Python等熟悉的編程語言編寫代碼執行工作負載。(2)增加對非結構數據的支持:除了結構化和半結構化數據,Snowflake宣布將支持辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/影像訊息等非結構化數據。(3)Snowsight向BI領域延伸:Snowsight是Snowfalke SQL工作表的全新界面,用戶可以直接通過Snowflake執行數據可視化和分析。(4)數據交換平台快速滲透:截至2021財年Q3,公司Data Marketplace的數據提供商已經突破100家,新增S&P Global、Morningstar、Core Logic等知名數據商;23%的客戶使用了數據共享的能力。基於持續豐富的產品組合,Snowflake正在朝著綜合性的雲數據平台穩步邁進。

2.雲端數據管理領先者Rubrik收購非結構數據管理新創Igneous,擴展對非結構化數據的解決方案

Rubrik成立於2014年,提供了市場領先的雲數據管理解決方案,該解決方案可以跨數據中心和雲管理與協調數據,從而幫助企業在任何地方安全地恢復,移動和管理數據。全球超過2,500個客戶和政府使用Rubrik簡化跨混合雲環境的備份和資料復原,提供網路彈性協助抵禦勒索攻擊以及減輕數據隱私洩露和合規性罰款的風險。Rubrik成立迄今累計募資5.5億美元,估值超過30億美元。在2020年12月16日宣布收購Igneous。Igneous成立於2013年,總部位於美國西雅圖,是一家提供非結構化數據管理解決方案的新創,為以數據為中心的企業提供大規模的數據可視化、保護性和行動性服務。Rubrik表示將Igneous已構建的創新技術與Rubrik平台的強大功能相結合,將為其客戶帶來一流的非結構化資料管理解決方案,降低風險和優化IT資源利用率的同時實現其非結構化資料的價值。

 

六、機器學習語言Transformers促使企業自然語言處理(NLP)發展迅速

(一)加速NLP突發猛進的模型

自然語言處理是人工智慧(AI)的一個分支,這種技術主要是涉及將一部電腦加以訓練,使其能夠瞭解、處理並產生語言。搜尋引擎、機器翻譯服務與語音助理都是利用自然語言處理技術。近年來自然語言處理領域,得利於2017推出的深度學習模型Transformer,企業開發出諸如BERT 、Generative Pretrained Transformer (GPT)等AI語言模型的大規模運算、大資料集,和進階的訓練演算法,使得語言模型能夠具有大量參數,進行更豐富、細緻的語言理解,因此語言模型也能更有效地應用在相關的領域。例如:臉書用Transformer架構,打造出熟練7種任務的AI模型,且都用同一套參數;Latitude利用GPT-3生產AI Dungeon的網絡遊戲劇本、網頁搜尋服務平台Algolia運用GPT-3回答用戶搜尋的問題、微軟將GPT-3語言模型帶進Azure OpenAI。

(二) Transformer應用在NLP的案例

1.臉書新模型融合自監督和Transformer,不需標註資料還能揪出複製圖

臉書聯手法國國家電腦科學研究院Inria,共同設計一套新訓練方法DINO,融合了自監督學習(Self-supervised learning)和Transformer的注意力機制優點,來訓練電腦視覺模型Vision Transformer(ViT),不需要標註資料就能完成訓練。用這個方法訓練出來的模型,能準確辨識圖片和影片中的物件,也能進行語意分割,完全不需標註資料。

2.AI Dungeon文字冒險遊戲利用GPT-3生成劇情文本

猶他州的新創公司Latitude推出名為AI Dungeon的網絡遊戲,向用戶展示了一種全新的人機協作形式。該公司利用非營利的人工智慧研究組織OpenAI的GPT-3語言模型,創造出一款靈感源於《龍與地下城》的冒險遊戲。當玩家打出他們希望自己的角色執行的動作或對話時,演算法將生成個性化的、不可預測的下一階段的內容。根據報導此款遊戲吸引了每月150萬的活躍用戶。

3.網頁搜尋服務平台Algolia運用GPT-3回答用戶搜尋的問題

Algolia 是一個即時搜尋服務平台,你只需要向他們提供你的內容,Algolia 就能透過他們的技術,讓你藉由 API 在你的網站或程式當中使用他們的即時搜尋結果。Algolia在最新的產品Algolia Answers中整合了GPT-3,該產品允許客戶以自然語言查詢並快速取得答案,當Algolia以210萬則新聞來測試GPT-3之後,發現GPT-3回答問題的準確度高達91%,對於複雜自然語言問題的回答能力是Google BERT的4倍。

4.微軟將GPT-3語言模型帶進Azure OpenAI

微軟將OpenAI建構的GPT-3語言模型,正式接入旗下Azure OpenAI服務,藉此強化Azure雲端感知能力,讓諸多透過Azure雲端平台運作服務都能透過GPT-3語言模型推動的人工智慧更加「聰明」。在此之前,微軟已經將GPT-3語言模型應用在旗下Power apps應用內容,讓使用者能以零編碼方式編寫程式,或是透過口說方式建構數據算式。

 

七、數據治理(Data governance)和可解釋的AI(explainable AI)日益重要

(一)數據治理與可解釋AI的重要性

數據的搜尋、處理,和使用的規範對於建立合乎道德的AI解決方案,是至關重要的,並且需要在演算法中避免偏見(Bias)的產生。此外,隨著AI變得更加先進,人類面臨的挑戰是理解和追溯演算法如何得出結果。整個運算過程變成了俗稱的「黑盒子」,因無法對其進行解譯,它可能會造成不同行業及不同人員的困擾。可解釋性可以協助開發人員確保系統如預期般運作,在遵循法規標準時可能需要可解釋性,或在容許受決策影響者挑戰或變更該結果時,因此其重要性愈來愈受重視。強大的數據治理(Data governance)是可解釋的AI的基石,為了遵守 GDPR(General Data Protection Regulation)和CCPA(California Consumer Privacy Act 2018)等法規,AI供應商越來越關注AI的可解釋性、偏見和治理。

(二)數據治理和可解釋AI的案例

1.IBM 推出IBM Cloud Pak for Data平台來改善AI可解釋性

IBM Cloud Pak® for Data平台在統一的環境中提供資料及AI服務,讓企業可以評估資料和模型的影響及關係,藉此改善AI可解釋性。 它還會協助企業獲得有關部署、公平性、品質及風險的模型見解。 此解決方案會利用對比解釋及 LIME (Local Interpretable Model-Agnostic Explanations) 之類的工具,來協助解釋 AI 交易、種類模型、影像模型,以及非結構化文字模型。 在現代資訊架構上將 AI 生命週期自動化,藉此讓 AI 變得可解釋且透明,這對正式作業 AI 的成功至關重要。

2.新創公司Fiddler AI提供可解釋的AI模型監控平台

美國加州新創公司Fiddler AI成立於2018年,其核心產品「Explainable AI Engine」為一提供可解釋的AI模型監控平台,透過以下三種方式來解決客戶的問題,(一)了解AI決策原因:可解釋AI引擎能從任何平台導入數據和模型,以在Fiddler中進行解釋,還可以運用平台快速產出可視化圖表,並通用於團隊的電子郵件、雲端,兼容各種格式。由於是可解釋的AI決策,可以人為監控平台確保遵守法規。(二)分析AI行為:分析AI模型所做的每一次預測,驗證模型對每次輸入是否產生結果。此外可以比較訓練數據,測試數據和生產數據之間的分佈,也可以將數據分成幾組,並解釋各組之間的性能差異;(三)監控AI的性能:Fiddler AI引擎會監控模型的狀況使其保持高性能,也能追蹤異常值並發出警報,讓客戶能快速修復並重新訓練模型。Fiddler AI成立迄今,累計獲投4,520萬美元。

3.科技部與台大發表 XAI 可解釋性人工智慧模組 xCos

科技部在2020年5月11日召開記者會,邀請臺灣大學人工智慧技術暨全幅健康照護聯合研究中心轄下的徐宏民教授團隊,發表該團隊在科技部的支持下所開發出的可解釋性人工智慧(Explainable AI,XAI)模組 xCos。這組AI特別之處在於模組除了具備高辨識率的人臉辨識能力外,還可有條理的解釋AI產出結果的原因,不僅可協助國內外相關業者開發AI辨識技術、明白AI決策建議背後的理由,更能提升人類對於使用AI的信任度。

 

八、結語

根據CB Insights最新的統計,2021年前三季全球AI新創募資金額已突破500億美元大關,超出2020年全年募資金額的55%,刷新歷史新高紀錄。其中鉅額交易多達138件、312億美元。AI領域投資創新高,與COVID-19的肆虐使得企業對於人工智慧技術的應用需求急遽成長、發展迅速有著密切的關係。

為因應這波數位轉型的需求,許多協助企業導入AI的工具也陸續被開發與應用,包括:無程式碼/低程式碼(No-code/Low-code) AI平台興起,降低企業應用AI的門檻,這些平台提供隨插即用(Plug and play)功能,以協助非IT技術的人員也能進行數據分類、資料分析、驗證並輕鬆構建準確的模型。此外,針對企業IT部門而言,智慧維運AIOps工具的導入,可以提升企業IT維護與營運的效率、品質與安全,降低人員訓練的成本。另外,圖像神經網路(GNN)、事件串流數據處理、非結構化數據管理管理軟體、機器學習語言Transformers與可解釋的AI等工具,也在企業AI導入與應用時,扮演推手的角色。

AI作為工具正風風火火的導入各行各業,對各行業的正面影響也是有目共睹的,在AI的浪潮下,AI對工作的影響也愈來愈深。但所謂的AI導入,目標不是為了擁有AI技術,而是AI可以幫助解決什麼問題,換句話說,重點應該聚焦在怎麼解決企業的問題,要如何解決這個問題才是導入AI這件事情的重點。

 

參考資料

1.CB Insights(2021),「Enterprise AI Trends To Watch In 2021」, https://www.cbinsights.com/research/report/enterprise-ai-trends-2021/

2.許雅音,「AI & Big Data的演變趨勢(下)」, TAcc+,2021 年 9 月 27 日https://taccplus.com/technew0927/

3.孫嘉君,「不會寫程式也能做 App、AI 數據分析!無程式碼開發平台如何助力數位轉型?」 ,未來商務,2021/09/02,https://fc.bnext.com.tw/articles/view/1662

4.林芷圓,「維運工程師的救星來了!奔騰網路打造自動化維運平台,IT不必再 24 小時全年無休」,創業小聚,https://meet.bnext.com.tw/articles/view/46531

5.陳君毅,「免寫程式,也能從數據挖寶!MoBagel助百家企業導入AI,不怕找嘸IT人才」,數位時代,https://www.bnext.com.tw/article/65294/mobagel-no-code-ai

6.陳曉莉,「“AI文字產生器GPT-3已被應用在逾300款程式上」,iThome,https://www.ithome.com.tw/news/143530

7.Howie Su,「不用再學程式了?2024年,全球65%企業將採「No-code」轉型」,商週,https://www.businessweekly.com.tw/international/blog/3008278

8.IBM,「什麼是 AIOps?」,IBM Cloud 學習中心,https://www.ibm.com/tw-zh/cloud/learn/aiops

9.IBM,「可解釋的 AI」,https://pse.is/3t6esf

10.李建興,「Hazelcast 釋出高速串流與批次資料處理引擎Jet 0.6」,iThome,2018-04-25,https://www.ithome.com.tw/news/122696

12.陳俊雲、許英博,「Snowflake(SNOW.N):從雲數據倉庫到數據云平台」,中信證券研究,北京新浪網,2021-02-26,https://pse.is/3tp4d9

13.張皓甯,「Fiddler:可解釋性的AI模型監控解決方案」,資策會,產業情報研究所(MIC),2021-08-03,https://aigo.org.tw/zh-tw/tech/content/14#

14.「讓 AI 不再黑箱,科技部與台大發表 XAI 可解釋性人工智慧模組 xCos」,INSIDE 硬塞的網路趨勢觀察,2020/05/11,https://pse.is/3tejvq

15. CB Insights,”State Of AI - Q3 2021 GLOBAL Report”, November 11, 2021, https://pse.is/3ry3a4