生成式AI的現況及重要性
近期對於人工智慧的發展有望改變世界的討論話題沸沸揚揚,其中文本生成模型似乎是人類技術的一個轉折點,這些模型捕捉文本的含意和上下文,從而使軟體能進行更妥善的處理,此一能力令人印象深刻,甚至在不知不覺中我們每天都在體驗大型語言模型的力量,像是Google翻譯、搜尋等,這些產品每天都在變得更高效且更準確,現在更是有整個新行業的企業是以這些模型為基礎,包括HyperWrite、Jasper、Writer、copy.ai等開發AI寫作助手的公司,或是Latitude、Character.ai和Hidden Door等將模型融入互動(聊天)功能的公司。再來是另一個令人興奮的AI領域-圖像生成,雖然AI圖像生成並不是特別新鮮,但過去這些模型都針對它要生成的對象類型進行了大量訓練,而現在的圖像生成模型僅需要單個模型,還能根據文本描述來控制生成的內容,當對於模型透過輸入簡單文本能產出的結果超出你的預期時,實在難掩興奮感,而這也代表未來對於產品、行業和經濟會產生一定的影響,另外還有使用語言模型生成代碼,幾乎一定會改變編寫軟體的模式,然而這些展示出來的成果是否可靠也是人工智慧產品能成功關鍵之一。
「大多數的人高估了他們一年內能取得成就,而低估了他們十年能取得的成就」,面對技術的期望也是如此,大型文本生成模型能正確地回答許多問題,但是否可靠卻說詞不一,例如在Stack Overflow(軟體開發人員的論壇)已禁止在網站上發表機器生成的答案,原因是平均正確率太低,然而在其他用途上仍然有可靠的成果。文本生成模型的能力只會越來越好,且應該將「語言模型是具有個性的思想個體」一說拋諸腦後,將語言模型視作軟體系統的語言理解和語言生成工具,且其中「理解」代表的是能從文本及其背後含意萃取更多資訊,提升軟體實用性,而非人類的理解和推理。
十幾年前,「軟體正在吞噬世界」這句話,描述了軟體如何迅速成為技術領域以外許多行業的中心,如書籍零售商、串流影音平臺、娛樂音樂公司,甚至是電影製作公司本質上都是軟體公司,現在人工智慧的發展可能會加快軟體增加的速度。目前為止各大分析師和投資人都發表自己對於生成式AI的領域劃分和競爭比較(如文本生成、圖像生成等),若就技術層面區分則可以區分為直接面向客戶銷售的公司、分享及持有模型的平臺,和這些技術所仰賴的平臺,雖然大部分的想法傾向於將人工智慧視為一個獨立的軟體,實際上更有發展的觀點是將其視為軟體的擴展,使其能解決更複雜的問題,如文本生成模型可以透過更改文本提示來處理不同的情境,支援搜尋、文本分類和情感分析等。從技術角度來說,文本和圖像生成等幾乎沒有區別,專注於此也可能錯過其他更成熟的AI功能,生成式AI之所以成為可能,是因為在巨量數據集上訓練的模型使AI模型能夠更好地表示文本和圖像,不過,更重要的是要知道這些表示除了生成之外還可以實現多種可能性。
2023年Q1人工智慧領域的鉅額投資
- OpenAI – 由Microsoft投資100億美元,開啟人工智慧領域獲投盛況
提到鉅額第一個聯想到的絕對是OpenAI在1月和Microsoft建立合作關係並獲投100億美元,2019年Microsoft手捧10億美元與OpenAI初次合作,當時被視為科技界押對寶的最佳典範,此筆100億美元的驚人投資讓Microsoft進入人工智慧領導企業行列,其交易同時也使OpenAI的估值飆升近300億美元。
OpenAI發布ChatGPT後,短短幾個月內,這款人工智慧聊天機器人就成為有史以來增長最快的線上服務,也促使Google和Microsoft競相將生成式人工智慧技術嵌入軟體產品之中,與此同時,Snap公司發佈類似於ChatGPT的聊天機器人、Meta也在打造類似的「人工智慧角色」,這些產品中的絕大多數都是因OpenAI人工智慧專家團隊的工作而起;隨著ChatGPT用戶量的快速成長,OpenAI在2月乘勝追擊推出月費20美元的ChatGPT Plus,一上線便引爆火熱需求,推出不到兩個月就因為需求大到運算能力招架不住緊急宣布停售。
據Glass. Ai稱,OpenAI的團隊其實僅154人,與科技巨頭們大相逕庭的規模也成為他們能如此成功的原因之一,OpenAI的成功可以歸結於他們的巧妙行銷,過去兩年大力宣傳語言模型GPT-3和文本生成圖像系統DALE-E 2等早期項目,另外一點就是專業的研究人員能直接接觸民眾,研發實驗室的背景意味著公司在發佈ChatGPT時,沒有大批工程師和產品經理參與其中,此環節在不少大型科技公司中會不經意製造瓶頸,阻礙新技術的發展,這個概念令人不禁聯想到,當時投資給OpenAI執行長Sam Altman第一家公司Loopt的Y Combinator,其在輔助新創企業時截然不同的態度,特意減少身為孵化器的控制力反而讓新創企業獲得更好的發展。儘管對於OpenAI的運作模式評價兩極,甚至有員工離開,但不能否認其成長速度和帶來的效應,反觀Amazon就是反面例子的其中一個,儘管擁有業內最大的人工智慧研究團隊,但在將人工智慧研究成果轉化為主流或創新產品的努力成敗參半,近十年前,透過售價99美元的Echo音箱向用戶免費提供虛擬助理Alexa這項服務,最後不僅燒掉Amazon幾十億美元的資金,客戶也僅把它當作音樂撥放器或是計時器使用。
2015年底,一群人工智慧研究人員和矽谷知名人士成立的非營利性研究實驗室OpenAI,代表作GPT-3、DALE-E和ChatGPT在全世界得到認可和使用,而在早期這些模型的技術只是遙遠的夢想,當時,卷積神經網絡之父、現任Meta首席科學家Yann LeCun在演講時催促人們「開發無監督學習,或使用未標記的數據集訓練AI模型」,如今無監督學習已是廣泛使用且具有高價值的技術,OpenAi的Ilya Sutskever在與NVIDIA執行長黃仁勳的談話提到,「若做得到良好的數據壓縮(在不遺失有用訊息的前提下,縮減數據量提高傳輸及處理效率),必須提取數據中所有隱藏的資訊,而這也是無監督學習的關鍵解藥」,而讓OpenAI真正實現自我擴展的是強化學習,Sutskever和團隊使用這種技術訓練人工智慧與自己玩電子遊戲,進而與世界上的頂尖玩家競爭,正是這兩項技術的基礎催生GPT模型,使OpenAI家喻戶曉,儘管此類的生成式人工智慧還不完美,但經由更大量和更深度的數據訓練,已經實現當初只是概念性的想法,Sutskever更是表示,盼未來兩年透過提高保真度和可信度,設定精確的「人工智慧防護網」,使人工智慧讓人信賴。
- Adept AI – 由General Catalyst、Spark Capital領投3.5億美元的B輪募資
儘管面對創投減少和矽谷銀行倒閉等強勁逆風,Adept AI仍然在B輪獲得3.5億美元的投資,自前述Microsoft對OpenAI投資了100億美元開始,對人工智慧的投資浪潮一直沒有消退,似乎沒有甚麼能阻止生成式AI新創公司募集資金。
作為千禧一代和Z世代,早就開始使用Excel等工具來自動執行一些簡單任務,2015年後半年,開始建構可以使用UIPath等軟體在軟體內部執行特定任務的BOT,至今,我們有對話、語音、生成式等人工智慧,甚至能幫助我們做法律上的判決,Adept AI志在打造一款能將文字指令化為一連串行動的AI模型,而ACT-1正是朝著下一個時代邁出的一大步。
Adept AI成立於2022年,旗下僅有25名員工,Adept AI致力於創造讓人和計算機能協作的通用人工智慧,由原Google研究人員、Transformer作者聯手創辦,Transformer是第一個幾乎適用於每個人工智慧實例的神經網路,Adept AI執行長David Luan在OpenAI時將Transformer擴展為GPT-2及GPT-3,具備編寫新聞文章、詩歌、郵件,甚至是回答問題的能力,Google擴展Transformer產生了NLP界的巨人之力-BERT,David Luan在Google時與創造Transformer的Ashish、Niki一拍即合,創辦了Adept AI ,2022年4月募得6,500萬美元的資金,天使投資人包括Uber CEO Dara Khosrowshahi、特斯拉AI總監Andrej Karpathy等人。今年(2023年)3月於FINDIT平台發表的生成式AI大集合中特別提到了「如果AI能根據我們的需求代表我們採取行動那就更好了」一概念,在此領域開發智慧助手的公司有很多,而Adept AI在短時間內脫穎而出,藉著A輪推出的人工智慧助手ACT-1是以「行動Action」為目標建立的模型,只要用戶輸入如「取消我的機票、提醒我做…」等指令,ACT-1就能辦到,在ACT-1亮相後便接著獲得General Catalyst、Spark Capital等創投巨頭投資的3.5億美元,起初ACT-1只能回答簡單問題,幾個月後就已經能執行一些較複雜的功能,如將LinkedIn網址導入到招聘軟體,它能在軟體中精準捕捉用戶需求。實際上,ACT-1已經準備好在電腦上的使用,未來也將能在手機上使用,作為一家新創企業,他憑著生成式AI工具ACT-1募得3.5億美元,並宣布下一步的募資,可見生成式AI在廣泛領域中打開了無數充滿機會的大門。
- Anthropic – 2023年首季就獲得分別由Google和Spark Capital領投共6億美元的投資
另一家不畏逆風成長的新創企業,可說是榮登2023年第一季最忙碌的Anthropic,1月底推出ChatGPT最強競品,新的聊天機器人「Claude」,與ChatGPT採用的人類回饋強化學習(RLHF)不同,Claude採用的原發人工智慧(Constitutional AI)方法,基於偏好模型而非人工回饋來進行訓練的,又被成為「AI回饋強化學習(RLAIF)」,2月才剛獲得Google投資的3億美元,隔一個月,馬上又再獲得由Spark Capital領投的3億美元,接連獲投進一步說明了投資者對所有人工智慧相關開發的好胃口,也證實各界在與ChatGPT的競爭中相當看好Claude。
Microsoft的Bing聊天機器人系統近期因為威脅公開用戶個人資訊以及破壞用戶聲譽等事件而受到批評,同期間,前OpenAI員工創立的Anthropic推出Claude,並強調Claude是一個無害但不迴避問題的聊天機器人,儘管背後的基本原理和Bing聊天機器人沒有太大差異,但Anthropic用的原發人工智慧是讓Claude與眾不同的關鍵,他們設計的機器人避免性別、種族歧視以及有害事物,避免幫助人類從事非法或不道德的行為。事實上,原發人工智慧是從和ChatGPT相同的強化學習再進一步微調的技術,分為監督學習和強化學習,第一部分研究者對原始模型採樣有害請求,從而產生自我修正,並根據修正結果進行微調,而第二部分研究者會對微調模型採樣有害請求,用監督模型產生答案,並讓AI判斷哪個回答最無害,生成無害性偏好數據,混合人工回饋偏好數據進行訓練。
不讓ChatGPT專美於前,Claude在3月中宣布開放註冊申請使用,Anthorpic的一些合作夥伴也已經利用Claude開發出新服務,如DuckDuckGo推出的DuckAssist,用戶能夠在DuckDuckGo的搜尋框輸入問題,DuckAssist透過自然語言技術來總結來自維基百科或大英百科全書的內容,並期望未來能夠給出比傳統搜尋結果更直接的答案;另一個企業是每月擁有4億用戶的問答平臺Quara,推出聊天機器人平臺Poe,用戶只要在Poe上提問便能獲得即時回應,AI語音轉錄與理解平臺AssemblyAI也透過API使用Claude。
據TechCrunch,Anthropic的目標是在未來兩年內獲得50億美元的資金,宣言與OpenAI競爭並打進主要應用行業,他們打算建立一個暫時稱為「Cluade-Next」模型,並自述其為人工智慧自學的下一代算法,是參考自身開發的原發人工智慧技術,估計將比當今AI強大10倍,如此龐大的系統也須仰賴據有數萬個GPU的電腦叢集。Anthropi先將他們的軟體發佈給特定的群體,以在不驚動公眾的情況下引起期待,4月初於舊金山活動的與會者現在是第一批可以使用Claude的人,正如俗話所說,「The genie has been let out of the bottle」,如今處於這些產品的早期階段,會有什麼樣的發展仍是未知,使用洽當將有機會開創下一個時代。
- Amelia–由BuildGroup和Monroe Capital領投的1.75億美元
Amelia是可信賴AI領域的企業領導者,藉由和BulidGroup、Monroe Capital建立戰略合作夥伴關係,獲得1.75億美元的資金,並加速可信賴AI產品在市面上的採用。
相較於近期興起的初創企業,Amelia在為企業建構和提供可信賴的自動化、對話式AI平臺已經有超過20年的經驗,作為早期先驅,原先作為IPsoft在印度建立業務,提供遠程IT基礎架構託管服務,2014年推出Amelia,是第一個像人類一樣進行互動的智慧型代理人,延續這項技術革命公司正式於2020年更名為Amelia。當今許多企業都在思考如何駕馭支援OpenAI的聊天機器人熱潮,Amelia透過提供企業AI突破ChatGPT的侷限性,Amelia的平臺一直被認為是市場領導者,為全球提供服務。與聊天機器人和其他智慧代理人不同,Amelia的對話式AI具備內部理解能力,包括對常見行業特定請求的上下文理解以及口語對話如「等一下」的理解,開箱即用的功能縮短企業部署的開發階段,使企業能夠加快實現應用的時間,平臺會從每一次的互動和觀察人類員工如何處理突發狀況中學習,除此之外,還能利用平臺的分析功能依據實際互動和業務流程提出建議,從而推出目的辨別、放棄和進一步行動的因應;Amelia受聘成為各類金融公司管理IT和客戶服務的任務,為超過100萬個財富管理客戶和員工提供服務、為美國最大金融公司之一解決了150多項具體的支援任務,在不到一年的時間內達到比人類高出16分的淨推薦值;在醫療保健系統中面臨人員短缺及大量客服中心需求,Amelia透過培訓和自學幫助該領域的客戶識別平均93%的目的,並快速駛他們得到幫助,也在客服務中心執行80%的需求且能獨自處理,從而減少呼叫量並改善客服服務;保險業必須提供快速且客製化的服務,Amelia協助客服人員處理超過1,000次與理賠和保單相關的日常對話,且被派為一家全球擁有1,800萬客戶的保險公司的虛擬客服;在電信業領域,Amelia幫助優化面向員工和客戶的系統,從IT到HR,再到客戶計費、計劃管理和支援,Amelia的整合式平臺利用對話式AI和AIOps,為電信客戶提供全年無休的服務,最小化成本的同時提高效率。對話式AI的市場正在快速發展,投資人也正是看好這巨大的市場機會與Amelia展開合作。
- Character.ai–由Andreessen Horowitz領投1.5億美元的A輪募資
Character.ai由前Google研究人員Noam Shazeer和Daniel De Freitas成立,讓用戶能自己建立自己的聊天機器人,3月時獲得由Andreessen Horowitz領投的1.5億美元投資後成為獨角獸,Character.ai擁有的22名員工中有21名為工程師,目標將這筆資金用來幫助團隊成長並推動具備高級推理和高準確性的模型,為用戶提供新的功能。
自2022年9月推出測試版平臺以來,Character.ai歷經多個突破點,包括每個月於網站上的流量近1億次、用戶平均停留時間兩個小時,自上線以來用戶發出超過20億則的訊息,其中前10億則是在上線四個月內發出的,後10億則是在後續一個月內發出,據Similarweb排名,Character.ai現已躋身全球網站月流量前400名。網站本身為用戶提供建立客製化的AI機器人的功能,無論是傾聽用戶日常的陪伴者或是分析問題的解決者,Character.ai都能滿足,對客製化沒有需求的用戶也能使用Character.ai不斷擴大的創作者社群中開發的數百萬個AI角色,至今已經有超過270萬個角色,平台剛上線時僅不到100個,Character.ai官方的文章中提到「我們了解提供一個真正像您的AI的重要性,這也是我們製作客製化AI的原因」,從個性到價值觀都能滿足用戶的需求和偏好,此概念也由Character.ai短時間達到的這些成就驗證了。
- DeepL–由IVP領投1億美元,成為2023年第一隻AI獨角獸
翻譯工具中容易出現一些看似簡單的錯誤,如英文句子中「I arrived at the bank after crossing the street.」與「I arrived at the bank after crossing the river.」,bank一詞在每個句子中的意義不同,而當逐字逐句進行翻譯時就有可能選錯產出的結果,Google提出的文章中詳細介紹了這個問題的解決方法-Transformer,系統會將關注詞與句子中的每個詞進行比較,並且不用侷限於它們的順序距離,看看這些詞是否會由某種方式互相影響,如「I arrived at the bank after crossing the river.」中要知道bank是河岸不是銀行,Transformer可以關注river並學習出句子中的bank是在表示河岸,這又被稱為注意力機制,而2023年人工智慧領域第一隻獨角獸DeepL也正是使用這項技術。
據2017年Techcrunch的文章表示,DeepL的翻譯整體優於Google和Bing,相較於Google較直譯式的結果,DeepL提供更自然且接近專業翻譯人員的回答,自2009年成立以來DeepL算是機器翻譯領域中最具顛覆性的參與者之一,誕生於同樣有出色表現的Linguee,Linguee的共同創辦人Gereon Frahling曾在Google Research工作,於2007年離職後,以完成翻譯相關的任務為目標與團隊致力於機器學習,DeepL Translate現在支援29種以上語言,並且可以跨多種格式(文本、.pptx、.pdf)和平台(網路、手機、API等)。
DeepL在1月以10億美元的估值募得1億美元的投資後,推出新的產品DeepL Write,主張能夠幫助用戶修正文章的撰寫,如語法和標點符號的錯誤等,提供更清晰獲有創意的措辭建議,也能根據文章的語氣改變,這些功能聽起來似乎有點耳熟?那是因為這項服務與市面上流行的產品Grammarly正面對打,它的Youtube廣告無處不在,並且擁有超過3,000萬的日用用戶及約50,000家企業及團體用戶,截至2021年Grammarly的估值就從10美元飆升至130億美元,但是DeepL的核心文化就是擁抱競爭並將其作為前進的動力,就像前述的翻譯器產品長期以來與世界上兩大科技公司競爭,DeepL已經習慣面對強大的競爭對手。DeepL Write一開始以英語和德語推出,並打算在試用中學習開發其他的功能和語言,DeepL的創辦人Kutylowski表示,他注意到DeepL的用戶常需要在兩種語言間琢磨,以改進目標語言的文字寫作,因此DeepL乾脆創建一個微調書面溝通交流的專屬工具,DeepL Write以從根本改進這個誤用而建立,且表示下一階段將專注發展較難捉摸的語氣與措辭。
結語
如同NVIDIA的黃仁勳所說,「現在正是人工智慧的iPhone時代」,如果網際網路是訊息普及的曙光,那麼人工智慧可能就是智慧普及的曙光,據Grand View Research的數據,2022年,人工智慧產業價值超過1,366億美元,預計到2023年將達到1,960億美元,如今已經無法忽視人工智慧領域的驚人進步,企業爭相將AI建構到產品、服務及流程中,也希望找到下一隻AI獨角獸。隨著Microsoft將ChatGPT整合進自家產品中,在各國也相繼有了動作,如美國BuzzFeed宣布計畫以OpenAI提供的技術協助創造客製化內容、中國百度推出類ChatGPT的產品文心一言(ERNIE Bot),臺灣方面更是打算在年底建立台版ChatGPT,將打造「可信賴的生成式對話引擎模型」,未來隨著AI與下游場景的融合速度增快,配合政策對行業的支持,AI市場規模也有望繼續拉高。
參考資料
- crunchbase https://www.crunchbase.com/
- Tech’s AI Armies Are Huge, Yet Struggling to Innovate https://pse.is/4vkujs
- Adept Ai https://www.adept.ai/blog/introducing-adept
- Google invests $300 million in Anthropic as race to compete with ChatGPT heats up https://pse.is/4vzfau
- Google支持的Anthropic公布Claude AI模型開放申請試用 https://www.ithome.com.tw/news/156012
- Anthropic’s $5B, 4-year plan to take on OpenAI https://techcrunch.com/2023/04/06/anthropics-5b-4-year-plan-to-take-on-openai/
- Amelia https://amelia.ai/
- Amelia Announces $175 Million Strategic Investment from BuildGroup and Monroe Capital https://pse.is/4wascv
- Character.AI: $150 Million Funding And $1 Billion Valuation https://pulse2.com/character-ai-150-million-funding-and-1-billion-valuation/
- DeepL takes aim at Grammarly with the launch of Write, to clean up your prose https://pse.is/4ts9gu
- What's the big deal with Generative AI? Is it the future or the present? https://txt.cohere.ai/generative-ai-future-or-present/
- AI is Eating The World https://txt.cohere.ai/ai-is-eating-the-world/