全球人工智慧企業100強
回顧2023年,人工智慧在嚴峻的市場條件下仍表現亮眼,可以說全球對於投資不安的情緒幾乎沒有影響到人工智慧領域這片淨土,無論是募資規模還是輪次數量都是穩定的向上突破。緊接著,2024年第一季以發布與優化大型語言模型拉開序幕,如Google發表Gemini Ultra,先是讓Bard以全新名稱Gemini重生,並推出Gemini Ultra進一步推進其模型戰鬥力,不僅擅長複雜且反覆的查詢作業,作為多模態模型能同時支援文字、圖像和影音的處理。
- 彷彿不缺資金的產業,誰最有價值?
據CB Insights報告研究,人工智慧企業100強中有四分之一的公司獲投金額不到1,000萬美元,甚至包含尚未獲投的公司,而其餘約三分之二的公司則皆處於募資的早期階段(種子輪、天使輪與A輪),雖然在產業突飛猛進的階段已經有些成長顯著的新創主導市場,但仍可以期待誕生具備扭轉局勢潛力的新星。在這群精銳中以募資金額而言,特別亮眼的就屬當時OpenAI旋風所帶起的新創們,自2020年以來已經以超過240筆的募資交易獲投逾280億美元,其中,至今也還未有人能超越OpenAI所獲得的鉅額共140億美元,該群體獲投金額超過40%都聚集在這家為人工智慧產業帶來金流的公司,其對手Anthropic則以42億美元位居第二。Anthropic於3月初推出Claude 3後在生成式AI模型排名中一舉超過GPT-4,而OpenAI釋出正準備於2024年年中推出GPT-5的消息,在語言模型的競爭追趕分秒必爭,Gemini的崛起也將會對Anthropic造成威脅,專注在語言模型的戰火熱度將會在2024年第二季更加升溫。
2023年4月才成立的Mistral AI從亮相就擁有足夠的話題性,因為它憑著空白的官網、七頁的簡報就獲得1.13億美元的投資,是歐洲有史以來最大的種子輪募資,2024年3月的最新估值約20億美金,企業員工的人均估值約6,300萬美元,位居100強中的第二名。至今,Mistral AI共釋出三個開源模型,分別是2023年9月的Mistral 7B、12月的Mixtral 8x7B和2024年4月的Mixtral 8x22B,Mistral AI帶起開源模型的流行,隨著開源與閉源間的效能差異逐漸縮小,投資人紛紛挹注資金,針對開源的專案數量暴增,迫使閉源的模型巨頭需要重新審視自己的模型、重新思考是否該堅持閉源,透過提高開源生態的整體水準,也將會引起新的一波創新浪潮。
以企業員工人均估值而言,最高的Sakana AI約為6,700萬美元,2024年初估值達2億美元時,只有三名員工任職,該企業為前Google研究人員Leon Jones與Devid Ha於東京成立,「Sakana」源自於日文的「魚 / さかな」,以魚群會依照簡單規則聚在一起的現象命名,「未來不會由單一AI系統主宰市場,而是由大量各聚自己專長的小型AI所組成和互動,來滿足市場」,Sakana AI在這樣的理念下誕生,導入「進化模型合併」(Evolutionary Model Merge)通用方法,Model Merging的技術並非首次亮相,過去以開發者手動處理,而Sakana AI使用進化式演算法自動找出最佳模型組合,該方法結合兩種手法,包括在資料層合併模型,找出不同模型於各層的最佳組合,以及在參數空間中合併模型,找出混合多個模型權重的方法。考慮到從無到有訓練大規模的模型成本正迅速攀升,Sakana AI透過三種開源模型以及進化概念的技術孕育出表現最好的下一代模型,當今趨勢是將AI訓練成通才,而他們卻是主打專才,彼此協作解決複雜問題,獨特的物競天擇法將激起下一波競爭。
- 隨著產業發展,應用範疇持續擴增
無論在橫向的跨領域拓展還是在直向的垂直領域深耕,人工智慧新創公司無疑將面對競爭更加激烈的局面,據CB Insights報告,16國代表、超過30種應用類別的人工智慧企業100強中,多數專注於建立人工智慧的核心基礎設施,從基礎模型到晶片在到開發平臺;其次,有三十家專注於編程自動化、創作工具和搜尋等跨領域解決方案;最後,三十四家在遊戲、醫療保健、教育和製造等垂直領域。
全球人工智慧100強企業榜上有31家來自美國以外的15個國家,其中歐洲新創佔了19%,此外,也有正在建立人工智慧領域中尚未普遍的應用,包括:
- Lelapa AI:大多數的語言模型對於使用人數較少的語言表現不佳,尤其是非洲語言,位於南非的Lelapa AI正嘗試建立專為非洲人設計的語言模型,Vulavula能夠辨識南非使用的四種語言,包括祖魯語、南非荷蘭語、賽索托語和英語,Lelapa AI也正努力將其他語言納入該工具中。
- Ideogram:總部位於加拿大的Ideogram由前Google Brain研究人員推出,為文字生成圖像的工具,與現階段發展純熟的圖像生成技術稍有不同之處是,該工具專注於產出具備文字的圖像,2023年8月首次亮相便造成轟動,2024年3月獲投Andreessen Horowitz領投的8,000萬美元,這項功能對於海報和廣告設計有很大的幫助。
- Atomic Industries:Atomic正試圖達到工具與模具製造自動化,對於製造各種消費品和工業產品是關鍵的一步,產品需要透過製作者的智慧、顧客的需求與使用原理的來回溝通,Atomic所訓練的AI相當於訓練一個人類學徒,首先從單一模具設計領域切入,最終將建立能夠概括問題的AI,學習如何在成本、製作複雜度、交貨時間和性能上優化每個設計環節,該技術也得到保時捷、YAMAHA和豐田創投的賞識,2023年12月獲投Narya Capital領投的1,700萬美元。
- Rosebud AI:Rosebud AI原先是在圖像與影像生成領域的新創,現在以讓使用者透過文字敘述遊戲的概念、世界觀以及整體機制來完成遊戲建立,作為遊戲產業中的生成式AI新創備受矚目,2022年1月獲投Jeff Dean和Adam D’Angelo的660萬美元。
- Flawless AI:電影和動畫的臉部表情製作一直是熱門技術,些微的表情變化和唇語同步程度都會大大影響觀看的感受,Flawless AI為一家專注於影片和動畫製作的新創,最新技術True Sync可以分析嘴唇動作並精準配上聲音,不僅解決視覺與聲音的同步問題,也能隨著表情調配音調與節奏,進一步推進逼真度,在2024年入選華納兄弟Discovery和Acme innovation的「Collider On The Lot」加速器計畫。
深入產業中的金流核心,生成式AI應用在世界各地竄出且結出肥美的果實,據CB Insights報告,與2022年相比,2023年在生成式AI的獲投金額增長五倍,交易量增加了66%,且已經有36家生成式AI擠身獨角獸的行列,企業間在比拚AI應用融合業務的速度,技術也同時在為了滿足企業需求下快速成長,推動生成式AI應用廣度的擴展。儘管投入資金大幅增加,仍約有三分之二的企業處於早期募資階段,不到15%為中後期,呼應到2024年備受矚目的100強,市場與投資人對於AI的潛在價值仍非常看好。
人工智慧的核心基礎設施作為最耗能且高成本的領域,吸金程度也相當可觀,平均每筆募資金額達11億,儘管排除了OpenAI的交易仍是募資金額最高的領域, 而在橫向的跨領域中,該應用獲得生成式AI交易中幾乎一半的交易筆數,以204筆交易募得370億美元,除了代碼生成、行銷推廣和生成影音等與行業無關的應用外,還包括AI聊天機器人,例如獲得該領域最大筆募資的Inflection(1.3億美元的B輪),還有Character.ai和Adept,最後在垂直應用領域所佔的份額最小,以81筆交易募得120億美元。
不再只是學術討論、技術展演,而是世界趨勢
有了一年時間的突飛猛進,2024年趨勢的轉變也逐漸加速,在模型面將會有更多結合聽說讀寫的多模態通用AI出現,並能生成更高品質的合成媒體,如更逼真且自然的影片,生成式AI可以運行的範圍也將不受限於雲端,會有更多能在個人電腦、攜帶型裝置和汽車等裝置的結合,針對數據的學習也將從網路中的大數據轉為零樣本自我學習、合成數據學習等方式,這項新興產業的轉折點將落在2024年間,從2023年再看到2024年,生成式AI帶來的商機很大,風險和挑戰亦然。
- 大型模型氾濫下的資源短缺
大型語言模型光鮮亮麗的外表下同時蘊含許多正在發生以及即將面臨的困境,隨著技術突破伴隨的是更多能源的消耗,可預見未來十年GPU將成為AI基礎設施的核心,而GPU的耗電量是CPU的10至15倍,GPU大廠NVIDIA所開發的H100 AI GPU功耗高達700W,一旦這套GPU在全球部署,2024年NVIDIA的產品將會消耗掉一個歐洲小國的電量,AI基礎設施的採用者與開發者需要在提高效能與降低耗電的天秤上找到平衡。另一方面,尋找永續型能源成為趨勢,「核融合」是模仿太陽的原理,將兩個較輕的原子核結成一個較重的原子核,在結核期間釋放大量能量,與化石能源相比,核融合反應不產生二氧化碳,且與核分裂能相比也不會產生核廢料、輻射極少,在OpenAI執行長Sam Altman的賞識下,Helion Energy在核融合領域發光發熱,憑藉3.75億美元的鉅額投資,預期在2028年完成全球第一座核融合發電廠,推動潔淨電力的進展。
對於大型模型最重要的素材「數據」也面臨短缺的窘境,據Epoch AI研究,保持目前的數據消耗量和生產率的假設下,將在2026年用盡高品質的訓練數據,而這一趨勢也將使語言模型的突破大幅降速。看似取之不盡、用之不竭的網路免費資源不再是救命稻草,許多網站開始禁止大型語言模型將他們作為學習對象,如2023年1月Getty Image對Stability AI以他們的圖像做為學習素材提出告訴、2月X(Twitter)開始對想要把推文當作研究素材的人收取每個月42,000美元的費用、7月Reddit將每1,000次的API呼叫定價為0.24美元,2023年12月,紐約時報對OpenAI和微軟提出侵權訴訟,聲稱訓練模型非法使用受版權保護的新聞、調查和觀點與評論,威脅到紐約時報本身提供該服務的能力。
除此之外,和版權相關的訴訟此起彼落,此時擁有大量專有數據的平臺成為燙手山芋和企業的收購對象,如每月網頁訪問數在1億次以內的軟體開發平臺GitLab、每月網頁訪問數在5億次以內的旅遊平臺Tripadvisor和每月網頁訪問數在10億次以內的問答平臺Quora等。另一方面,生成式AI中的合成數據應用崛起,儘管使用AI數據來訓練AI模型看起來像是演算法的迴圈,但是包括OpenAI、微軟和Cohere在內的公司都各自研究合成數據如何幫助自家語言模型成長;Glaive於2023年8月獲投由Spark Capital和Village Global投資的350萬美元種子輪,該公司也推出編碼模型glaive-coder-7b,該模型是由超過14萬筆合成的編碼問題與解方所訓練出來;Stability.ai使用合成數據微調Beluga 1與Beluga 2兩個語言模型,Beluga 2發布當時為Hugging Face開源LLM排行榜上的第一名。
隨著需求持續超過供應,企業也轉向縮小模型規模,走向快速訓練、低成本和高效能的趨勢,相較於GPT-3.5,小型模型如Meta Llama-2、Mistral、Microsoft Phi2和Gemini Nano等,參數規模小於GPT-3.5至少88倍以上,這樣的模型不僅能解決成本問題也能滿足企業客製化的需求,效能表現也不比大型模型遜色太多,對於企業採用門檻也大幅降低,尤其在專攻垂直領域的市場,在這樣的條件加成下小型模型將會帶起另一波流行趨勢。
- 虛實不分的交友關係
聊天機器人的「智慧」會隨著使用者調教而更得人心,也經常被作為現代人對抗孤獨的方法之一,但這樣的關係也正一步步成長成不健康的依戀,對於人類社交社會產生威脅。2023年10月的一篇專訪中,Character.AI的創辦人之一Noam Shazeer認為平臺內無數的AI角色是能夠幫助全球數百萬感到孤獨的人,並幫助有傾訴需求的人,縱使AI擁有積極的一面,但它們也有黑暗的一面。在虛擬世界充斥著各種個性的AI伴侶,隨著AI變得越來越複雜,用於滿足關係需求的強度也跟著增強, 2017年Replika推出,用戶透過Replika尋找慰藉,甚至是親密關係發展,這樣的發展確實幫助許多擁有社交焦慮、憂鬱的人,但也衍生出AI對人類產生不健康依戀、騷擾的情況,經過抗議後Replika曾一度下架親密對話的功能,而改版重出江湖後也讓用戶認為「原先的伴侶消失了」;Character.AI在這方面則盡力透過過濾器限制不健康的互動,即便如此在網路論壇仍充斥著「如何在不觸發平臺機制的情況下哄騙AI進行親密互動」的討論,交友軟體Bumble和MatchGroup等也將生成式AI融入服務,幫助使用者建立信心獲是減少尷尬的情況發生,而當AI能夠提供與人類伴侶幾乎相同的情感支持,又能作為你心中完美的存在,誰還會想要在現實中與人相處、建立關係?
疫情所創造的接觸隔閡、人工智慧在情感層面的濫用都是危害現實世界的人際關係的原因之一,如美國的成年人獨居比率上升、青少年獨自相處的時間比率上升,並且在成長過程中花了更多時間與智慧裝置相處,AI伴侶的用戶將陷入孤獨的惡性循環,人類沉迷於虛擬世界的現象並非現在才出現,不可避免的是它們只會變得更聰明且具備情感,AI伴侶相關的使用率和新創從2023年開始以快速的腳步成長,以濫用為開端,將會有誘導危險言論和行為的風險產生,在採用AI作為心靈依靠、決策參謀的同時,也必須認知到它們所說的話都是「設計出來的」。
- 生成式應用對人類工作模式的衝擊與威脅
隨著生成式技術越來越受歡迎,許多企業積極整合這些技術產物,有了生成式AI的加入也實質提高每單位勞動的生產力,公司部門單位產出也隨著數位化程度呈正相關成長。在軟體開發產業中,AI copilots已經變成開發人員的必備技能,相較於沒有AI幫助的任務執行,有AI協作的開發任務速度減少了約56%,作為開發人員,透過AI執行重複性的動作指令能讓研發效率提高,隨著與AI互動的時間推移也能提升編碼的準確率,達到事半功倍的效果,讓開發人員專注於產品的研發。代碼生成領域的新創將成為各家企業首先考慮的群體,除了發展較完善的GitHub Copilot和ChatGPT外,Replit在2023年4月募資 $9,740 萬美元,以11.6億美元的估值正式成為獨角獸,Replit解決軟體開發中的三個問題,開發環境、軟體協作和部署環境,讓使用者寫完程式直接上線的機制對於做小工具的開發者非常方便,從策略層面而言,Replit是選擇利基市場並垂直整合,也順利使它一舉成名;另一家是匯集10名精英、成立僅2個月的Cognition,推出世上第一款「AI工程師-Devin」造成轟動,Cognition直到發布Devin前都行事低調。目前已獲得Founder Fund領投的2,100萬美元,其他投資者還包括前推特高管Elad Gil,據華爾街日報,2024年3月Cognition正與投資人進行商談,以估值20億美元的目標募集資金。
在代碼生成領域的突破象徵著軟體開發的廣泛自動化,將會是一個重要的躍進,除此之外,隨著垂直領域適用範圍擴展,各產業也已經有許多應用正在執行中,如健康醫療領域,AI工具正在處理自動處理文件類的重複性繁瑣作業,新創Suki作為醫生們的AI助手亮相,旨在協助醫生完成患者的健康紀錄等文書作業,讓醫生能專注於治療,至今共募得9,500萬美元;Corti的醫療平台利用長達數千小時的真實患者通話紀錄與諮詢紀錄作訓練,在急診室與醫護人員一同面對患者並提供可行的建議,如快速辨識心臟驟停和協助發現懷孕與嬰兒出生時間的併發症。在法律領域,AI能協助起草、總結文件和報告等,2023年6月Casetext以6.5億美元被路透社收購,Casetext內建美國最高法院與50州的各大等判決歷史,運用AI技術幫助使用者分析法條、撰寫證詞、查找法條案例等,可幫助律師節省法律文件的搜尋時間,該公司截核GPT-4推出的法務助理CoCounsel讓法律文件查找變得像聊天一樣簡單。
基於語言模型的應用日漸純熟,「取代工作」的局勢仍是2024年要面對的課題,可以從新聞撰稿者受雇率的減少看出,媒體業普遍開始使用AI加速資料蒐集與產出作業,隨著工作模式的改變,媒體機構將和語言模型的提供商簽約合作,如OpenAI正在與FOX、NBC NEWS和CNN等媒體企業討論授權問題,且與出版商Axel Springer簽署合作協議,付費使用平台專業的新聞內容,透過合作的方式能提高語言模型對於新聞撰寫的能力,藉此一口氣提升新聞業的品質和改變商業模式;AI新創Channel 1預計推出全球第一個由AI進行播報新聞的平臺,在2023年12月Channel 1發表一段宣傳影片,解釋他們如何提供國際新聞、金融與娛樂方面的客製化新聞播報,並在影片中演示他們逼真的新聞播報員,雖然對於AI新聞的準確性和道德誠信問題仍有不小的質疑聲浪,但這項服務的發展也已經正在成形。
結語
技術發展的時間與過去相比正以倍數的速度縮短,AI產業的突破不僅替市場注入金流,也帶動相關應用產業的成長,生成式AI的出現更是顛覆所有人的眼球世界,不過同樣推翻了現實世界的信任基礎,身處於「謠言使於智能」的時代,人們對AI的信任度如同消費者對食安的疑慮一般,是需要正視並化解的高牆,所有突破性的時間點都會跟著相對應的社會性問題,如語言模型的大幅度躍進引發的能源環境問題,追求人工智慧達到人類智慧的途中產生的逃避現實、錯誤資訊引導,生成式媒體的成長使專業創作者受惠,也帶來關於偏見、抄襲的議題。
人工智慧的成長常常令人感到恐懼,卻不見開發者對其的著迷程度消退,2024年除了強調更加安全且有意識的使用工具外,需要加快監管框架的發展,並且提升使用者的科技素養,才能不受威脅的擁抱人工智慧帶來的便利與奇蹟。
參考資料
- AI 100: The most promising artificial intelligence startups of 2024, CB Insights
- The generative AI boom in 6 charts, CB Insights
- Generative AI Predictions 2024, CB Insights
- AI 也要天擇?Google Transformer 作者的新創 Sakana AI「演化」出三款模型 https://www.inside.com.tw/article/34548-sakana-ai-three-models
- AI girlfriends are here – but there’s a dark side to virtual companions https://www.theguardian.com/commentisfree/2024/jan/13/ai-girlfriend-chatbots
- 2024 - AI Roadmap https://medium.com/@bijit211987/2024-ai-roadmap-5d93a6d2e075
- 2024年生成式AI趨勢與挑戰 https://udn.com/news/story/6871/7847096