最近想把這一年來 LLM 帶來的 AI 風潮,對於未來新創投資會有怎樣的機會,做一點自己的看法整理。昨天 Open AI Dev Day 也有些人針對發表內容做分享,我這邊也就不多說。但我們來看看從投資的角度,過去這一年以來 LLMOps 的市場地圖,有怎樣的募資狀況。剛好 CB Insights 前一陣子有出一份報告,我們就先快速地看一下這份報告吧。

CB Insights 將 LLMOps (Large Language model operations) 拆解成上面幾個類別,根據今年度以來的募資金額與案子數,有了下面兩張圖。
LLMOps 總募資金額

LLMOps 總募資案件數

這兩張圖是 CB Insights 統計這些類別的募資金額與案件數,當然最火紅的還是 Generative AI – LLM developers (募資了 USD 29.6B,總案件數為 75 件),其次為 AI Development platforms (募資了 USD 9.3B,總案件數為 151 件),然後第三名是 Data Annotation (募資了 USD 1.68B,總案件數為 106 件)。當然如果我們限縮到今年來看,你應該可以看到只見新人笑,不見舊人哭的景象,用比較白話的形容就是,新的 AI (LLM) 取代了舊一代的 AI (我們可以廣泛地把它當成過去五年我們比較常談論的那種 AI,這邊我稱為 Tranditional Deep Learning),這也就代表了 AI 勢力的消長,過去 Tranditional Deep Learning 的 AI 有些難解的問題,到了 LLM 時代就更有機會用不同的方式去解決,加上 LLM 的特性,就會讓這兩種 AI 會讓人有不同世代的感覺。這個我另外會寫一篇我的理解與看法 (或是分享給 EDM 的讀者)。
從今年度來看,各類別的募資案件數與金額
Generative AI – LLM Developers (募資了 USD 15.3B,總案件數為 20 件)

詳細數字如上圖,平均一個案子是募資了 USD 765M,如果我們搭配上面的累積金額與案件數,把今年度的扣除,那今年度之前的募資金額是 USD 14.3B,總案件數是 55 件,平均一個案子是 USD 260M。當然裡面會有一些極端的例子,例如 Microsoft 年初投資 Open AI USD 10B、Amazon 投資 Antropic USD 4B 等,然後 Open AI 在今年四月又拿了 USD 300M,這些加起來就是 USD 14.3B,今年度的 USD 15.3B 扣除完,就剩一下 USD 1B 給剩下的 17 個案子 (如果 Open AI 算兩筆案子的話)。這也就代表說,Generative AI 的 LLM 還是巨人玩的遊戲,如果沒有龐大的資金與人才,在這一塊領域是很難競爭的。參閱:[布蘭登觀點 090] AIGC 百花齊放的背後,更重要的是慎選商業模式。
AI Development Platforms

AI Development platforms 的意思就是提供企業客戶將 AI 模型導入到企業裡,一條龍的提供所有的服務,從資料的整理、模型的訓練到最後的產出。這種商業模式過去在舊的 AI 時代就有人在提供,但今年能夠延續,裡面就是換了湯跟藥,也許你會聽到有些團隊開始做 Model as A Service (MAAS) 的服務,就是希望協助企業客戶導入 LLM powered 的 AI 模型,而 LLM 的導入,也不是像我們從 ChatGPT 的想像類比到企業端的那麼簡單,中間還是有很多細節與問題需要去克服的,但全包是一種商業模式,解決中間的某幾個問題也是一種商業模式。今年度以來有 11 個案子,累積募資了 USD 873M,算是排名第二的類別。
LLM Application Development

這類別我解讀成是透過 Pre-Trained 好的 LLM 模型,搭配上你特定領域的資料,來微調訓練 (Fine-Tuning) 出更符合你這個產業類別的 LLM 模型。這邊可以是 Startups 自己有能力去把 LLM 導入到自己原本的題目中,去優化自己的服務,也可以是某個 Startups 特別去幫某類型的客戶去導入這樣的 LLM。總募資金額為 USD 314M,總案件量為 11 個案子,排名第三。
上述的排名也只能說是投資人對於外來的預測與喜好,也許再過個半年一年還是會有些變化,特別是 Open AI 如果又出了怎樣的功能,就會有人說「又有一批新創要死了」,但做投資的人總是要保持樂觀,有些領域就是這些大的 Player 無法去碰觸,或者是不想去碰觸的,你只要在這個領域,總還是有機會。剩下的類別都是五個案子以下,總募資金額幾乎都不超過 USD 100M,唯二只有 Vector Database (總募資金額 USD 176M,五個案件數) 與 Machine Learning Security (MLSec),總募資金額 USD 109M,四個案件數。Vector Database 是將資料處理到比較小,比較容易讓 LLM 可以有效的吃進去,節省 Token 使用量的一個方式,所以會有一定的關注度也不意外;而資安一直都是這類服務都會被提及的議題,所以也是有穩定的投資金額。
有趣的是,唯一掛零的是 Hardware-aware AI optimization,從硬體的角度來看,許多 AI 在 Edge 端的一些優化與應用,應該是很有題材性的,但考量到硬體端的運算能力還是比不上雲端,所以只能處理一些相對比較簡單的計算,跟今年在炒的「網路上」的 LLM,就算是不同故事線的事情了,也許這就是他關注度比較少的原因。
上面是我對於 CB Insights 的 LLMOps 市場地圖的解讀,解讀不一定正確,但提供大家參考的方向,如果你們有不同的見解,也歡迎跟我分享,我很樂意多多學習。下一回,我們從之前提到的 [布蘭登觀點 125] Generative AI 時代中,創業者你所佔據的是 Value Chain 的哪一塊?的架構下,來看未來的創業/投資機會。如果你認為這些內容很有幫助,也請幫我分享給你身邊的創業者,甚至可以訂閱我們的電子報,這樣好文章就不會錯過啦!
