十年如一日
December 30, 2024
十年後的第一篇部落格文章

挪威冬天時的 TrollTunga
停更部落格十年後,我決定是時候分享我這段創業路上的故事了。最近某天早上一覺起來,突然有些感觸,讓我想重新開始寫點東西 - 雖然不確定我準備好要分享這些故事了沒,但我知道我應該開始把它們記錄下來。
莫忘初衷
這一切是怎麼開始的呢?記得在 2014 年時,我面臨了一個職涯選擇:要繼續在 UCL 當博士後追求學術成就,還是要當創業家追尋自己的願景。
我選擇了後者,因為我喜歡創造、動手,也喜歡分享實在的東西。
從 2014 到 2020 年,我共同創立了 Umbo Computer Vision。這是一段從零開始打造公司的旅程。作為 CTO,我貢獻了我的技術專長,但最終還是說服不了自己要繼續在那邊當共同創辦人。當時,基於深度學習的電腦視覺演算法還是個新領域(像是卷積神經網路 ConvNets,包括 AlexNet、VGG、ResNet、YOLO 等等)。
我很幸運能參與打造第一個 AI 產品,即時事件偵測的自動影像安防系統。我們成功在雲端 GPU 和邊緣 AI ASIC 運算上部署 AI 產品。我也累積了不少建構大規模 AI 系統和產品級 AI 解決方案的經驗。這也是一堂耗資 920 萬美元的課程,讓我深刻體會到:再厲害的技術也不會自己變成爆款產品,go-to-market 才是關鍵。最後因為在公司長期發展方向上的分歧,我選擇離開創始團隊。
2020 年 6 月,我和在 UCL 實驗室的同事笑菲一起創立了 Instill AI。我們在研究室共事多年,她在拿到博士學位後也加入過 Umbo。我們對 AI 應該如何被實作和採用成為軟體基礎建設,有著共同的想法。這篇文章更詳細地說明了 Instill AI 的願景。
創立 Instill AI 至今已經四年了。我們一直專注在實踐對非結構化資料 ETL 的堅定信仰。處理非結構化資料應該要跟處理結構化資料一樣容易。Instill Core 就是我們實現理想中非結構化資料 ETL 工具的開源計畫。我們對它的設計和架構一直都很有自己的想法,更多細節可以看看這篇文章。
展望未來
從 2020 年至今,我們已經從頂級投資者那裡募集了 420 萬美元,而且已經有至少 1,500 位使用者使用過 Instill Core(和它的全託管服務 Instill Cloud)。
2025 年,AI 和資料市場將會持續蓬勃發展。大型語言模型(LLMs)和大型多模態模型(LMMs)是 AI 的新前沿,相比於第一波基於 ConvNet 的深度學習浪潮,它們將會徹底改變了軟體開發的實踐,特別是在非結構化資料領域,我認為主要有這幾個原因:
- 基於 Transformer 的預訓練模型已經強大到足以處理一般情況下的非結構化資料
- 近年來规模定律(Scaling Law)一直有被持續實現
- 巨頭們為了壟斷市場而競爭,加速了基礎模型和基礎建設的商品化(就像雲端運算和大數據時代發生過的事情一樣)
現在是 AI 和 data 領域創業的好時機。到了 2025 年,隨著規模定律即將達到極限,以及檢索增強生成(RAG)成為防止 LLM 產生幻覺的常見做法,我預見市場會在應用層面中出現更多的發展和競爭。我很興奮,自己能夠參與其中。