
5 日 AI 影片生成工具 Pika 宣布完成 8,000 萬美元 B 輪融資。領投方是創投機構 Spark Capital,參與本輪投資的還有 Greycroft 、光速創投(Lightspeed Venture Partners)、Neo、Makers Fund 及好萊塢演員 Jared Leto、大西洋唱片公司 CEO Craig Kallman 等,這輪融資讓 Pika 估值超過 4.7億美元,儼然半隻獨角獸。
Pika成立於2023年4月,創辦人包括史丹佛大學AI Lab的博士研究生郭文景(Demi Guo)、孟辰霖(Chenlin Meng)和陳思禹(Karli Chen)。他們最早在開發者社群Discord公布Pika產品Demo,一時受廣泛歡迎。2023年11月,Pika宣布首輪5,500萬美元融資,投資人陣容堪稱矽谷式的明星組合:OpenAI創辦成員Andrej Karpathy、Perplexity創辦人Aravind Srinivas、HuggingFace創辦人Clem Delangue都是Pika投資人。
Pika融資現象很特殊:是中國赴矽谷求學創業的年輕創業家,罕見獲矽谷明星陣容風險投資機構和AI頂級科學家和企業家集體「蓋章認證」的明星創業公司。OpenAI帶著Sora強勢進入AI產影片戰場後,成了籠罩所有生成AI影片新創頭上陰影。如何應付OpenAI,找到定位和優勢,是包括Pika等所有玩家的「生存題」。看起來,Pika已用一輪成功融資階段性化解這問題。
從矽谷和中國創投界,有關於Pika融資和發展的兩個關鍵線索:
一,創辦期Pika曾接觸中國頂尖美元創投機構尋求融資,但沒有獲重視;後來,社群問答平台Quora和聊天機器人社群平台Poe創辦人Adam D′Angelo等矽谷明星創業家成了Pika團隊的創業導師,給這年輕華人團隊接觸矽谷AI全明星創投陣容的門票。
二,積極轉型人工智慧的老牌圖像和動畫軟體巨頭Adobe最近公布生成影片合作夥伴:OpenAI(Sora)、Runway和Pika。今年更早,Adobe曾發起Pika收購要約,但Pika沒有接受。接下來如何保持快速更新產品,實現模型層面技術累積和突破,建立AI影片創作者生態,是Pika需要專注的事。
這也是採訪團隊和Pika團隊新輪融資宣布前不久才談過的話題──關於Pika進化。
Pika是產品也是模型
矽谷的「宇宙中心」帕羅奧圖(Palo Alto)市中心一個安靜的街區,不起眼的「L」型單層建築藏在一片綠色內,沒有任何Logo,就是Pika辦公室。陽光從小院子透到Pika裝潢簡潔的辦公區,員工在喜歡的位置忙碌著。
這家公司最初視為「一人也能建立百億美元估值公司」的典型代表。郭文景和孟辰霖等創辦公司後,一直沒有大規模招募,員工只有八人,一年後員工也只30人。當然工程師占多數。Pika工程師不是獨立團隊,而是分散到基礎研究和產品開發兩端,分為研究工程師和開發工程師,分別負責生成影片模型,以及針對「創作者」影片工具開發。
很多人不曾注意:Pika有自己生成影片模型,而不是套殼工具和框架整合者。早期可能用Stable Difussion開源模型開發過,但現在有自己模型了。
「我們的模型是自己研發。我們有工程和模型團隊,也有研究員團隊,會藉鑑各種研究,最終形成自己的模型,是我們的核心能力。」Pika創辦科學家Omer Bar Tal表示:「如果有個強大基礎模型,影片生成基本能力和功能就夠強大。模型不停更新後,產品就有更多可能。」
Pika保持穩定節奏:2023年11月,Pika發表首款AI生成產品Pika 1.0,支援文字產生影片、圖像產生影片及影片產成影片。公開資訊顯示,Pika用戶數達數百萬,每週產生數百萬支影片。不過Sora誕生後,人們一度認為大語言模型故事會在影片模型重演,也就是Sora一枝獨秀,OpenAI將格局又變成「一超多強」。
Sora出現後Pika有緊張過。不過一段時間觀察後,認為Sora更像模型大力出奇蹟的工程產物。產品計畫方面,Sora似乎沒有計畫短期推出大眾用產品。
「展示五支效果最好Demo,和真正給一般用戶中間,其實有很大不同。」Pika團隊認為「Demo背後,很多人是全職製作,如果有上萬張GPU,想產生多少Demo就有多少。當沒有這麼多資源時,真的產生的影片內容也不同。」
對Pika來說,優先順序和目標一直沒有變。郭文景和孟辰霖最初決定創業的契機,就是參加AI生成影片競賽,發現產品無法讓一般用戶產生想要的創意影片,於是他們決定自己做。
▲ Pika 創辦人郭文景與孟辰霖。(Source:Pika)
Pika目標從那時起,一直是給用戶核心更好功能,而不只是展示Demo。對Pika來說,更重要的研發是如何讓強大模型與產品結合。模型是產品重要部分,但許多功能需要更多使用者挖掘。維持人才密度同時,Pika也頻繁跨團隊合作,更靈活確保交流簡單直接。工程師和研發人員升級模型後,會直接和產品團隊討論,找到使用者角度出發的點,然後功能具體化。思路貫穿Pika這年產品。
2023年12月Pika 1.0上線,之後Pika研發團隊發表學術成果DreamPropeller,提高文字轉3D的速度,4.7倍提速體現到產品。目前Pika影片產生時間是同類型產品最快,都是為了使用者體驗和可用性。
今年2月Pika推出Lip Sync(唇語同步)功能,也是多個同類型競賽沒有的功能。對一般使用者來說,對嘴一直是「剛需」,同時也是C端產品病毒傳播的好方法,產品設計背後,同樣需大量資料微調模型才有對應能力。
Pika也持續推出Sound Effects,可幫影片加上音效,功能不停更新,並分為免費和付費模式。產品面看到的使用者真實需求,會回到模型訓練。如更長更有趣的影片是最大挑戰,要實現就需讓模型產生過程確保一致性。
Pika從多技術方面解決問題,含視訊表徵(Video representation)法,讓模型能理解不同場景背後其實是同個元素。提示詞方面Pika不僅模型層面提高理解度,產品也要最佳化,用戶可選不同風格,是對提示詞的可視化呈現,更直接瀏覽不同風格視覺元素。
Pika Discord社群及X等可看到大量用戶案例,也拿下多家大企業客戶,有些廣告都使用Pika產生成的影片。Pika也在接觸和拓展更多種類創作客戶,包括短劇。全球受歡迎短劇多數是中國產。
Pika不是AI版Adobe,是TikTok
Pika大會議室很忙,除了接待合作商,年輕CEO郭文景也常在這裡和同事討論產品和技術。經常遇到她從會議室出來,呼叫同事又快速回到會議室討論。常與她討論的也有不少藝術家。與純技術類模型公司不同,Pika還有創意部門負責挖掘產品能力,因代表Pika最主要目標使用者──創作者等個人使用者。
「每個人都能當導演」,這是Pika的Slogan,與Sora、Runway等產品定位明顯不同。資金更雄厚的產品,許多作品展示和應用場景都傾向好萊塢級,OpenAI也多次傳出與好萊塢簽約,試圖進入這龐大工業體系。Pika當然也前進好萊塢,投資人也有好萊塢從業人士,但更想抓住廣大個體。
「你們自己看Pika,認為比較像TikTok,還是Photoshop?」筆者問。
Pika創辦科學家Omer Bar Tal認為:創作意義,TikTok的創作解放在Pika身上很明顯,可能與TikTok不同的是,他們產品品質更好。
「所以更像創作者用的TikTok。我們希望Pika讓用戶更有創意。」Omer說。
TikTok改變人與視訊等媒介的互動方式,但有了生成式AI後,互動還可更徹底改變。郭文景常提到長遠目標,就是靠技術進步徹底重塑影片製作與消費互動模式,然後靠累積數據反過來繼續推動技術。
創作者版TikTok能為Pika帶來更多想像空間,對解決生成式AI領域商業模式問題也會有新想法。專案部署深度客製化合作,以及訂閱付費等單向商業模式外,平台化本身會開啟更多可能。
長遠定位會要求Pika這階段產品要更符合個人使用者喜好,一年成長後在模型技術之外,增加更多產品和創作者氣質。他們每週都會有和創作者團隊的討論會,有趣新功能就此誕生,如最近Pika多一個讓emoji動起來的功能(好像蘋果也有做),這就是創意團隊發現,然後與技術團隊溝通,成了新產品功能,上線後也很受用戶喜愛。
產品團隊方面,X最近陸續有產品經理宣布加入Pika。Pika新用戶頁面會更簡潔,對一般用戶更友善,Pika 2.0也會有模型層面大幅更新。「從產品到視訊模型,接下來是全新的Pika。」Omer說。