五月四房婷婷-五月桃花网婷婷亚洲综合-五月天丁香花婷婷-五月天丁香色-天天射视频-天天射天

逐浪 AIGC|Hugging Face匯聚30萬個AI模型后,最新估值到了45億美元
2023-09-01 08:53:47 來源:21世紀經濟報道 編輯:

南方財經全媒體記者江月 上海報道

“百模大戰”不足以形容2023年的AI模型訓練熱潮,行業蓬勃程度突破想象。

8月末,南方財經全媒體記者從開源代碼平臺Hugging Face內部人士處了解到,在過去8個月里,Hugging Face上的預訓練模型數量從此前積累的10萬個增長到了超過30萬個,數據集從1萬個增長至5.8萬個,估值也從20億美元飆升到45億美元。

Hugging Face正逐步成為全球最大的大模型庫。8月末,Hugging Face宣布最新一輪融資成功,共籌集到2.35億美元,公司估值較去年同期上漲1倍至45億美元,投資方包括Salesforce、谷歌、IBM、亞馬遜等科技巨頭,英偉達、英特爾、AMD、高通等芯片公司以及知名風險投資機構Sound Ventures等。

盡管對話式機器人ChatGPT率先引發了全球關注,但全球開發者的AI模型研究,目前不限于語言類,還包括圖像生成、聲音生成和轉移、視頻生成等。這反映,人工智能開發者仍然在從不同方向挖掘市場需求點,未來還可能出現新的“爆款應用”。

AI融資加速

Hugging Face在2023年乘AIGC東風而上,它被稱為AI領域的GitHub,今年銷售量大增,且加快融資速度、身價倍增。

一名Hugging Face內部人士近期告訴南方財經全媒體記者,截至8月底,在Hugging Face平臺上公開的人工智能模型數量已經超過30萬個,未公開的數量甚至更多。另外,數據集也達到5.8萬個。公司也在迅速擴張,團隊人數從去年的30人擴張到了160多人。

與去年年末的數據相比,這意味著在2023年前8個月,該平臺上的預訓練模型數量增長200%,數據集數量增長接近500%。

該人士介紹,Hugging Face目前對業界提供模型托管、社區交流,仍在圍繞AI發展完善各種功能。在中國,Hugging Face也深入社區交流、提供免費的課程,從而促進當地有興趣的開發者加速流入行業,也盡早推廣“人人使用AI”的理念。

此前有市場消息還稱,Hugging Face今年的ARR(年度經常性收入)可能達到4000萬美金左右。Hugging Face首席執行官克萊門特·德朗格(Clément Delangue)近期預計,2023年總收入將為2022年的五倍,因為市場需求十分旺盛。據Hugging Face此前披露,包括微軟、谷歌、Bloomberg、英特爾等各個行業超過1.5萬家機構都成為它的用戶,而其中付費用戶已有3000多家。

全球今年,一級市場加速對人工智能產業的投資。風投數據分析公司PitchBook稱,2023上半年,全球人工智能領域共計發生融資1387件,籌集融資金額255億美元,平均融資金額達2605萬美元。如要分析業務結構,以硅谷的AI創業公司為例,分為基礎大模型層、中間層和垂直場景應用層三種,盡管基礎大模型層產生了OpenAI這樣的獨角獸,但從事中間層數據庫、工具包以及應用層的公司,也不乏亮點。

Hugging Face由法國連續創業者德朗格和兩位伙伴在2016年創辦,NBA球星杜蘭特是其天使融資者之一;2018年5月,它又獲得了400萬美元的種子輪融資;2019年12月,Hugging Face拿到了總額1500萬美元的A輪融資;2022年5月10日,Hugging Face宣布C輪融資籌集了1億美元,估值達到20億美元。2023年8月的最新一輪融資,是該公司單筆融資規模最大的一筆,也令估值達到45億美元。

值得留意的是,以往融資中,財務投資者比重高;這一次,新一輪投資中出現諸多科技巨頭面孔。以領銜投資的Salesforce為例,這家企業級軟件開發巨頭近來也在持續提升產品中的AI功能,包括通過網站頁面上下文生成銷售電子郵件、回復建議提供、自動總結與客戶的對話摘要等。此外,諸多本形成競爭關系的科技巨頭同時投資了該公司,反映業內希望通過促進AI發展,給科技界帶來新的增長機遇。

AI開源模型迅速增長

AI模型開發,成為2023年上半年全球關注的科技熱點。一方面,開源與閉源的優劣比較被再次搬上舞臺;另一方面,AI模型開發之后如何進行應用落地,得到諸多探討。

Hugging Face成立于2016年,但推動人工智能模型“開源”開始于2018年底。當年11月,谷歌宣布推出預訓練大語言模型BERT,瞬間成為了自然語言理解領域最“紅”的模型,但初期只有TensorFlow版本。Hugging Face創始人之一Thomas Wolf完成并開源了PyTorch版本的BERT,這吸引了大量開發者涌入Hugging Face。

在ChatGPT走紅之后,Hugging Face繼續吸納更多開發者涌入,不少人集中在機器學習、AI大模型開發上。由于Hugging Face支持大文件的上傳、免費提供hosting(網站托管)、免費提供全球CDN(內容分發網絡),還可以一鍵部署,也就是點一下鼠標就將模型快速地布署到亞馬遜云上,從而很快將模型使用起來,因此受到開發者歡迎。

不過,開源和閉源的優劣之爭也在持續。

目前,“開源”模式獲得不少知名公司和機構的支持,例如Meta旗下的LLaMA、斯坦福大學旗下Alpaca、Databricks旗下Dolly 2.0等均已經公開了“算法”。

“開源生態的好處在于,它集思廣益,今天你發現一個漏洞、明天他發現一個功能增補,貢獻者在看著大模型獲得點贊以及落地應用時,將獲得很大的成就感。”一位開源社區的經營者告訴南方財經全媒體記者。

不過,支持“閉源”的人士也有自己的理由。例如,2023年紅遍全球的GPT大語言模型,于3月14日發布了GPT-4版本,這個模型選擇了“閉源”模式,這其中有安全性、版權和商業競爭的復雜考量。

大模型“開源”,到底開放的是什么樣的資源?開源字面意思是“公開源代碼”。例如Linux操作系統所開放的就是操作系統內核源代碼。

大語言模型開放,則更為復雜。業界認為,核心在于“算法”加上“參數”,算法的核心部分主要包括模型結構和訓練方法,而參數更是極難獲得、高質量的人工標注數據。由于大模型的核心構成包括算法、算力和數據這三駕馬車,因此缺少任何一樣元素都難以“復制”目標大模型。

支持大模型以開源形式發展的人士普遍認為,開源模型下的數據集依然透明,這對于使用者是一個便利,這樣的數據集更容易維持觀點均衡、沒有偏頗。

在AI模型大量涌現之后,應用落地將在不遠的將來吸引更多人的注意。記者在Hugging Face上注意到,盡管語言大模型因對話機器人率先受到大眾關注,但開發者并不局限于這一領域,而是對圖像、聲音、視頻以及多模態模型各有涉獵。

如何產生更多像ChatGPT的“爆款”應用?“從事AI模型落地,一方面要在市場上尋找需求,另一方面也不能僅通過API坐享其成模型開發成果,應當更關注數據庫的建立。”一名模型開發工程師如是向南方財經全媒體介紹。

關鍵詞:

相關閱讀
分享到:
版權和免責申明

凡注有"環球傳媒網 - 環球資訊網 - 環球生活門戶"或電頭為"環球傳媒網 - 環球資訊網 - 環球生活門戶"的稿件,均為環球傳媒網 - 環球資訊網 - 環球生活門戶獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網 - 環球資訊網 - 環球生活門戶",并保留"環球傳媒網 - 環球資訊網 - 環球生活門戶"的電頭。

主站蜘蛛池模板: 亚洲乱码一二三四区国产 | 天天操综合视频 | 国产91精品不卡在线 | 色吧首页 | 久久国产成人精品国产成人亚洲 | 欧美成人一区二区三区在线视频 | 精品国产一区二区三区麻豆小说 | 乱人伦99久久 | 亚洲精品午夜国产va久久成人 | 三级黄色片免费 | 成人羞羞视频播放网站 | 国产成人深夜福利短视频99 | 在线观看日韩 | 天天干天天摸天天操 | 亚洲欧美在线视频免费 | 欧美色图偷窥自拍 | 麻豆精品不卡国产免费看 | 日本天堂网在线 | 五月天免费在线视频 | 男女羞羞视频网站免费 | 天天曰天天干 | 欧美视频日韩专区午夜 | 91短视频版在线观看免费大全 | 黄片1234 | 亚洲免费久久 | 激情伊人| 免费乱理伦片在线观看八戒 | 成年在线视频免费视频观看 | 成年人视频在线免费看 | 99精品日韩 | 国产精品久久久久乳精品爆 | 欧美日韩国产在线播放 | 日皮视频免费看 | 日本人xxxxxxxxx99 | 无码免费一区二区三区免费播放 | 日日操网站 | 日韩高清在线日韩大片观看网址 | 国产欧美一区二区三区久久 | 五月婷婷伊人 | 最近2019中文字幕大全7 | 91最新免费地址入口 |