上證報中國證券網訊(記者 溫婷)9月25日,阿裡雲開源通義千問140億參數模型Qwen-14B及其對話模型Qwen-14B-Chat,可免費商用。
據介紹,大規模預訓練模型參數量大、訓練成本高,開源大模型可以説明使用者簡化模型訓練和部署過程,使得使用者不必從頭訓練模型,只需下載預訓練好的模型並進行微調,就可快速構建高品質的模型或進行相應的應用開發。目前,7B(70億)參數是開源大模型中最常見的規模,此外比較常見的開源模型尺寸還有13B(130億)、20B(200億)、70B(700億)等。
此前8月,阿裡雲開源通義千問70億參數基座模型Qwen-7B,一個多月下載量破100萬。浙江大學聯合高等教育出版社基於Qwen-7B開發了智海-三樂教育垂直大模型,已在全國12所高校應用,可提供智慧問答、試題生成、學習導航、教學評估等能力。模型已在阿裡雲靈積平臺對外提供服務,一行代碼即可調用。
此次最新開源的Qwen-14B是一款支援多種語言的高性能開源模型,相比同類模型使用了更多的高品質資料,整體訓練資料超過3萬億Token,使得模型具備更強大的推理、認知、規劃和記憶能力。使用者可從魔搭社區直接下載模型、體驗模型,也可通過阿裡雲靈積平臺訪問和調用Qwen-14B和Qwen-14B-Chat。
“一花獨放不是春,百花齊放春滿園。不管是閉源大模型還是開源大模型,自研大模型還是協力廠商大模型,大規模參數模型還是小規模參數模型,通用大模型還是行業、企業專屬大模型,阿裡雲全部歡迎和支援,共同建設一個最大的大模型自由市場,”阿裡雲副總裁、公眾與客戶溝通部總經理張啟表示,“我們希望所有大模型都能跑在阿裡雲上,跑得更快、更便宜、更安全。也因為此,阿裡雲率先開源7B、14B模型,並將持續開源開放,為開源社區貢獻力量。”
最新評論