字節跳動豆包文生圖模型升級至3.0版本 新增2K圖片直出功能
【太平洋科技快訊】4月17日,在火山引擎AI創新巡展杭州站的現場,字節跳動旗下火山引擎總裁譚待正式發佈了豆包1.5深度思考模型。與此同時,火山引擎對豆包文生圖模型也進行了重大升級,推出3.0版本。
新版本在文字排版上更加美觀,圖片生成能力更加精細,還新增了2K圖片直出功能,大幅提升了圖片生成的質量與效率,有望爲用戶帶來更優質的視覺內容創作體驗。新模型還具備了更強視頻搜索能力,模型能夠根據用戶搜索問題在視頻中尋找相應答案,進一步拓展了模型的應用場景。
豆包1.5深度思考模型採用了先進的MoE(Mixture of Experts)架構,並擁有200B的總參數和20B的激活參數。相較於業界同類模型,其參數規模降低了50%,這使得豆包1.5在推理成本上具備顯著優勢,能夠以更低的成本實現更高效的推理運算。
譚待指出,豆包1.5深度思考模型在多個關鍵領域展現出卓越性能。在數學、編程、科學推理等專業領域中,它能夠精準高效地處理複雜問題;在創意寫作等通用任務方面,同樣表現出色。此外,豆包1.5進一步拓展了功能邊界,將視覺理解融入其中,解鎖了諸多實用功能。例如,它能依據照片精準分析地貌特徵;在人們旅行時,輔助進行點餐決策;在企業辦公場景中,助力完成項目管理流程圖繪製等,爲用戶帶來了更爲多元且便捷的服務體驗。