科大訊飛公佈領域問答大模型訓練專利 可節省人工成本

雷達財經 天眼查財產線索信息顯示,5月9日,科大訊飛股份有限公司申請的“領域問答大模型訓練及問答方法、相關設備及程序產品”專利公佈。

摘要顯示,本申請引入了裁判模型,能夠對輸入的答案進行偏好打分,評估答案的質量。基於領域知識庫提取領域問答數據,在對初始大模型進行迭代訓練時由裁判大模型對初始大模型生成的領域問題對應的第一答案,和領域問答數據中的第二答案分別打分,基於打分結果選取滿足偏好要求的答案與領域問題組成目標訓練數據,利用目標訓練數據對初始大模型進行訓練,得到最終的領域問答大模型,其採用了高質量的領域問答訓練數據進行訓練。本申請不需要人工對提取的領域問答數據進行校對即可得到高質量的目標訓練數據,節省了人工成本,提高了訓練效率。