6月26日,東北大學計算機科學與工程學院任飛亮副教授帶領“東北大學知識圖譜研究組”發布了大語言模型TechGPT。
TechGPT是東北地區首個全量微調并開源的大模型,與當前其他各類大模型相比,TechGPT主要強化了以“知識圖譜構建”為核心的關系三元組抽取等各類信息抽取任務、以“邏輯推理”為核心的機器閱讀理解等各類智能問答任務、以“文本理解”為核心的關鍵詞生成等各類序列生成任務。
在這三大自然語言處理核心能力之內,TechGPT還具備了對計算機科學、材料、機械、冶金、金融和航空航天等十余種垂直專業領域自然語言文本的處理能力。
目前,TechGPT通過提示和指令輸入方式的不同,支持單輪對話和多輪對話,涵蓋了領域術語抽取、命名實體識別、關系三元組抽取、文本關鍵詞生成、標題生成摘要、摘要生成標題、文本領域識別、機器閱讀理解、基礎常識問答、基于上下文的知識問答、建議咨詢類問答、文案生成、中英文本互譯和簡單代碼生成等多項自然語言理解和生成能力。
TechGPT以BELLE作為大模型底座,并以小組2018年推出的TechKG大型中文多學術領域的知識庫為訓練語料,分別完成了70億參數(7B)和130億參數(13B)模型的訓練。
東北大學知識圖譜研究組致力于構建開放共享的知識圖譜環境,目前小組已分別在GitHub和HuggingFace上將模型相關內容開源,并提供了在線體驗服務。