成人人人视频亚洲香蕉的|外国一级黄色中文字幕视频|av高清无码手机版线上免费播放|强奸最新av在线观看|av久久中文字幕一区|av岛国片在线观看|丁香五月激情四射综合网|国产真实偷拍黄色一级电影|日本黄色产业一区二区在线观看|午夜影院久久久草久草久久草

教育在線
教育在線
南京理工大學(xué)發(fā)布國內(nèi)首個人文社會科學(xué)學(xué)術(shù)大語言模型
2026-05-09 14:11
南京理工大學(xué)
作者:

  日前,南京理工大學(xué)沈思教授團(tuán)隊開源發(fā)布國內(nèi)首個人文社會科學(xué)領(lǐng)域?qū)W術(shù)大語言模型——“蘭章”,標(biāo)志著該校在“AI+人文社會科學(xué)”知識體系構(gòu)建方面邁出重要一步。“蘭章”憑借百億詞元的堅實數(shù)據(jù)基礎(chǔ)以及兩階段深度優(yōu)化訓(xùn)練,較好地解決了當(dāng)前通用AI工具在人文社科全文本挖掘、復(fù)雜概念和論證邏輯理解方面“盲域”和“幻覺”問題,不僅可以輔助用戶系統(tǒng)地獲取和梳理海量學(xué)術(shù)資源,還能夠幫助人文社會科學(xué)領(lǐng)域?qū)W者總體評價既有成果并敏銳發(fā)現(xiàn)新學(xué)術(shù)研究契機。

  “蘭章”研發(fā)團(tuán)隊歷時五年,構(gòu)建了總規(guī)模116億詞元的人文社會科學(xué)學(xué)術(shù)語料庫,涵蓋CSSCI、CNKI人文社科期刊、人大復(fù)印報刊資料、教育部人文社科獲獎著作全文(1992~2025年)等中文學(xué)術(shù)資源以及SSCI、A&HCI期刊摘要及Project MUSE、Project Gutenberg(1992~2025年)等學(xué)術(shù)資源,保證了學(xué)科的均衡覆蓋以及期刊與著作的深度集成?!疤m章”憑借百億級詞元的堅實數(shù)據(jù)基礎(chǔ),較好解決了通用AI工具主要依靠論文標(biāo)題、摘要等簡單信息挖掘語料,難以理解完整文本中復(fù)雜概念和論證邏輯的難點痛點問題。

  “蘭章”研發(fā)團(tuán)隊選取人文社會科學(xué)全文本評測中表現(xiàn)較好的Qwen3-8B與Qwen3-32B基礎(chǔ)模型進(jìn)行兩階段的深度優(yōu)化訓(xùn)練:在第一階段,運用116億詞元的學(xué)術(shù)資料系統(tǒng)融入人文社科學(xué)科知識和學(xué)術(shù)表達(dá)方式,提升基礎(chǔ)模型的的全文本理解能力;在第二階段,團(tuán)隊圍繞核心學(xué)術(shù)任務(wù)設(shè)計15697條訓(xùn)練指令,在多學(xué)科專家驗證基礎(chǔ)上反復(fù)精細(xì)調(diào)優(yōu),形成并持續(xù)提升模型的專業(yè)推理能力。經(jīng)過深度優(yōu)化訓(xùn)練,“蘭章”表現(xiàn)顯著優(yōu)于多款通用模型,有效解決了跨語言環(huán)境下低頻專業(yè)術(shù)語的識別盲區(qū)問題和學(xué)術(shù)文本生成中的邏輯碎片問題,圖書自動分類準(zhǔn)確率比通用模型高出30%。

  團(tuán)隊負(fù)責(zé)人沈思教授介紹,“大模型不是代替學(xué)者思考,而是立足實際學(xué)術(shù)研究,把自主知識體系的構(gòu)建延伸到模型化和計算化的層面,從工具層面為人文社會科學(xué)學(xué)術(shù)創(chuàng)新提供持續(xù)支持?!蹦壳?,“蘭章”已上線魔搭社區(qū)試運行,15697條訓(xùn)練指令數(shù)據(jù)已全部開源共享。

  近年來,學(xué)校高度重視哲學(xué)社會科學(xué)工作,積極推進(jìn)一般社會科學(xué)與學(xué)校優(yōu)勢學(xué)科群的交叉融合,以數(shù)智技術(shù)賦能哲學(xué)社會科學(xué)研究?!疤m章”的發(fā)布,是學(xué)校積極推進(jìn)精品化特色化哲學(xué)社會科學(xué)研究,加快構(gòu)建中國哲學(xué)社會科學(xué)自主知識體系進(jìn)程中的又一最新成果。

  “蘭章”研發(fā)團(tuán)隊負(fù)責(zé)人沈思現(xiàn)為經(jīng)濟管理學(xué)院教授,博士生導(dǎo)師,主要研究方向為信息檢索、大語言模型,近五年主持國家社科基金重點項目、國家社科基金后期資助項目、國家自然科學(xué)基金面上項目、江蘇省哲學(xué)社會科學(xué)基金、江蘇省自然科學(xué)基金等項目7項,2025年獲江蘇省第十八屆哲學(xué)社會科學(xué)成果獎二等獎。

  附:“蘭章”大語言模型開源地址

  https://modelscope.cn/models/njauzwh/HssaLLM-8B

  https://modelscope.cn/models/njauzwh/HssaLLM-32B

  https://modelscope.cn/datasets/njauzwh/HssaLLM-SFT-data

免責(zé)聲明:

① 凡本站注明“稿件來源:教育在線”的所有文字、圖片和音視頻稿件,版權(quán)均屬本網(wǎng)所有,任何媒體、網(wǎng)站或個人未經(jīng)本網(wǎng)協(xié)議授權(quán)不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復(fù)制發(fā)表。已經(jīng)本站協(xié)議授權(quán)的媒體、網(wǎng)站,在下載使用時必須注明“稿件來源:教育在線”,違者本站將依法追究責(zé)任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉(zhuǎn)載稿,本站轉(zhuǎn)載出于非商業(yè)性的教育和科研之目的,并不意味著贊同其觀點或證實其內(nèi)容的真實性。如轉(zhuǎn)載稿涉及版權(quán)等問題,請作者在兩周內(nèi)速來電或來函聯(lián)系。

相關(guān)新聞