中新網(wǎng)包頭2月23日電 題:人大代表閆宏偉:當(dāng)稀土遇到DeepSeek
記者 李愛平
輕啟筆記本電腦,倒上一杯熱水,在內(nèi)蒙古自治區(qū)包頭稀土研究院,閆宏偉的一天這樣開始了。
蛇年春節(jié)過后,他在日常工作中多了一個“朋友”——DeepSeek(深度求索)。過去20多天,他將其運用到“稀土通用語料庫及其系統(tǒng)的設(shè)計和研發(fā)”(簡稱稀土語料庫)項目中,頗有成就感。
圖為閆宏偉在工作中。 中新網(wǎng)記者 李愛平 攝“在研究中,若有不懂之處,請教DeepSeek,很快就能獲得啟發(fā)?!遍Z宏偉近日在接受中新網(wǎng)記者專訪時表示,DeepSeek助力了研發(fā)項目,堪稱自己的“左膀右臂”。
作為全國人大代表,閆宏偉是在2024年全國兩會結(jié)束后開始擁抱人工智能的。彼時,他深感在稀土領(lǐng)域,融入人工智能,已是未來必然趨勢。
“但那時DeepSeek還未橫空出世,我只能通過購買各類專著,一點點學(xué)起?!痹陂Z宏偉的辦公室內(nèi),他學(xué)習(xí)過的《線性代數(shù)》《數(shù)據(jù)有道》等書籍上都留下了他標(biāo)記的勾勾畫畫。
學(xué)習(xí)一段時間后,閆宏偉開始主動介入人工智能。他最先運用到的是ChatGPT。“運用ChatGPT的第一感覺是,這款人工智能模型不僅能答疑解惑,還節(jié)省研發(fā)時間,但尚有美中不足之處?!?/p>圖為閆宏偉在四川參加學(xué)術(shù)會議。(資料圖,受訪者供圖)
閆宏偉認(rèn)為,在人工智能的助力下構(gòu)建稀土語料庫項目,能填補包頭稀土研究院在該項目上的空白?!霸谙⊥列袠I(yè)內(nèi)使用各類大語言模型、人工智能模型和機器學(xué)習(xí)模型進(jìn)行訓(xùn)練,時不我待?!?/p>
“現(xiàn)在DeepSeek-R1的中文理解能力大幅度提高,推理能力更是達(dá)到了全球領(lǐng)先水平。”閆宏偉認(rèn)為,必須對DeepSeek給予重新理解,找出更好的解決方案。
為此,他開始嘗試引入DeepSeek-R1作為助手,解決沒有資源、人手的困難。他力爭在6月份前完成稀土語料庫的研發(fā)。
“這個項目研發(fā)成功,也意味著一個標(biāo)準(zhǔn)稀土語料庫宣告建設(shè)完成。”閆宏偉認(rèn)為,這是自己這個人工智能領(lǐng)域“小白”努力至今做的最正確的事情。
稀土遇到DeepSeek,在閆宏偉的手中到底能碰撞出什么樣的火花?他認(rèn)為,開發(fā)稀土語料庫,首要是為了訓(xùn)練和微調(diào)自己的機器學(xué)習(xí)模型與大語言模型,這個應(yīng)用場景直觀但是需要專注細(xì)節(jié),通過不斷增加語料庫,可以為行業(yè)參與者提供持續(xù)的人工智能基礎(chǔ)支持。
當(dāng)下,閆宏偉在研發(fā)稀土語料庫的過程中,還開發(fā)了稀土語料庫管理系統(tǒng)。
“實際上這是一個語料庫生產(chǎn)系統(tǒng),利用它,可以不斷地將行業(yè)和組織的私有文獻(xiàn)加工成易于訓(xùn)練和微調(diào)的數(shù)據(jù)集,并且將原始資料和語料庫視為某種廣義標(biāo)記數(shù)據(jù)集?!遍Z宏偉認(rèn)為,此舉對探索跨文本(含音視頻等)資料語料化的技術(shù)路線和實現(xiàn)具有重大意義,也對他所從事的稀土行業(yè)有著重大意義。(完)