所屬欄目:核心期刊 更新日期:2025-06-04 14:06:06
計算機研究與發展最新期刊目錄
基于長距離上下文的大語言模型預訓練數據檢測方法————作者:張偉超;張儒清;郭嘉豐;范意興;
摘要:預訓練數據檢測方法旨在大語言模型的預訓練數據未公開時,檢測某段給定的文本是否屬于該模型的預訓練數據,可用于審查大語言模型的預訓練數據使用過程是否符合法律法規.現有方法通常認為大語言模型對訓練文本的詞元概率在整體上比非訓練文本的高,并基于此判定具有高預測概率的文本為訓練文本.然而,由于訓練文本和非訓練文本之間存在著大量的短片段重疊現象,導致模型對非訓練文本的詞元概率也可能比較高,使得現有方法容易將非...
支持端邊云多運行時協同應用的網程系統————作者:俞子舒;王一帆;曾琛;張星洲;彭曉暉;徐志偉;
摘要:研究人員針對不同的負載類型提出并實現了大量的運行時系統,幫助用戶構建單機或分布式應用.在端邊云協同場景中,由于應用各組件在保質要求、運行時環境和通信協議方面存在異構性,因此難以通過單一運行時構建性能出色且魯棒的端邊云協同應用.將應用的各個組件獨立部署到不同的運行時會增加應用管理的難度,并且缺乏對性能和容錯方面的統一支持.為解決上述問題,實現了網程系統,支持多種運行時的統一接入和使用.網程系統通過網...
基于多窗口劃分集成學習的多維時間序列異常檢測————作者:王澤南;王意潔;周小暉;熊旭東;
摘要:大模型時代下,大模型的訓練和推理需要算力資源的支撐,其中針對算力資源指標數據的異常檢測能夠有效保障大模型的正常訓練和推理.隨著大模型參數的增加,大模型使用的算力資源規模日益擴大,其中反映算力運行狀態的多類指標數據隨著時間推移呈現出更復雜的時序周期性變化.現有的多維時序異常檢測方法通常采用預設的窗口大小對多維時序數據進行滑動切片,但忽略不同維度周期特性的統一窗口劃分會截斷部分維度時序數據的完整周期性...
基于圖插值和可變形卷積神經網絡的序列推薦————作者:劉昕悅;尹海蓮;臧亞磊;吳文隆;卓俊男;徐鳳如;陳呂瑩;馬維華;李博涵;
摘要:序列推薦系統旨在基于用戶的歷史行為偏好預測下一步行為.盡管針對序列推薦提出了許多有效的方法,但仍然存在根本性的挑戰.首先,隨著在線服務的普及,推薦系統需要同時服務于熱啟動用戶和冷啟動用戶.然而,由于難以從交互數據有限的序列中學習到有效的序列依賴關系,大多數依賴于用戶-項目交互的現有模型失去了優勢.其次,由于現實中用戶意圖的可變性和主觀隨機性,用戶在其歷史序列中的行為往往是隱含和復雜的,很難從這些用...
基于大語言模型的知識庫查詢風格自適應轉換————作者:付鈞渤;趙國帥;錢學明;
摘要:大語言模型在知識存儲方面不斷增強的能力展示了其作為知識庫的潛在效用.然而,任何給定的提示只能提供大語言模型所涵蓋知識的下限估計.在語言模型即知識庫(language models as knowledge bases,LMs-as-KBs)的場景中,先前的提示學習方法忽略了查詢風格對模型表現的影響.揭示了大語言模型確實具有與查詢風格相關的可學習偏好,并且利用大語言模型的這種特性引入了查詢風格自適應...
目標檢測模型綜述————作者:李承燁;張震;梁哲恒;姚潮生;張金波;晏榮杰;吳鵬;
摘要:目標檢測技術是計算機視覺領域的關鍵組成部分,它在各種實際應用中扮演著至關重要的角色.目標檢測技術經歷了幾十年的發展,從早期依賴于手工特征提取的方法,到當前深度學習模型的廣泛應用.目前在目標檢測領域缺少以深度學習基礎模型技術的改進為發展脈絡的總結研究,在此背景下,以人工智能領域基礎模型的發展過程為線索,圍繞不同種類基礎模型概述了基于這些模型的不同目標檢測模型的發展,同時對這些基于不同基礎模型的目標檢...
群智感知中基于個性化差分隱私真值發現方法————作者:王濤春;強勇;許諾;陳付龍;謝冬;趙傳信;
摘要:在群智感知系統中,用戶通過提供感知數據完成感知任務.然而,由于傳感設備精度、用戶行為以及環境條件等因素的影響,不同用戶提供的數據質量存在顯著差異.真值發現技術能夠有效地消除低質量數據影響,從而能夠更好地利用感知數據,但現有的真值發現方法往往忽略用戶個性化隱私要求,且基于加密的隱私保護技術難以應用于大量用戶參與的群智感知系統.基于此,提出一種個性化差分隱私真值發現(personalized diff...
面向信息系統設計的癌癥階段生物標志物識別————作者:陳伯林;張勁雷;張建君;胡悠鵬;王騰;楊曼婷;卞軍;尚學群;
摘要:癌癥是1種復雜且動態變化的高異質性疾病.它的發生發展伴隨著大量的基因突變與功能失調.識別癌癥階段相關的生物標志物,對于了解癌癥的致病機理與發展機制至關重要.然而,現有的癌癥生物標志物識別方法通常將各個基因看作是孤立的節點,且僅關注癌癥的二分類效果,忽略了不同基因之間的交互關系變化以及不同病理階段的顯著差別.為解決上述問題,首先為癌癥各階段構建回歸殘差網絡(regression residual n...
非獨立同分布數據下層次化Sinkhorn距離聚類聯邦學習算法————作者:趙瑞;段小文;劉新;周睿;周慶國;
摘要:聯邦學習作為一種邊緣計算中的新興分布式神經網絡訓練方法面臨著客戶端數據異構性挑戰,其中聚類聯邦學習被認為是一種頗具潛力的解決方案,然而現有聚類聯邦學習算法未深入探究量化客戶端數據分布差異.針對該問題提出了一種新穎的層次化聚類聯邦學習算法(hierarchical Sinkhorn distance-based clustering federated algorithm,HS-CFA),采用最優傳...
視覺語言大模型的幻覺綜述:成因、評估與治理————作者:李煦;朱睿;陳小磊;伍瑾軒;鄭毅;賴承杭;梁宇軒;李斌;薛向陽;
摘要:視覺語言大模型(large vision-language models,LVLMs)代表了自然語言處理與計算機視覺交叉領域的一項重要進展.通過結合預訓練的視覺編碼器、視覺語言適配器和大語言模型,LVLMs能夠同時理解圖像與文本信息,并通過自然語言進行響應,適用于圖像描述、視覺問答等多種視覺語言下游任務.然而,這類模型普遍存在幻覺現象,即模型對于圖像內容進行了錯誤感知,制約了其在醫學圖像診斷 、自...
基于多尺度邊框融合的實體語義增強方法————作者:吳燦;陳艷平;扈應;黃瑞章;秦永彬;;
摘要:命名實體識別是自然語言處理中的一項傳統任務.基于跨度分類的方法是用來解決嵌套命名實體識別的主流方法.該方法通常是拼接實體邊界的表示來獲得的跨度.然而,長實體容易導致2個實體邊界之間的語義關聯被弱化.并且單一尺度的跨度無法完整地捕捉實體在不同上下文中的表現.對此提出了一種基于多尺度邊框融合的實體語義增強方法.該方法將跨度表示為帶有邊界位置信息的邊框.首先,將通過融合不同尺度實體特征得到多尺度邊框以增...
一種可動態伸縮的移動端深度計算圖算優化方法————作者:羅詩妍;劉思聰;郭斌;方程;王敏帆;郭賽;於志文;
摘要:近年來,將深度神經網絡(deep neural network,DNN)引入移動設備成為一種趨勢.智能手機、可穿戴設備和嵌入式設備上集成了許多便利生活的應用,如語音助手和活動識別.然而,在資源受限(如算力、存儲和電池)移動終端部署計算密集型深度模型具有挑戰.現有方法如手工設計的DNN壓縮技術和自動化按需DNN壓縮技術局限于優化模型結構,限制了DNN部署的性能優化上限,難以適應資源極度受限的終端設備...
OpenPlanner:一個開源的時間敏感網絡流量規劃器————作者:姜旭艷;全巍;付文文;張小亮;孫志剛;
摘要:時間敏感網絡(time-sensitive networking, TSN)在工業控制、航空電子和車載網絡中具有廣泛的應用前景.TSN流量規劃是在拓撲結構、網絡資源、設備能力和業務需求等多維約束下,為TSN交換機計算關鍵幀的無沖突發送時刻的過程,規劃問題是一個NP完全問題.目前不論是學術界的TSN規劃算法研究,還是工業界的TSN部署應用都急需一個開源的規劃器軟件.提出一種構件化、松耦合的TSN規劃...
FireLink:一種面向芯粒設計空間探索的評估框架————作者:李開 ;曾坤 ;榮培濤 ;陳志強 ;張甜 ;王永文 ;
摘要:基于先進封裝技術的芯粒(Chiplet)集成芯片在制造成本、設計效率以及專用定制等方面更具優勢,是延續芯片性能增長的有效途徑.設計空間探索(design space exploration,DSE)作為體系結構量化分析的重要方法,能夠幫助設計者理解并權衡設計參數間的復雜關系.但是將傳統的芯片體系結構DSE方法直接應用于Chiplet設計時,存在評估不全面、模擬不精確以及探索效率低下等問題,針對這些...
《計算機研究與發展》2023年論文高被引TOP10
摘要:<正>~
面向LoongArch邊界檢查訪存指令的GCC優化————作者:舒燕君;鄭翔宇;徐成華;黃沛;王永琪;周凡;張展;左德承;
摘要:為了減少內存安全檢查的開銷,LoongArch指令集架構引入了邊界檢查訪存類指令.然而,作為一種新的內存訪問指令,目前GCC(GNU compiler collection)編譯器不支持該類指令,LoongArch硬件能力不能得到充分利用.針對此LoongArch邊界檢查訪存指令改進了GCC編譯器,實現利用該類指令優化程序的內存安全檢查.具體而言,完成了3個方面的工作:1)設計實現了針對邊界檢查訪...
結合卷積增強窗口注意力的雙分支語音增強神經網絡————作者:張晨輝 ;原之安 ;錢宇華 ;
摘要:在復雜環境以及突發背景噪音條件下,語音增強任務具有極大的困難和挑戰.主要原因是現有的語音增強方法未能有效捕獲語譜圖特征,尤其是局部信息.在過去的研究中,Transformer模型更專注于音頻的全局信息,而忽略了局部信息的重要性.在音頻經過短時傅里葉變換(STFT)處理后,多數模型僅使用幅值信息,而忽略了相位信息,導致它們未能有效捕獲語譜圖特征,從而影響了語音增強的效果.基于此設計出一個帶有卷積增強...
GroupUCP:按需動態調節的細粒度緩存劃分策略————作者:張傳奇;王卅;孫凝暉;包云崗;
摘要:隨著現代計算機技術的進步,內存墻問題越發嚴重.在此背景下,多級緩存中的末級緩存成為了影響性能的關鍵資源.近年來各項研究通過拓展尺寸,以及動態資源管理的手段優化末級緩存.路劃分技術是緩存資源管理的主要方法,通過將緩存按路為單位劃分后分配給各個應用使用,實現系統性能優化.然而路劃分粒度較粗,要求緩存的所有組(set)都遵循同樣的路劃分方案.實際上,應用在不同組可能會有不同的空間需求,路劃分技術限制了緩...
《計算機研究與發展》2023年論文高被引TOP10
摘要:<正>~
MB-HGCN:基于層次圖卷積的多行為推薦方法————作者:嚴明時;陳慧臨;程志勇;韓亞洪;
摘要:基于協同過濾的單行為推薦系統在實際應用中經常面臨嚴重的數據稀疏性問題,從而導致性能不理想.多行為推薦(multi-behavior recommendation,MBR)旨在利用輔助行為數據來幫助學習用戶偏好,以緩解數據稀疏性問題并提高推薦精度.MBR的核心在于如何從輔助行為中學習用戶偏好(表示為向量表征),并將這些信息用于目標行為推薦.介紹了一種旨在利用多行為數據的新型推薦方法(hierarch...
計算機研究與發展來自網友的投稿評論:
一個月多點返回的審稿意見,比較及時,意見也很中肯,修改再審后,因為圖片清晰度達不到刊出要求,再次被計算機研究與發展雜志退修后錄用的,總的處理時間不長,有什么問題編輯部也積極回復,該雜志在各方面的認可度都不錯,點贊一個。
2024-08-16 07:57常見問題及解答
copyright © m.wangshangbanli.cn, All Rights Reserved
搜論文知識網 冀ICP備15021333號-3