延迟命中场景下基于学习方法的缓存性能优化
沈志1,江博闻1,江波1*,林涛2
(1. 上海交通大学电子信息与电气工程学院,上海200240;2. 中国传媒大学媒体融合与传播国家重点实验室,北京100024)
摘要:传统的缓存算法大多基于简单的统计信息进行内容替换,在绝大部分场景下都和离线最优算法有着较大的性能差距。当前基于机器学习来设计高效的缓存策略基本都假设请求的大小相等,忽略了真实场景中请求的大小往往不等且大小变化的范围较大。由于传输速度已接近极限,…….实验结果表明,ARC-learning+算法在流行度变化较快情况下的时延提升明显优于已有的其他缓存算法。在其他流行度变化情况下也非常接近已有算法的最优时延性能。-----(综述类文章150字左右,非综述类文章400字左右)(正文字体:中文用宋体,英文用新罗马)
关键词:基于学习;非平稳流行度;内容变大小;延迟命中 -----(4-8个关键词)
中图分类号:TP393.2 文献标识码:A
A learning-based method to optimize cache performance with delayed hit
SHEN Zhi1, JIANG Bowen1, JIANG Bo1*, LIN Tao2
School of Electronic Information and Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240, China; 2. State Key Laboratory of Media Convergence and Communication, Communication University of China, Beijing 100024, China)
Abstract: Most traditional caching algorithms rely on basic statistical data for content replacement, creating a significant performance discrepancy in comparison to offline optimal caching algorithms. However, due to improvements in CPU performance, cache strategies based on machine learning have been developed in recent years to enhance cache performance. ……. Experimental results show that the performance of the modified sorting function algorithm is better than other existing caching algorithms when the popularity changes quickly. It is also very close to the optimal delay performance of the existing algorithm under other prevalence changes.
Keywords: learning-based; non-stationary popularity; variable object size; delayed hit
英语论文摘要时态要求.
① 如果是描述研究的成果、得出的结论,用一般现在时。
② 如果描述具体的研究过程,则用一般过去时。
③ 如果描述研究结果对未来的影响,用一般将来时。
④ 如果是过去的研究成果,但是对现在得出的结论有影响,用现在完成时。
⑤ 如果是引用已经成为公认的事实,则用一般现在时。
基金项目:国家自然科学基金面上项目(62072302);地区科学基金项目(62262018);“媒体融合与传播国家重点实验室(中国传媒大学)”开放课题(SKLMCC2021KF011)
作者简介(*为通讯作者):沈志(1998-),男,硕士研究生,主要从事缓存技术研究。Email: shangjiao4313888@sjtu.edu.cn;江波(1983-),男,博士,副教授,主要从事系统性能评测与优化研究。Email: bjiang@sjtu.edu.cn
0引言
随着视频音频等各类应用的发展,…17 万多个服务器上服务数万亿用户请求[1]。
唐慧如等[2]提出了…
CDN 服务器位于用户和广域网(WAN)之间。…这些开销在研究中通常用内容命中率(object hit ratio, OHR)[3-6],时延(latency)[7-8]来衡量,……。
1研究背景介绍
1.1请求内容变大小
…
2ARC-learning 算法介绍和改进
2.1ARC-learning 算法介绍
ARC-learning[9]是基于LRB(learning relaxed belady)[10],为适应各种流行度变化设计的算法,该算法有效降低了流行度变化较快场景下,…。ARC-learning 算法框架如图1所示。

图1 ARC-learning 缓存替换框架
本节使用了文献[5]在优化时延时所使用的排序函数对ARC-learning进行改进。文献[5]对请求未命中时候由完全未命中和延迟命中产生的累计时延……
流行度记为,内容i在未命中时,从上一级服务器取内容所产生的时延记为,其排序函数定义如公式(1):-----(文中、公式中的变量要倾斜)
(1)
考虑到变大小场景下应当尽可能缓存体积较小的内容以为更多的用户提供服务,上述公式可进一步优化为:
(2)
排序函数为:
(3)
…….
与….模型进行了对比验证。实验结果如表1所示。----(表格为三线表)
表1 在NLPCC数据集上的结果
模 型 | 评价指标 | |||
Rouge-1 | Rouge-2 | Rouge-L | BS | |
T5 PEGASUS | 56.15 | 39.47 | 47.87 | 65.63 |
SimCLCTS (Ours) | 57.24 | 41.40 | 49.52 | 73.33 |
5结论
……
参考文献(References):
(期刊类)
[1] 张群, 程志宝, 石志飞. 惯性增强动力吸振器-浮置板轨道低频减振性能研究[J]. 铁道学报, 2024,46(8): 102-111.
[2] 久保智康. 花枝蝶鸟方镜的镜范:以平安后期的铜镜制作工艺为中心[J]. 顾幼静, 译. 东方博物, 2009(1): 85-92.
[3] 王利平, 王福新, 刘洪. 过冷大水滴环境粒径分布模拟方法研究进展[J]. 航空学报, 2024, 45(增刊1): 730570.
[4] Ranftl R, Lasinger K, Hafner D, et al. Towards robust monocular depth estimation: mixing datasets for zero-shot cross-dataset transfer[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 44(3): 1623-1637. ----(文章标题冒号后的英文小写)
(网络首发引用格式:作者. 文献题名[J/OL]. 刊名, 网络首发日期. 获取或访问路径)
[3] 张群, 程志宝, 石志飞. 惯性增强动力吸振器-浮置板轨道低频减振性能研究[J/OL]. 铁道学报, 2024-05-09. https://kns.cnki.net/kcms/detail/11.2104.u.20240507.1737.002.html.
[4] Myburg A A, Grattapaglia D, Tuskan G A, et al. The genome of Eucalyptus grandis [J/OL]. Nature, 2014, 510: 356-362. https://www. nature.com/articles/naturel3308.pdf.DOI:10.1038/naturel3308.
(会议类)
[1] 汪学军. 中国农业转基因生物研发进展与安全管理[C]//国家环境保护总局生物安全管理办公室. 中国国家生物安全框架实施国际合作项目研讨会论文集. 北京: 中国环境科学出版社, 2005: 22-25.
[1] Song Z, Berger D S,Li K, et al. Learning relaxed belady for content distribution network caching[C]//17th USENIX Conference on Networked Systems Design and Implementation(NSDI ' 20), 2020: 529-544.
[2] 李妍, 王莹. 医疗机构保洁人员“一前五后”手卫生干预效果研究[C]//中华预防医学会医院感染控制分会第31次全国医院感染学术年会, 2022: 2.
[3] Wang Shanshan. Application of improved SOM neural network in intelligent auditing of hospital financial-vouchers[C/OL]//2022 6th Asian Conference on Artificial Intelligence Technology, 2022: 2. https://ieeex-plore.ieee.org/document/10137867. DOI:10.1109/ACAIT56212.2022.10137867.
[4] Yu Yang, Pan Erting, Wang Xinya, et al. Unmixing before fusion: a generalized paradigm for multi-sourcebased hyperspectral image synthesis[C/OL]//CVPR, 2024: 4. https://openaccess. thecvf. com/content/CVPR2024/html/Yu_ Unmixing Before_Fusion_A_Generalized _Paradigm for_ Multi-Source-based_ Hyper-spectral_Image_CVPR_2024_paper. html.
(学位论文类)
[5] Fromkin H L. Affective and valuational consequences of self-perceived uniqueness deprivation[D]. Columbus, OH: Ohio State University, 1968.
[6] 曾余洋. 基于深度学习的中文文本情感分析研究[D]. 雅安: 四川农业大学, 2022.
[7] 金燕萍. 社交媒体时代的虚假信息研究[D/OL]. 温州: 温州大学, 2020: 16. https://d.wanfangdata.com.cn/thesis/D02216281.
[8] Christou A. Improving knowledge graph understanding with contextual views[D/OL]. Ohio: Wright State University, 2024: 18. http://rave.ohiolink.edu/etdc/view?acc_num= wright1715878159408301.
(图书类)
[7] Snyder C R, Fromkin H L. Uniqueness:The human pursuit of difference[M]. New York:Springer, 1980.
[8] 王理嘉, 林焘. 语音学教程[M]. 北京:北京大学出版社,1992.
[8] 扬奎斯特,萨金特. 递归宏观经济理论[M]. 杨斌,王忠玉,陈彦斌,等,译. 2版. 北京:中国人民大学出版社,2010:798.
[9] Peebles P Z Jr. Probability, random variables, and random signal principles[M]. 4th ed. New York:McGraw-Hill,2001.
[10] Praetzellis A. Death by theory: a tale of mystery and archaeological theory[M/OL]. Rev. ed. [S. 1.]: Rowman &Littlefield Publishing Group,Inc.,2011:13. http: //lib.myilibrary.com/Open.aspx?id=293666.
[11] Abadia O M, Conkey M W, McDonald J. Deep-time images in the age of globalization: rock art in the 21 st century[M/OL]. Springer Cham, 2024. https://doi.org/10.1007/978-3-031-54638-9.
[12] Weinstein L, Swartz M N. Pathogenic properties of invading microorganismsLM]//Sodeman W A Jr, Sode-man W A. Pathologic physiology: mechanisms of disease. 5th ed. Philadelphia:Saunders,1974: 457-472.
[13] Roberson J A, Burneson E G. Drinking water quality standards, regulations and goals[M/OL]//American Water Works Association. Water quality &. treatment: a handbook on drinking water. 6th ed. New York:McGraw-Hill, 2011: 1. 1-1. 36. http://lib.myilibrary.com/Open.aspx? id=291430.
(预印本类)
[11] Goodfellow I J, Shlens J, Szegedy C. Explaining and harnessing adversarial examples[PP/OL]. V3. arXiv(2014-12-20)[2015-06-06]. https://doi.org/10.48550/arXiv.1412.6572.
[12] Jenkins S D, Ruostekoski J. Controlled manipulation of light by cooperative response of atoms in an optical lattice[PP/OL]. V2. (2012-03-18) [2020-06-24]. https://doi.org/10.48550/arXiv.1112.6136.
[13] 方向明,曹迎杰. 元宇宙在图书馆的应用:理论研究与实践进展[PP/OL]. ChinaXiv(2023-03-03)[2024-09-30]. http://www.chinaxiv.org/abs/202303.00020. CSTR:32003.36.ChinaXiv.202303.00020.V1.
(网站网页类)
[14] 许振超:“好好干,当一个好工人”[EB/OL]. (2025-02-17) [2025-06-22]. http://cpc.people.com.cn/n1/2025/0217/c443712-40419790.html.
[15] Antonio M, Pepper L. Historias de Portugal: livros caidos[EB/OL]. (2019-07-13) [2025-01-02]. https://arquivoNaN/wayback/20190905210731/http://publicoNaN/2019/07/13/sociedade/noticia/podcast-his-toriasportugal-cuidadores-1879731.
[16] 高等教育文献保障系统.馆际互借与文献传递服务[EB/OL]. [2025-06-21]. http://home.calis.edu.cn/pages/list.html? id=410lel84-7f64-4798-a5el-8e37aa6994fc.
(标准类)
[9] ITU-R. BS.1284-2: General methods for the subjective assessment of sound quality[S/OL]. [2019-01-21]. https://www.itu.int/rec/R-REC-BS.1284-2-201901-I/en.
[10] 国家广播电影广电总局. GB/T 26252-2010:VHF/UHF频段地面数字电视广播频率规划准则[S]. 北京: 中国标准出版社, 2011.
(数据集类)
[17] 周壮, 李盛阳, 吴薇, 等. 天宫二号遥感图像自然景物分类科学数据[DS/OL]. V1. 0. 国家基础学科公共科数据中心(2023-09-10)[2025-07-15]. https://www.nbsdc.cn/general/dataLinks/CSTR: 16666. 11.nbsdc.tfpbwtgf.
[18] IHME. Global burden of disease study 2019 (GBD 2019) data resources[DS/OL]. Global Health Data Exchange(2021)[2025-07-15]. https://ghdx.healthdata.org/gbd-2019.
