我目前是北京大学计算机学院2023级计算机系统结构专业的博士研究生,预计2028年6月毕业。我本科于2023年6月毕业于中国地质大学(武汉)计算机学院计算机科学与技术专业。我的研究兴趣包括强化学习(RL)、分片区块链以及大语言模型(LLMs)。欢迎联系我交流!
我喜欢打台球、羽毛球、乒乓球,也热爱跑步。我的目标是在不断提升专业能力的同时,保持健康充实的生活方式。我始终相信,一个人的成长不仅仅体现在知识和技能的积累上,更在于如何在繁忙的工作中找到属于自己的节拍,明白自己真正想要的是什么,而不是迷失在内卷的环境下。
📍 所在地:北京,中国
✉️ 邮箱:songmingxuan@stu.pku.edu.cn
🎯 爱好:🎱 台球 | 🏸 羽毛球 | 🏓 乒乓球 | 🏃♂️ 跑步
查看简历 所属单位:
北京大学计算机学院;
阿里巴巴集团阿里妈妈广告团队。
近年来,大语言模型(LLMs)在多种自然语言处理任务中展现出卓越性能。但传统微调方法往往依赖大规模数据集与高算力资源,限制了其在小样本与预算受限场景中的应用。本项目提出了一种新颖的少样本强化学习微调方法,旨在利用最少的监督信息将预训练模型高效适配至特定任务。
所属单位:
北京大学计算机学院;
Theta 实验室,Theta 公司。
分片区块链在跨片数据传输效率和工作负载均衡方面面临重大挑战。传统地址分配机制在交易模式频繁变动和系统重构场景下,常导致延迟高、分片利用率不均。本项目提出一种强化学习方案,优化地址分布与迁移策略,以提升系统整体吞吐与负载均衡性。