你好,我是 宋明轩 ~
我目前在 北京大学 计算机学院攻读计算机系统结构专业理学博士学位,师从肖臻研究员。

了解更多 英文 | English

关于我

个人照片

我目前是北京大学计算机学院2023级计算机系统结构专业的博士研究生,预计2028年6月毕业。我本科于2023年6月毕业于中国地质大学(武汉)计算机学院计算机科学与技术专业。我的研究兴趣包括强化学习(RL)、分片区块链以及大语言模型(LLMs)。欢迎联系我交流!

我喜欢打台球、羽毛球、乒乓球,也热爱跑步。我的目标是在不断提升专业能力的同时,保持健康充实的生活方式。我始终相信,一个人的成长不仅仅体现在知识和技能的积累上,更在于如何在繁忙的工作中找到属于自己的节拍,明白自己真正想要的是什么,而不是迷失在内卷的环境下。

📍 所在地:北京,中国

✉️ 邮箱:songmingxuan@stu.pku.edu.cn

🎯 爱好:🎱 台球 | 🏸 羽毛球 | 🏓 乒乓球 | 🏃‍♂️ 跑步

查看简历

📚 论文成果

  • WWW 2025 Oral CCF-A Mingxuan Song, Pengze Li, Bohan Zhou, Shenglin Yin, Zhen Xiao*, Jieyi Long. "AERO: Enhancing Sharding Blockchain via Deep Reinforcement Learning for Account Migration." Proceedings of the Web Conference, May 2025. [PDF]
  • CVPR 2024 CCF-A Shenglin Yin, Zhen Xiao*, Mingxuan Song, and Jieyi Long. "Adversarial Distillation Based on Slack Matching and Attribution Region Alignment." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, June 2024. [PDF]
  • WWW 2024 Oral CCF-A Pengze Li, Mingxuan Song, Mingzhe Xing, Zhen Xiao*, Qiuyu Ding, Shengjie Guan, and Jieyi Long. "SPRING: Improving the Throughput of Sharding Blockchain via Deep Reinforcement Learning Based State Placement." In Proceedings of the Web Conference, May 2024. [PDF]
  • Sensors 2022 JCR Q1 Mingxuan Song, Chengyu Hu*, Wenyin Gong, Xuesong Yan. "Domain Knowledge-Based Evolutionary Reinforcement Learning for Sensor Placement." Sensors 2022. [PDF]
  • 📰 新闻动态

  • 北京大学十院系联合举办计算概论辅导讲座。 [报告] 2024年12月23日 [预告] 2024年12月12日
  • 中国地质大学(武汉)2023届本科优秀毕业生评选结果公示。 [链接] 2023年6月19日
  • 北京大学2023年拟录取推荐免试研究生名单公示。 [链接] 2022年11月1日
  • 中国地质大学(武汉)计算机学院专业纵向交流论坛第二期成功举办。 [链接] 2022年10月3日
  • 北京大学计算机学院2022年优秀大学生夏令营。 [拟录取公示] 2022年9月30日 [优秀营员名单] 2022年7月8日 [入营通知] 2022年6月28日
  • 中国地质大学(武汉)计算机学院专业纵向交流论坛第二期(微信推文)。 [链接] 2022年9月27日
  • 中国地质大学(武汉)计算机学院111003班荣获优秀奖学金。 [链接] 2022年6月21日
  • 2021年全国大学生数学建模竞赛(高教社杯)获奖名单。 [链接] 2021年11月15日
  • 全国大学生创新创业训练计划平台立项。 [链接] 2021年8月24日
  • 中国地质大学(武汉)2019–2020学年本科生国家奖学金候选人名单公示。 [链接] 2020年11月2日
  • 🌟 项目

    面向大语言模型的小样本强化学习微调

    所属单位:
    北京大学计算机学院;
    阿里巴巴集团阿里妈妈广告团队。

    近年来,大语言模型(LLMs)在多种自然语言处理任务中展现出卓越性能。但传统微调方法往往依赖大规模数据集与高算力资源,限制了其在小样本与预算受限场景中的应用。本项目提出了一种新颖的少样本强化学习微调方法,旨在利用最少的监督信息将预训练模型高效适配至特定任务。

    强化学习驱动的高效分片区块链系统

    所属单位:
    北京大学计算机学院;
    Theta 实验室,Theta 公司。

    分片区块链在跨片数据传输效率和工作负载均衡方面面临重大挑战。传统地址分配机制在交易模式频繁变动和系统重构场景下,常导致延迟高、分片利用率不均。本项目提出一种强化学习方案,优化地址分布与迁移策略,以提升系统整体吞吐与负载均衡性。

    面向先进 Web 3.0 NFT 拍卖系统的强化学习优化

    所属单位:
    北京大学计算机学院;
    Theta 实验室,Theta 公司。

    在 Web 3.0 时代,NFT 已成为重要的数字资产形式,而拍卖系统则是其生态核心组件。然而,传统 NFT 拍卖存在吞吐率低、响应延迟高等问题。为应对这些挑战,本项目提出基于分层强化学习的动态竞价优化策略,有效提升 NFT 拍卖的实时性与效率。

    联系方式

    ✉️ 邮箱: songmingxuan@stu.pku.edu.cn

    💬 微信: smx-scholar

    Call to Action