丁致宇

高性能计算&并行编程

丁致宇,来自风筝之都「山东潍坊」,西南石油大学数据科学与大数据技术专业2023级本科生,目前专业排名1/64。具备扎实的高性能计算基础,熟练掌握C/C++、CUDA、MPI/OpenMP等并行编程技术。通过参与ASC世界大学生超算竞赛、IndySCC@SC24、海洋计算挑战赛、算子开发挑战赛等竞赛项目,积累了丰富的性能优化经验,包括海洋模拟并行化、深度学习算子开发、SpMV算法在异构平台的优化等实际项目。擅长在CPU/GPU/神威等异构平台上进行算法优化和性能调优,具备良好的问题分析和解决能力,具有很强的执行力。正在深入学习高性能计算相关技术,希望在该领域持续发展!

Education

西南石油大学-双一流

计算机与软件学院 数据科学与大数据技术
– Present

学业成绩:「GPA:4.1/5.0 ,专业排名:1/64」

Courses
  • 大数据平台技术及应用(98),Python(96),面向对象程序设计(95)

  • 统计学原理(93),人工智能导论(92),线性代数(91),数据结构及算法(90)

Projects

基于溢油预测模型的并行计算优化

队长 at 参赛队:梦溪湖
Competition

该项目选自2024海洋计算挑战赛决赛题目。采用自主研发的二维溢油预测模型,在保证对欧拉方法求解轨迹方程的理解以及基于向量法判断油粒子是否会吸附到岸上的正确性的情况下,利用并行计算技术对程序进行加速。

  • 承担工作:通过在原有串行程序上进行MPI与OpenMP混合并行化,并采用负载均衡技术,充分利用2节点128核计算资源,使算法执行效率得到提升。访存优化方面我们使用Fortran/C重新排列数据访问顺序,利用内存局部性提高缓存命中率。在通信优化方面我利用了非阻塞通信、打包数据通信等方式进行优化。我们还在在算法层面使用快速排除未交叉线段和二分查找等优化技术,快速确定油粒子轨迹与海岸线的关系

  • 项目成果:通过组委会提供算例的正确性检验,在初始算例上,相较于Baseline,取得了大约2482.14倍的加 速比,在决赛队伍中排位第五,获得全国三等奖。

基于AlphaFold3的蛋白质结构预测推理优化项目

选自ASC25世界大学生超级计算机竞赛,针对Google DeepMind开发的AlphaFold3蛋白质结构预测模型进行推理性能优化。项目要求在保持预测精度的前提下,分别在GPU和CPU平台上最小化推理时间,处理12个不同长度的蛋白质序列样本,涉及复杂的扩散模型架构和JAX深度学习框架优化。

  • 承担工作:在NVIDIA A100 GPU和Intel Xeon CPU混合架构上完成AlphaFold3环境部署,通过cProfiler性能分析工具识别推理瓶颈,发现JAX框架的JIT编译占用大量时间。针对GPU优化实施禁用Triton GEMM编译、优化编译桶参数等策略;针对CPU优化解决diffusion_head.py模块中数值计算精度问题,修复负数开方导致的NaN错误,采用epsilon数值稳定性技术确保计算准确性。

  • 项目成果:成功实现AlphaFold3推理显著加速,GPU优化在不同序列长度下达到1.2-2.4倍的性能提升,CPU优化实现1.1-5.3倍的加速比,特别是在短序列上效果显著。通过系统性的编译优化和算法调优,在保证蛋白质结构预测confidence值与基准代码一致的情况下,为生物信息学和药物设计领域的AlphaFold3应用提供了高效的推理解决方案

基于NAMD的分子动力学模拟性能优化挑战

选自IndySCC@SC24国际超算学生集群竞赛,针对生物分子系统进行大规模分子动力学模拟优化。项目涵盖水分子物理性质分析、蛋白质折叠动力学、热力学积分自由能计算等多个层次的生物计算挑战,需要在有限48h下实现从10万到2000万原子规模系统的高效模拟。

  • 承担工作:在Jetstream2云平台上完成NAMD环境部署与GPU加速配置,实现多种分子动力学模拟算法包括扩展系统自适应偏置力方法(eABF)、副本交换分子动力学、热力学积分等高级采样技术,通过氢质量重分配技术将时间步长从2fs优化至4fs,采用GPU并行计算策略处理多副本同时运行的复杂任务调度。

  • 项目成果:成功完成水分子热容和扩散系数的精确计算,实现deca-alanine蛋白质α-螺旋折叠自由能曲线的收敛计算,在A100 GPU上达到约15纳秒/天的模拟性能,通过算法优化在保证计算精度的前提下显著提升了大规模生物分子系统的计算效率。

基于MLPerf Inference的BERT模型推理性能优化

选自IndySCC24国际超算竞赛MLPerf Inference基准测试挑战,针对BERT-99大语言模型在问答任务(Squad v1.1数据集)上进行推理性能优化。项目要求在CPU和GPU异构平台上实现高效推理,使用MLCommons CM自动化框架进行基准测试配置和结果提交,涉及深度学习推理优化、并行计算和性能调优等核心技术。

  • 承担工作:在AMD EPYC 7713 CPU和NVIDIA A100 GPU混合架构上部署MLPerf环境,克服权限配置和文件打包等技术难题。设计并实现批处理推理优化策略,包括多输入样本批量收集、数据预处理pipeline重构、GPU并行推理加速和结果后处理优化。通过深入分析推理瓶颈,重构issue_queries方法实现批量数据准备,优化process_batch方法提升GPU利用率,实现端到端的推理性能优化。

  • 项目成果:成功实现BERT推理性能显著提升,GPU推理吞吐量达到85.447样本/秒,相比CPU的3.193样本/秒提升26.8倍。通过批处理优化技术将GPU利用率从基准测试的54%提升至97%,在保持90.876%准确率的同时大幅降低推理延迟。项目成果成功提交至GitHub并通过MLCommons官方验证。

基于新一代神威超算的PCG算法优化

项目简介: 选自第七届国产CPU 并行应用挑战赛初赛题目,对预处理共轭梯度算法PCG 进行众核优化。

  • 承担工作: 针对核心热点SpMV 算法,采用了近似均衡的行划分策略、LDM 空间访存调整等方法进行优化;分析流程,利用主核隐藏部分计算,充分利用LDM 空间。

  • 项目成果: 通过正确性检验,达到平均30倍的加速比

Awards

ASC2025世界大学生超级计算机竞赛国际级二等奖

Awarded by ASC Student Supercomputer Challenge Committee

ASC世界大学生超级计算机竞赛,肇始发轫于2012年,是世界最大规模的超算竞赛,与德国ISC、美国SC并称世界三大超算竞赛。本届竞赛的AI赛题要求参赛队在不同计算平台上运行和优化AlphaFold3结构预测代码,考察参赛队伍对AlphaFold3推理过程的理解和优化能力。

受邀参加SC24国际超算竞赛线上赛道IndySCC

Awarded by SC Student Cluster Competition Committee

全球超级计算大会(英文全称Supercomputing Conference简称SC)是国际超算领域的顶级会议。IndySCC是SC赛事设立的线上赛道。与三大超算竞赛之一SC线下赛道一样,需在限定条件的前提下,用48小时完成给定的计算任务,并实现尽可能高的计算性能。

2024年海洋计算挑战赛全国总决赛三等奖

Awarded by 中国太平洋学会、北京并行科技有限公司

海洋计算挑战赛(Marine Computing Challenge,简称MCC)主要内容涵盖海洋大数据处理与分析、海洋环境模拟与预测、海洋资源开发与利用、海洋灾害预警与应急响应、海洋人工智能应用等不同应用场景,综合考察参赛者在海洋应用领域的各项技能。

Tecorigin 算子开发任务挑战赛全国总决赛三等奖

Awarded by 第二届开放原子大赛-开放原子开源基金会

Tecorigin 算子开发任务挑战赛基于Teco-AL(太初加速库)统一算子库模型,使用SDAA C编程语言在太初国产GPU平台上进行算子性能优化。竞赛涵盖tecoalArgmax、tecoalActivationBackward、tecoalConvolutionForward等深度学习核心算子优化,考察参赛者在国产GPU架构下的并行计算、访存优化、向量指令优化等高性能计算技术能力。

天翼云息壤杯高校AI大赛四川省赛第二名

Awarded by 中国电信集团有限公司、华为技术有限公司

天翼云息壤杯高校AI大赛算子优化赛道,基于昇腾NPU平台使用AscendC进行算子开发与性能优化。竞赛涵盖NLLLossGrad反向算子、QuantBatchMatmul+Swiglu融合算子等深度学习核心算子的高性能实现,考察昇腾910B架构下的多核并行、Cube/Vector流水线优化、内存管理等关键技术。赛题聚焦国产化异构计算底座的算子精细化优化,推动CANN生态下的高性能计算创新应用。

第十五届蓝桥杯全国总决赛三等奖

Awarded by 工业和信息化部人才交流中心、蓝桥杯大赛组委会

蓝桥杯大赛Python程序设计组,此竞赛涵盖基础算法、数据结构、动态规划、图论、字符串处理、数学计算等题型,要求在限定时间和OI赛制下完成多道编程题目,重点考察参赛者使用Python语言解决算法问题的能力。

受邀参加2024腾讯开悟人工智能全球公开赛邀请赛

Awarded by 2024 腾讯开悟人工智能全球公开赛组委会

参与 2024 腾讯开悟人工智能全球公开赛邀请赛,在「AIPC高效能博弈赛道」中成功完赛。

优秀学生一等奖学金、二等奖学金

Awarded by 西南石油大学

Certificates

Skills

C/C++、Fortran

熟悉CPU、GPU架构

CUDA、HIP

熟悉CUDA优化算子

OpenMP、MPI

Sunway(神威)

Languages

英语六级

CET6:478

普通话

二级甲等

英语四级

CET4:521

方言

一窍不通

Interests

旅行

  • 飞行
  • 探索
  • 酒店

摄影

  • 捕捉
  • 记录
  • 回忆