喜讯!我院学生陈博志和周塬鈜斩获2024年SAS中国高校数据分析大赛总决赛全国一等奖!

作者:刘炎 时间:2025-04-29 点击数:

2025年4月20日,2024 SAS中国高校数据分析大赛总决赛在河北雄安新区圆满落幕。由广东金融学院金融数学与统计学院数学与应用数学专业的陈博志,周塬鈜两位同学参加了比赛,并从北京大学、上海交通大学、浙江大学等全国顶尖高校的700余支由博士生,硕士生与本科生交叉组成的参赛队伍中脱颖而出,排名挺进前三十强,斩获全国一等奖。



 

SAS中国高校数据分析大赛创办于2013年,是面向全国高校的权威性数据科学赛事。该赛事聚焦金融科技、医疗健康等前沿领域,通过搭建专业竞赛平台,持续推动数据科学教育体系升级与人才培养。整个赛事分为初赛,复赛以及最后的决赛,其中涉及了sas基础知识答题,数据分析报告写作以及最后与行业顶尖的教授的答辩。

 此次获奖的团队通过对游戏用户留存预测,运用机器学习技术展开深入研究。通过对包含30,315个用户数据的训练集进行数据预处理、特征工程和模型构建,本文创新性地提出了三个与用户留存度显著相关的特征字段:每周游戏会话总时间(Totaltimes)、成就花费的实际时间(Ach_times)以及游戏会话时间稳定性(Stability)。这些特征字段的构建基于用户的游戏行为数据,能够更全面地反映用户对游戏的参与度和兴趣程度,为后续的预测模型提供了更丰富的信息。

 在模型构建方面,团队对比了决策树、随机森林和XGBoost三种经典的机器学习模型。通过严格的训练集和测试集划分,以及准确率、召回率、精确度、F1-score和AUC等多维度的模型评估指标,最终确定XGBoost模型为最优预测模型,其准确率高达94.87%。XGBoost模型通过Boosting机制有效降低了模型偏差,同时结合了正则化项来防止过拟合,展现出强大的预测能力和稳定性。这一结果不仅验证了新特征字段的有效性,也体现了XGBoost在处理复杂数据关系时的优势。并基于此,团队对10,000个新样本的测试集进行了留存预测,识别出36.32%的潜在留存用户。通过分析留存用户和流失用户在各特征字段上的差异,提出了针对性的运营优化策略,为游戏公司提升用户留存率提供了数据支持和实践指导。

广东金融学院金融数学与统计学院