xgboost2.0最佳实践

xgboost2.0最佳实践

首先更新xgboost到2.0.0

1
pip install xgboost -U 

在最新版本的训练中,参数可以使用字典传递。同时数据和样本需要先合并成一个xgb.DMatrix 对象

1
2
3
4
5
6
7
8
9
10
# 设置参数
params = {
"device": "cuda",
}

# 创建DMatrix对象
Xy = xgb.DMatrix(X_train, y_train)

# 训练模型
model = xgb.train(params, Xy)

进行分类任务是,需要传递类别数,而不是像之前版本那样自动检测类别

1
2
3
4
5
# 设置参数
params = {
"device": "cuda",
"num_class": 5
}

根据xgboost路线图Roadmap Phasing out the support for old binary format.,在2.2版本将删除对保存旧二进制格式的支持,删除对旧 JSON 模型的支持。在2.3版本将删除对加载旧二进制格式的支持。最新保存模型的方式是

1
xgb.save(bst, 'model_file_name.json')


xgboost2.0最佳实践
https://studyinglover.com/2023/10/19/xgboost2.0最佳实践/
作者
StudyingLover
发布于
2023年10月19日
许可协议