测试集不做平衡化处理,代码分析都是正确的,如何提高?有老师能解决一下我这个问题吗,如果老师觉得描述不准确,我可以和老师直接沟通吗?
同学我们的课程辅导是包含答疑的,如果同学感觉需要很长的时间来找老师辅导,可以直接选择购买课时后,与授课老师进行约课上课指导,小的问题可以和老师在vip学习群里交流。
1. 尝试不同的数据划分方式
(1)train_test_split()里的random_state修改
(2)KFOLD
(3)80%训练,20%测试,10%测试
2. 用更强大的模型来做预测
RandomForestClassifier
MLP
1. over sampling能增加训练集,让模型“见多识广”,可以提高F1
2. under sampling减少训练集,F1会降低
3. 测试集中,数据不平衡,可能会导致模型有偏差
4. 使用更复杂的模型Randomforest,可以提高F1
5. 80%这种数据划分方式,也可能导致模型有偏差
(KFold)
以上是部分解答,同学如果需要与我们老师进行更多的辅导交流,可以选择联系我们咨询。我们是一家专注于留学生课业辅导的机构。