博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
机器学习模板
阅读量:6271 次
发布时间:2019-06-22

本文共 1132 字,大约阅读时间需要 3 分钟。

根据心情补充,语言都是Python

hash,把所有的文本转化成数字

from sklearn.preprocessing import LabelEncoderfor c in train.columns:    if train[c].dtype == 'object':        lbl = LabelEncoder()        lbl.fit(list(train[c].values) + list(test[c].values))        train[c] = lbl.transform(list(train[c].values))        test[c] = lbl.transform(list(test[c].values))

Xgboost训练

'''Train the xgb model then predict the test data'''

xgb_params = {    'n_trees': 520,     'eta': 0.0045,    'max_depth': 4,    'subsample': 0.93,    'objective': 'reg:linear',     'eval_metric': 'rmse',    'base_score': y_mean, # base prediction = mean(target)    'silent': 1}# NOTE: Make sure that the class is labeled 'class' in the data filedtrain = xgb.DMatrix(train.drop('y', axis=1), y_train)dtest = xgb.DMatrix(test)num_boost_rounds = 1250# train modelmodel = xgb.train(dict(xgb_params, silent=0), dtrain, num_boost_round=num_boost_rounds)y_pred = model.predict(dtest)

OneHot矩阵转换

enc = OneHotEncoder(handle_unknown='ignore')enc=enc.fit(pd.concat([X[categorical],X_test[categorical]]))X_cat_sparse=enc.transform(X[categorical])X_test_cat_sparse=enc.transform(X_test[categorical])

转载地址:http://nulpa.baihongyu.com/

你可能感兴趣的文章
linux学习笔记一----------文件相关操作
查看>>
Mono for Android 优势与劣势
查看>>
服务器端开发技术
查看>>
Python3中urllib详细使用方法(header,代理,超时,认证,异常处理)
查看>>
ajax提交多个对象,使用序列化表单和FormData
查看>>
深入分析由前序和中序重构二叉树问题
查看>>
leetcode 题解 || Valid Parentheses 问题
查看>>
将图片转成base64字符串并在JSP页面显示的Java代码
查看>>
什么是WeakHashMap--转
查看>>
js 面试题
查看>>
第二十二节,三元运算
查看>>
Yacc 与 Lex 快速入门
查看>>
Unity中HDR外发光的使用
查看>>
Flume负载均衡配置
查看>>
Ajax详解
查看>>
Ubuntu C/C++开发环境的安装和配置
查看>>
百世汇通快递地区选择插件,单独剥离
查看>>
Linux系统调用---同步IO: sync、fsync与fdatasync【转】
查看>>
【MyBatis学习06】输入映射和输出映射
查看>>
[LeetCode] Decode String 解码字符串
查看>>