Loading...
第一关:初窥数据import pandas as pd import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt #********* Begin *********# # 读取./train_data.csv并可视化标签的分布并保存可视化结果到./stpe1/dump/result.jpg df = p...
感谢宋同学提供的下面内容基于物品推荐算法import org.apache.log4j.{Level, Logger} import org.apache.spark.mllib.linalg.SparseVector import org.apache.spark.mllib.linalg.distributed.{CoordinateMatrix, IndexedRow, MatrixE...
其实这个题通过阅读上面的代码就可以做出来哦!下面给一个模板作为参考哦(执行代码的时候记得从第一个开始执行,执行的时候慢一点,不要将最后一个答案覆盖掉哦。就是执行到倒数第二句话截止)还有一个地方需要注意,我不知道文件路径是否一致哦。如果不一致修改为自己的哈。点击右边,可以看见文件,然后有个复制地址,如果不一样,替换掉就行。#根据编程要求,补充下面Begin-End区间的代码 # ***** B...
第一题:划分训练集与测试集import pandas as pd from sklearn import model_selection #*************** BEIGN ****************** # 使用pandas库的read_csv读入毒蘑菇数据集(./data/mushrooms.csv) data = pd.read_csv('./data/mushroo...
第一关:随机森林from sklearn.ensemble import RandomForestClassifier def data_classification(train_data, train_label, test_data): ''' 使用随机森林对训练集数据进行训练,并对测试集数据进行预测,并返回预测结果 :param train_data: 训练集...