1、机器学习建模3大流程:1. 实例化,建立评估模型对象2. 通过模型接口训练数据3. 通过模型接口提取需要的信息 (给模型打分)
2、数据集的实例化(以葡萄酒数据集为例):1. 数据集模块sklearn.datasets.数据以导入葡萄酒数据集为例:from sklearn.datasets import load_wine
3、 数据集的实例化Win = load_wine()
4、 数据集常用数据 1. data (数据集的特征数据) 2. target ( 数据集的标签 ) 3. feature_names(特征的名字)
5、数据集的 划分:1. 划分数据集模块from sklearn.model_selection import train_test_split
6、实例化对象train_test_split()
7、 train_test_split()所需参数及其返回值1. 数据集的特征数据2. 数据集的标签3. test_size 划分数据集例:test_size =0.4 表示将40%的数据集划分为测试集,用于测试训练好的模型,将剩下60%的数据集划分为训练集,用于训练模型4. 返回值(注意:返回值顺序)返回4个数据集依次为:特征数据的训练数据,特征数据的测试数据,标签的训练数据,标签的测试数据