ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

第五节 算法的分类介绍和数据集的划分

2020-03-25 23:52:01  阅读:230  来源: 互联网

标签:print 划分 目标值 li 第五节 算法 train test sklearn


"""
机器学习算法分类:
    监督学习(有目标值)
        分类(目标值是离散型数据):K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
        回归(目标值是连续型数据):线性回归、岭回归
    无监督学习(无目标值):聚类 K-means
机器学习一般会把数据集划分为训练集(3/4)和测试集(1/4),可以使用sklearn中的train_test_split模块进行自动分类
"""

# 使用sklearn自带的鸢尾花数据集进行数据划分
from sklearn.datasets import load_iris  # 鸢尾花模块
from sklearn.model_selection import train_test_split  # 选择测试集模块

li = load_iris()
# li.data特征集,li.target目标集,test_size测试集占比
print(li.data)
print(li.target)
x_train, x_test, y_train, y_test = train_test_split(li.data, li.target, test_size=0.25)

print("训练集的特征值和目标值:", x_train, x_test)
print("测试集的特征值和目标值:", y_train, y_test)

 

标签:print,划分,目标值,li,第五节,算法,train,test,sklearn
来源: https://www.cnblogs.com/kogmaw/p/12571649.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有