ICode9

精准搜索请尝试: 精确搜索
  • 3.K均值算法2020-04-16 11:58:38

      1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) from sklearn.datasets import load_iris import numpy as np import matplotlib.pyplot as plt # 数据准备 iris = load_iris() data = iris.data[:, 1

  • 3.k均值的算法2020-04-16 09:01:01

    一、课堂练习 # 课堂练习 from sklearn.datasets import load_iris # 导入鸢尾花数据 iris=load_iris() iris iris.keys() data=iris['data'] #鸢尾花数据 target=iris.target #标签,属于哪一种花 iris.feature_names #特征名:花萼长度、花萼宽度、花瓣长度、花瓣宽度 # 'sepal l

  • 3.K均值算法2020-04-14 21:58:48

    1). 扑克牌手动演练k均值聚类过程:>30张牌,3类         2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 代码: from sklearn.datasets import load_irisimport numpy as npimport matplotlib.pyplot as plt# 1.数据准备iris=load_iris()data=iris['d

  • 机器学习分类算法之KNN算法2020-03-31 15:01:19

    KNN算法为按距离进行分类的,对于已知的分类,根据欧式距离,最靠近那个分类就被预测为那个分类。 本文只是简单展示一下实现代码,具体的特征和分类,还得自己根据实际场景去调整。 在开始之前注意看看导入的包是否都存在,如不存在的化,请先安装相应的包 # -*- coding:utf-8 -*- import nump

  • 基于sklearn K临近算法 最简单预测 花的种类2020-03-23 23:53:49

    因为注释已经很详细了,所以直接上代码: 1 from sklearn.datasets import load_iris 2 from sklearn.model_selection import train_test_split 3 #k临近算法 4 from sklearn.neighbors import KNeighborsClassifier 5 import numpy as np 6 import pandas as pd 7 def get数

  • 机器学习中的特征选择filter2020-03-20 11:53:51

    来源地址:https://www.cnblogs.com/bjwu/p/9103002.html   Filter-移除低均方差的特征 代码: from sklearn.feature_selection import VarianceThreshold X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]] sel = VarianceThreshold(threshold=(0.2) sel.f

  • 总结机器学习部分计算原理—续2020-03-17 23:51:07

      首先补充一下关于数据集的几点内容,在上次博客之后做的练习中,我发现了关于数据集中一些比较重要却被我忽视的内容。   1、划分数据集。对于机器学习来说,不能将所有的数据都用来进行训练,这是因为倘若将所有的数据都用来训练,然后训练完毕后的模型直接去进行预测等工作,这样很难

  • R | 探索性数据分析 EDA2020-03-15 17:54:39

      一、集中趋势和离中趋势 表示集中趋势的指标们:  均值、中位数、众数、百分位数 异常值判定:  3σ原则原则(还有很多别的原则):超出(μ-3σ,μ+3σ)的值,即超出箱线图上下边界的点 离散程度指标:  极差(range)  标准差(sta.dev)  方差(variance)  变异系数(CV):对标准差做去量纲化,消除两组

  • k近邻法2020-03-09 12:54:17

    算法1:k近邻法 复杂度:O(n) 算法2:构造平衡kd树 算法3:搜索kd树 复杂度:O(log(n)) 当空间维数接近训练实例数时,他的效率会迅速下降,几乎接近线性扫描   python代码实现k近邻法: # # k近邻算法 步骤: 1.导入数据 2.分割数据(用于交叉验证) 3.k近邻算法 4.模型评估 # ### 一、导入数据 #

  • 3.数据可视化入门介绍2020-03-08 20:53:53

    数据可视化库:1.matplotlib; 2.seabron(辅助的库,更强大更丰富更好看); 3.Axes3D ...1.导包 1 import numpy as np 2 import pandas as pd 3 4 import matplotlib.pyplot as plt 5 6 import seaborn as sns 7 ​ 8 #去除执行当中报警告提示的库 9 import warnings 10 wa

  • 数据预处理 | 使用 Filter Wrapper Embedded 实现特征工程中的特征选择2020-03-08 10:01:54

    目录 1 Filter   1.1 移除低方差特征(Removing features with low variance)   1.2 单变量特征选择 (Univariate feature selection)     1.2.1 卡方检验 (Chi2)     1.2.2 Pearson 相关系数 (Pearson Correlation) 2 Wrapper   2.1 递归特征消除 (Recursive Featu

  • [Python机器学习]鸢尾花分类 机器学习应用2020-02-26 23:57:43

    1、问题简述   假设有一名植物学爱好者对她发现的鸢尾花的品种很感兴趣。她收集了每朵鸢尾花的一些测量数据: 花瓣的长度和宽度以及花萼的长度和宽度,所有测量结果的单位都是厘米。   她还有一些鸢尾花的测量数据,这些花之前已经被植物学专家鉴定为属于 setosa、versicolor

  • 深度学习04-keras实例iris数据集+模型保存调用及修改+在sklearn框架内使用Keras模型+交叉验证2020-02-23 20:02:20

    此篇代码接着上一篇,这里查看https://blog.csdn.net/qq_42871249/article/details/104456690 模型的保存与载入 先将模型保存的函数调出来,存贮为checkpoint from keras.callbacks import ModelCheckpoint checkpoint = ModelCheckpoint(filepath = r'F:\learning_kecheng\de

  • Iris_cookie和session2020-02-06 11:00:25

    3. Session的使用和控制 在实际的项目开发中,我们会经常有业务场景使用到Session功能。在iris框架中,也为我们提供了方便使用,功能齐全的Session模块。Session模块的源码目录为kataras/iris/sessions包。 3.1 Session与Cookie的区别 在学习web开发过程中,我们总会和session和cookie打

  • Iris配置2020-02-05 09:00:49

    package main import ( "github.com/kataras/iris" "os" "encoding/json" "fmt" ) /** * Iris配置设置案例 */ func main() { //1.新建app实例 app := iris.New() //一、通过程序代码对应用进行全局配置 app.Configure(iris.WithConfiguration(iri

  • 鸢尾花决策树分类及可视化2020-01-16 16:44:28

    鸢尾花数据集简介 Iris数据集作为入门经典数据集。Iris数据集是常用的分类实验数据集,早在1936年,模式识别的先驱Fisher就在论文The use of multiple measurements in taxonomic problems中使用了它 (直至今日该论文仍然被频繁引用)。 Iris也称鸢尾花卉数据集,是一类多重变量分

  • NumPy测试题2019-12-19 20:01:00

         NumPy 是 Python 科学计算的基础软件包,        提供多维数组对象,多种派生对象(掩码数组、矩阵等)以及用于快速操作数组的函数及 API,它包括数学、逻辑、数组形状变换、排序、选择、I/O 、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等等。70道NumPy测试题

  • UCI数据集iris数据简单的可视化2019-12-13 21:51:20

    数据集官网下载; jupyter notebook 实现; import numpy as np import pandas as pd import matplotlib.pyplot as plt fname = 'E:\\pythonwork\\project\\Deeplearning\\Task\\data\\iris.data' with open(fname, 'r+', encoding='utf-8

  • 机器学习pipeline总结2019-11-29 18:02:28

    # -*- coding: utf-8 -*- """scikit-learn introduction Automatically generated by Colaboratory. Original file is located at https://colab.research.google.com/drive/1quaJafg43SN7S6cNwKFr0_WYn2ELt4Ph scikit-learn官方网站:https://scikit-learn

  • 机器学习No.22019-11-23 15:02:47

    任务——手写KNN算法实现分类问题 1. 导入数据集 在查资料的时候看到了导iris数据集还可以直接利用Python中的机器学习包scikit-learn直接导入。 from sklearn.datasets import load_iris data = load_iris() print(dir(data)) # 查看data所具有的属性或方法 print(data.DESCR)

  • 决策树2019-10-30 15:50:58

    一,决策树概念 通过分支进行判断结果,而这些分支就是特征,如果重要的特征在根节点,就能有效的减少决策次数。所以决策树的问题在于如何高效的构建决策树。   二。 信息论 1.信息熵 -代表信息(结果)的不确定性  2.信息增益 当确定某个特征后,信息熵改变的大小(信息熵-条件熵)      

  • 机器学习--支持向量机 (SVM)算法的原理及优缺点2019-10-29 21:02:11

    一、支持向量机 (SVM)算法的原理   支持向量机(Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。它是将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔

  • Python :txt文件转换成csv文件2019-10-28 10:44:24

    Python:txt文件转换成csv文件 尝试将鸢尾花数据集原始的data文件转化为csv格式。data文件可以用记事本打开,具体的操作也是同txt文件相同的。 import csv with open('irisdata2.csv','w',newline='') as iris1: iris1writer=csv.writer(iris1) with open(r'C:\iris\i

  • KNN基础代码2019-10-27 22:03:59

    库 sklearn 库下的工具: datasets,model_selection,neighbors K近邻代码思路: 有个数据集----对数据分割----调用KNN算法 iris = datasets.load_iris() 导入数据集 数据集权重:开源数据集,重要数据集之一 数据集特点:还有3个类别,所以可分类 数据集描述链接:https://archive.ics.uc

  • FCM算法与K-means 算法2019-10-27 14:01:33

    FCM算法 一.原理介绍 模糊C均值(Fuzzy C-means)算法简称FCM算法,是一种基于目标函数的模糊聚类算法,主要用于数据的聚类分析。理论成熟,应用广泛,是一种优秀的聚类算法。 首先介绍一下模糊这个概念,所谓模糊就是不确定,确定性的东西是什么那就是什么,而不确定性的东西就说很像什么。比

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有