ICode9

精准搜索请尝试: 精确搜索
  • 机器学习:支持向量机2022-07-03 10:01:35

    1、间隔与支持向量 支持向量机(support vector machine)是一种经典的二分类模型,基本模型定义为特征空间中最大间隔的线性分类器,其学习的优化目标便是间隔最大化,因此支持向量机本身可以转化为一个凸二次规划求解的问题。 对于二分类学习,假设现在的数据是线性可分的,这时分类学习最基

  • 机器学习2022-07-02 18:33:34

                             

  • 机器学习-感知机模型2022-07-02 12:33:07

    一、引言   单层感知机是神经网络的一个基本单元,类似于人类的神经网络的一个神经元,神经网络是由具有适应性的简单单元(感知机)组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。感知机可以理解为对输入进行处理,并得到输出结果的机器。我们

  • 收到一封CTO来信,邀约面试机器学习工程师2022-07-01 21:37:31

    大家好,我是北海 很少登陆 Gmail,前天收验证码登了一下,发现居然收到一封某初创公司CTO的来信. 我在Github上看到了您的资料觉得很有意思,请问您是否考虑我们公司的全职工作机会呢?可供考虑的岗位包括机器学习工程师,软件工程师,和机器人工程师。工作地点位于深圳。如果是在别的城市已

  • 机器学习基础知识2022-07-01 20:31:32

    ROC曲线含义 ROC 曲线含义 ROC 全称 receiver operating characteristic curve,受试者工作特征曲线 针对二分类任务,有 True Positive Rate 和 False Negative Rate 也就是真阳率(TPR)和假阳率(FNR) 二分类任务,输出的是样本被预测为1的概率,对于这个概率有一个阈值,比如 f(x) > 0.3的时候,

  • 机器学习—线性回归2022-07-01 13:06:51

    1.概念 1.1 线性回归概念 机器学习中的两个常见的问题:回归任务和分类任务。那什么是回归任务和分类任务呢?简单的来说,在监督学习中(也就是有标签的数据中),标签值为连续值时是回归任务,标志值是离散值时是分类任务。而线性回归模型就是处理回归任务的最基础的模型。 线性:两个变量之间的

  • 机器学习—性能度量2022-07-01 13:06:30

    一个机器学习模型需要一些性能度量指标来判断它的好坏,了解各种评估的方法优点和缺点,在实际应用中选择正确的评估方法是十分重要的。 对于分类模型的各种性能度量的算法,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值等,接下来我们将详细的说明这些行性能度量算法。

  • 机器学习—决策树2022-07-01 13:05:40

    泰坦尼克号沉没是历史上最臭名昭着的沉船之⼀。 1912年4⽉ 15⽇ , 在她的处⼥航中, 泰坦尼克号在与冰⼭相撞后沉没, 在2224名乘客和机组⼈员中造成1502⼈死亡。 这场耸⼈听闻的悲剧震惊了国际社会, 并为船舶制定了更好的安全规定。 造成海难失事的原因之⼀是乘客和机组⼈员没有⾜够的

  • 机器学习—朴素贝叶斯2022-07-01 13:05:19

    朴素贝叶斯算法(Naive Bayesian algorithm) 是应用最为广泛的分类算法之一。 朴素贝叶斯方法是在贝叶斯算法的基础上进行了相应的简化,即假定给定目标值时属性之间相互条件独立。也就是说没有哪个属性变量对于决策结果来说占有着较大的比重,也没有哪个属性变量对于决策结果占有着较小

  • 机器学习—聚类算法2022-07-01 13:04:59

    聚类(Clustering)是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。 1.K-Means聚类鸢尾花数据 from sklearn.d

  • 机器学习—最近邻算法2022-07-01 13:04:39

    kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数数以一个类型别,则该样本也属于这个类别,并具有该类别上样本的特征。该方法在确定分类决策上,只依据最近邻的一个或者几个样本的类别来决定待分样本所属的类别。 1.鸢尾花分类问题 from sklearn.neighbors im

  • 机器学习—支持向量机2022-07-01 13:02:08

    支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;SVM还包括核技巧,这使它成为实质上的非线性分类器。SVM的的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合

  • 机器学习—人工神经网络2022-07-01 13:01:36

    人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理 1.从输入层到隐藏层 import pandas as pd import numpy as np def sigmoid(x): #网络激活函数 ret

  • 协变量2022-06-30 18:34:58

      关于协变量:我的建议是不要在这个定义上面钻牛角尖,因为“协变量”没有唯一定义,记住什么模型下什么变量可以叫“协变量”即可。 比如,线性回归的自变量可以叫“协变量”,协变量等同于自变量。线性回归模型如果是一个方差分析模型,则“无法控制”的连续变量叫“协变量”。回归模型的

  • AcWing 1013. 机器分配2022-06-27 23:32:09

    分组背包 输出方案可以跟最短路输出路径进行类比 背包DP输出方案—拓扑图分析 #include<bits/stdc++.h> using namespace std; #define fr first #define se second typedef pair<int, int> PII; typedef long long LL; typedef unsigned long long ULL; const int INF = 0X3

  • 机器学习笔记一2022-06-27 18:00:44

    引言 机器学习用途广泛 1, 数据挖掘,分析数据,得出用户画像,寻找用户区分度 2, 无法编程实现的功能比如手写体识别,计算机视觉,自然语言分析 3, 自我学习,推荐不同内容 4, 理解人的学习过程,例如真正的ai   什么是机器学习 定义1:在没有明确设置的情况下,使计算机具有学习能力的研究领域 Arthu

  • 100+数据科学面试问题和答案总结 - 机器学习和深度学习2022-06-27 11:00:06

    来自Amazon,谷歌,Meta, Microsoft等的面试问题,本文接着昨天的文章整理了机器学习和深度学习的问题 机器学习 54、什么是机器学习? 机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内

  • 机器学习:神经网络(下)2022-06-26 08:33:15

    下面介绍一些常见的神经网络 1、其他常见神经网络 1.1RBF网络   RBF网络是一种单隐层前馈神经网络,它使用径向基函数作为隐层神经元激活函数,而输出层则是对隐层神经元输出的线性组合。径向基函数,是某种沿径向对称的标量函数,通常定义为样本到数据中心之间欧氏距离的单调函数。具有

  • ML第12周学习小结2022-06-26 08:31:16

    本周收获 总结一下本周学习内容: 1、《深入浅出Pandas》的第11章:Pandas文本处理 11.1 数据类型 11.2 字符的操作 11.3 文本高级处理

  • 机器学习:神经网络(上)2022-06-26 08:00:08

    1、 基本概念 在机器学习中,神经网络一般指的是“神经网络学习”,是机器学习与神经网络两个学科的交叉部分。所谓神经网络,目前用得最广泛的一个定义是“神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应”。神

  • 机器学习:决策树(下)2022-06-26 07:31:23

    前面机器学习:决策树(上)已经学习了构造决策树的基本流程、三个常见算法、以及划分属性的方法,下面将学习如何优化一个决策树 1、剪枝处理 剪枝(pruning)是决策树学习算法应对过拟合的主要手段。因为决策树模型太强大了,很可能把训练集学得太好以致于把训练集本身的特性也给学习了(特别是

  • AForge2022-06-25 09:36:20

    AForge是⼀个专门为开发者和研究者基于C#框架设计的,他包括与⼈⼯,图像处理,神经⽹络,遗传,,模糊系统,控制等领域。这个框架由⼀系列的类库组成。主要包括有:AForge.Imaging —— ⽇常的图像处理和过滤器AForge.Vision —— 计算机视觉应⽤类库AForge.Neuro —— 神经⽹络计算库AForge.Gen

  • 使用Databricks+Mlflow进行机器学习模型的训练和部署【Databricks 数据洞察公开课】2022-06-22 18:04:10

    简介: 介绍如何使用Databricks和MLflow搭建机器学习生命周期管理平台,实现从数据准备、模型训练、参数和性能指标追踪、以及模型部署的全流程。 作者:李锦桂   阿里云开源大数据平台开发工程师   ML工作流的痛点 机器学习工作流中存在诸多痛点:   首先,很难对机器学习的

  • ML第11周学习小结2022-06-19 10:03:38

    本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第10章:Pandas数据清洗 10.1 缺失值的认定 ~ 10.5 Numpy格式转化

  • 机器学习:决策树(上)2022-06-19 00:01:29

    1、基本流程 决策树中决策过程的每一次判定都是对某一属性的“测试”,决策最终结论则对应最终的判定结果。 一般一棵决策树包含:一个根节点、若干个内部节点和若干个叶子节点 每个非叶节点表示一个特征属性测试。 每个分支代表这个特征属性在某个值域上的输出。 每个叶子节点存放一

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有