样本

线性模型，SVM，决策树2022-01-23 19:34:09

机器学习复习2 线性模型，虽为回归，但是分类单一属性线性回归：目的：学得一个线性模型以尽可能准确地预测实值输出标记最小二乘法：均方误差分别对w和b求导得到闭式解多元线性回归：其他相同不是满秩矩阵，多个解，怎么选? 根据归纳偏好选择解或引入正则化:对解空间的一种限制优点：
兴趣点图谱的内容理解2022-01-22 22:32:06

兴趣点图谱的内容理解本节包括：项目背景介绍兴趣点图谱建设 • 节点挖掘 • 关系挖掘兴趣点图谱应用项目背景-推荐基本范式项目背景-推荐不准搜索使用：词粒度进行召回，但是排序阶段，能够利用完整query排序，因此搜索可以使用basic粒度分词做召回。 eg：王宝强马蓉离婚，会把同
大厂技术实现 | 图像检索及其在淘宝的应用 @计算机视觉系列2022-01-22 14:34:26

图像检索任务指的是，给定查询图像，从图像数据库中找到包含相同或相似实例的图像。典型应用之一就是电商商品检索，如淘宝拍立淘，只需要用户随手拍照即可精准检索，提高了电商购物的体验。本篇我们来看看淘宝拍立淘背后的实现方案和依托的计算机视觉技术。一图读懂全文获取『计算机视
训练集、验证集、测试集的作用2022-01-22 13:02:40

目录 1. 前言2. 训练集、验证集、测试集的作用3. 一些杂碎的东西① 过拟合② 验证集和测试集的区别③ 三者划分比例④ 训练样本与验证样本、测试样本分布不匹配的问题⑤ 关于测试集 4.参考来源 1. 前言本篇是看完吴恩达老师DL的课，写来当笔记看的，若有错误与疑虑，请指正
2022年全球冷冻组织样本行业市场现状及发展前景预测2022-01-21 11:30:50

【报告篇幅】：90 【报告图表数】：141 根据QYR（恒州博智）的统计及预测，2021年全球冷冻组织样本市场销售额达到了0.5亿美元，预计2028年将达到1.5亿美元，年复合增长率（CAGR）为16.4%（2022-2028）。地区层面来看，中国市场在过去几年变化较快，2021年市场规模为百万美元，约占全球的 %，预计2028年将达
ridging the Gap Between Anchor-based and Anchor-free Detection 阅读2022-01-18 15:32:22

Abstract 最近（2020年的文章），由于 FPN 和 Focal Loss 的提出，anchor-free 检测器变得流行起来。本文首先指出：anchor-based 和 anchor-free 检测的本质区别实际上是如何定义正负训练样本，这导致了它们之间的性能差距。如果他们在训练过程中采用相同的正负样本定义，无论是从一个框回
机器学习中的数据2022-01-16 18:00:23

以鸢尾花数据为例：其中包含四个主要的信息（萼片（sepal）的长宽、花瓣（petal）的长宽）根据以上数据大致可以分为三个种类，Iris-Setosa、Iris-Versicolour、Iris-Virginica 其数据的结构大致如下：现有以下数据为例：此处使用数字0，1，2在机器学习中分别简化表示三种类型。上面示例的数
集成学习相关面试知识点2022-01-15 10:33:18

集成学习该内容由个人整理和归纳，如有不同见解，还望指教～集成学习方法有哪些？bagging和boosting的区别？(京东) Boosting: AdaBoost, 提升树, GBDT, XGBoost, LightGBM Bagging: 随机森林区别：样本采样方式不同：Bagging 是按照一定标准进行有放回采样，每次的采样是独立的，而 Boosti
SDTM Model -- Finding2022-01-14 16:02:07

1. topic变量 2. 3. 4. 5. 6. 7. --ORREF: 肺活量测试？ 8. 9. 对结果进行分类，恶性/良性等 10. --CHRON 对生物过程duration的分类，导致特定发现的生物过程，例如急性慢性亚急性。 --DISTR 检查区域的finding分布模型，例如局部，多灶，弥散性。 11. 12. --XFN:
血样制备方案2022-01-14 14:03:53

常规血液样本采集（1）血液样本类型（EDTA抗凝或促凝血样）（2）血液样本处理过程快处理：血液离体后，细胞膜稳定性下降，尽快开展血清、血浆的分离，避免出现溶血现象。慢分离：离心速度不能过快，过快的离心速度会造成红细胞压积，容易产生溶血。冷保存：全血液样品如不能马上进行血清或血浆的分离，
概率论与数理统计2022-01-13 23:02:39

概率论：研究如何定量描述随机现象的发生可能性及其规律数理统计：通过样本来对总体进行估计或者检验某个假设是否成立对于随机现象的规律总结概率：随机事件发生的可能性概率模型离散型：二项分布（多次放回重复试验，成功次数的分布概率）、泊松分布、几何分布（独立重复试验，首次成功
逻辑回归2022-01-12 10:02:37

一、二项分布 p（x）=p^x*（1-p）^(1-x) 二、极大似然估计极大似然估计，通俗理解来说，就是利用已知的样本结果信息，反推最具有可能（最大概率）导致这些样本结果出现的模型参数值！参考博客：1、一文搞懂极大似然估计
西瓜书笔记第一二章2022-01-12 00:01:41

西瓜书笔记第一章绪论机器学习：利用“数据”作为“经验”形式，让计算机在计算数据时产生 “模型”，然后根据得到的“经验”模型来对新的情况作出判断。基本术语样本：记录中对一个事件或对象的描述数据集：一组记录的集合属性：反映时间或对象在某方面的表现或性质样本空间：所有属
Out-of-distribution Detection系列专栏（二）2022-01-11 23:30:35

目录前言 A baseline for detecting misclassified and out-of-distribution examples in neural networks ID与OOD OOD研究中常用的数据集以及实验构造方式 OOD实验的基本设置 Max-Softmax方法的主要思想评价指标 AUROC与AUPR的计算方法前言这是OOD检测专栏的第二篇文章，也
百面机器学习--No.3 模型评估 -- 预测结果的衡量指标和局限性2022-01-10 21:00:38

预测结果的衡量指标准确率精确率和召回率精确率召回率对比： P-R 曲线F1-scoreROC 曲线AUCROC和P-R曲线的不同两者的选择准确率准确率是指分类正确的样本占总样本个数的比例；局限性：会受到类别不平衡的影响，从而导致模型性能看起来好，但是实际效果会很差；举例：100样本中，有
生物特征验证是什么意思2022-01-10 12:30:14

生物特征验证也可称为生物识别验证，是一种身份认证和识别判断的过程，用于通过唯一可识别的生物特征（例如指纹和人脸）来确认所声称的身份。它旨在允许用户通过提供生物特征样本和相关的唯一识别码来证明他或她的身份，以便获得对安全环境的访问。生物识别技术生物识别验证用于代替用
A Surface Defect Detection Method Based on Positive Samples2022-01-10 09:05:44

A Surface Defect Detection Method Based on Positive Samples （一种基于正样本的表面缺陷检测方法）文献来源：https://doi.org/10.1007/978-3-319-97310-4_54 （2018 Zhixuan Zhao） 1.论文亮点：（1）本文提出了一种仅基于正样本训练的新型缺陷检测框架（2）建立一个重建网络，该网络可以
BUAA_概率统计_Chap07_统计量及其分布2022-01-09 03:34:31

第七章统计量及其分布 7.1 总体与样本 7.1.1 总体与个体总体：具有一定共同属性的研究对象的全体；个体：组成总体的每一个元素在实际中我们主要关心的是：研究对象的某一（或某几项）数量的指标 \(X=X(\omega)\)，它是一个随机变量。总体：随机变量（数量指标） \(X\) 的全体取值构成的集合。
GeoLabel更新，支持整幅大影像标注2022-01-08 22:03:11

2.0版本没有按时到来，这次发布的是1.3.1版本，得益于社群朋友们的宝贵反馈以及我三岁女儿的点拨，这个版本有很多有意思且实用的功能升级。（文末有GeoLabel图像标注技术交流群加入方式）主要升级简介如下，后续会有更详细的推文介绍本次更新的内容。 1 整景影像标注 GeoLabel
python 求各种距离公式（numpy矩阵）2022-01-08 00:00:20

导入必要库： from scipy.spatial.distance import pdist, squareform 一、距离计算（压缩成一维的） 1、欧式距离计算数组矩阵 X 样本之间的欧式距离，返回值为 Y 为压缩距离元组或矩阵（以下等同） X = pdist(X, 'euclidean') 2、明氏距离 X = pdist(X, 'minkowski', p)
5、极大似然估计2022-01-05 20:32:17

极大似然估计，通俗理解来说，就是利用已知的样本结果信息，反推最具有可能（最大概率）导致这些样本结果出现的模型参数值！换句话说，极大似然估计提供了一种给定观察数据来评估模型参数的方法，即：“模型已定，参数未知”。极大似然估计中采样需满足一个重要的假设，就是所有的采样都是独立同分布
异常检测论文阅读《Sparse Reconstruction Cost for Abnormal Event Detection》CVPR 20112022-01-04 18:08:41

《Sparse Reconstruction Cost for Abnormal Event Detection》CVPR 2011 In this paper, we propose a general abnormal event detection framework using sparse representation for both LAE and GAE. 在本文中，作者提出了一个使用稀疏表示的LAE和GAE的通用异常事件检测框
机器学习——性能指标2022-01-04 12:32:12

衡量一个机器学习算法的好坏需要一个标准来衡量，对于不同场景中的不同任务就需要决定不同的指标来度量。根据没有免费午餐这个归纳偏好，我们可以知道，没有一种模型是完美适用于任何场景。所以选取一个合适的性能指标和选取一个切合的机器学习算法均是很重要的事情。所以本文对此加以
医咖会免费SPSS教程学习笔记—非参数检验之多个独立样本2022-01-02 20:31:28

1.两种情况（1）多个样本满足独立、正态和方差齐性这三个条件的话，则可使用单因素方差分析。（2）若不满足以上条件，则使用多个独立样本的秩和检验。 2.方差齐性检验分析—一般线性模型—多变量—拖入变量—点击右侧的“选项”—勾选“齐性检验” 若显著性小于0.05，则方差不齐。 3.克
RetinaNet学习笔记2022-01-02 17:33:02

RetinaNet （ICCV 2017）论文地址；参考博客1；参考博客2 1.概述原论文作者针对单阶段法（one-stage)目标检测模型中前景(positive)和背景(negatives)类别的不平衡问题，提出了一种叫做Focal Loss的损失函数，用来降低大量easy negatives在标准交叉熵中所占权重（提高hard negatives所占权重)

首页 < 5 6 7 8 > 尾页

ICode9

线性模型，SVM，决策树2022-01-23 19:34:09

兴趣点图谱的内容理解2022-01-22 22:32:06

大厂技术实现 | 图像检索及其在淘宝的应用 @计算机视觉系列2022-01-22 14:34:26

训练集、验证集、测试集的作用2022-01-22 13:02:40

2022年全球冷冻组织样本行业市场现状及发展前景预测2022-01-21 11:30:50

ridging the Gap Between Anchor-based and Anchor-free Detection 阅读2022-01-18 15:32:22

机器学习中的数据2022-01-16 18:00:23

集成学习相关面试知识点2022-01-15 10:33:18

SDTM Model -- Finding2022-01-14 16:02:07

血样制备方案2022-01-14 14:03:53

概率论与数理统计2022-01-13 23:02:39

逻辑回归2022-01-12 10:02:37

西瓜书笔记 第一二章2022-01-12 00:01:41

Out-of-distribution Detection系列专栏（二）2022-01-11 23:30:35

百面机器学习--No.3 模型评估 -- 预测结果的衡量指标和局限性2022-01-10 21:00:38

生物特征验证是什么意思2022-01-10 12:30:14

A Surface Defect Detection Method Based on Positive Samples2022-01-10 09:05:44

BUAA_概率统计_Chap07_统计量及其分布2022-01-09 03:34:31

GeoLabel更新，支持整幅大影像标注2022-01-08 22:03:11

python 求各种距离公式（numpy矩阵）2022-01-08 00:00:20

5、极大似然估计2022-01-05 20:32:17

异常检测论文阅读《Sparse Reconstruction Cost for Abnormal Event Detection》CVPR 20112022-01-04 18:08:41

机器学习——性能指标2022-01-04 12:32:12

医咖会免费SPSS教程学习笔记—非参数检验之多个独立样本2022-01-02 20:31:28

RetinaNet学习笔记2022-01-02 17:33:02

西瓜书笔记第一二章2022-01-12 00:01:41