本周收获 总结一下本周学习内容: 1、《深入浅出Pandas》的第11章:Pandas文本处理 11.1 数据类型 11.2 字符的操作 11.3 文本高级处理
核函数 对于线性不可分的情况,可以借助核函数构造非线性分类器. 先选定部分标记点(landmarks) 对于一个样本\(x\),设\(f\)度量样本与标记点的相似度: \[f_1={\mathbf {similarity}}(x,l^{(1)})=\exp(-\frac{\parallel x-l^{(1)}\parallel^2}{2\sigma^2})\\ f_2={\mathbf {similarit
术语 训练样本:代表数据集的观察,记录,个体或者样本 训练:模型拟合,对参数型模型而言,类似参数估计 特征:等同于预测因子,变量,输入,属性或协议量等 目标:等同于结果,输出,响应变量,因变量,分类标签或真值等 损失函数:经常与代价函数同义,有时也被称为误差函数 1.预处理——整理数据 原始数据很少能
本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第10章:Pandas数据清洗 10.1 缺失值的认定 ~ 10.5 Numpy格式转化
在生产中部署ML前需要了解的事 译自:What You Should Know before Deploying ML in Production MLOps的必要性 MLOps之所以重要,有几个原因。首先,机器学习模型依赖大量数据,科学家和工程师很难持续关注这些数据以及机器学习模型中可调节的不同参数。有时候对机器学习模型的微小变更可
本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的的第九章:Pandas数据重塑与透视 9.1数据透视 ~ 9.8爆炸列表
本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的的第八章:Pandas多层索引 8.1概述 8.2多层索引操作 8.3数据查询
本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第六章:Pandas分组聚合 6.1概述 6.2分组 6.3分组对象的操作
简介 机器学习问题经常需要大量的数据来进行模型的处理与改进,而这些数据又来源于世界的各个地方。把全世界的数据汇聚到一个数据中心是不可行的。所以,涵盖许多地区的多个数据中心应运而生。但是,在这些里程上特别远的数据中心网络中,即wide-area networks(WANs),网络通信的快慢是一个
随着网络流量持续增长,2021年全球互联网带宽增长29%,达到786 Tbps。除了记录流量之外,根据Google的数据,95%的流量现在都已加密。随着威胁参与者不断发展其策略和技术(例如,在加密流量中隐藏攻击),保护组织变得越来越具有挑战性。 ML 加密流量分析 为了帮助解决这些问题,许多网络
本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第五章:Pandas高级操作的两个内容 数据迭代 函数应用
人工神经网络(ANN) 简称神经网络(NN),能模拟生物神经系统对物体所作出的交互反应,是由具有适应性的简单单元(称为神经元)组成的广泛并行互连网络。 1 神经元 1.1 M-P 神经元 如下图所示,来自其它神经元的信号,x1,x2,...,xnx1,x2,...,xn,传递过来作为输入信号,并通过带权重 (w1
Week 15 Lesson 1 这个课程马上就要结束了,Week 15 第一堂课的材料是一篇关于NetFPGA的介绍性资料,老师安排这个资料是为了方便学生在这个平台上做课程论文吗? NetFPGA伴随着FPGA作为加速卡在ML中的应用,以及作为SmartNIC在数据中心的应用火了很久,但是NetFPGA SUME也真心不便宜。 材料
本周收获 总结一下本周学习内容: 1、学习了《深入浅出Pandas》的第五章:Pandas高级操作的两个内容 添加修改数据 高级过滤
Week 14 Lesson 1 Week 14课程的材料是关于ML的硬件架构的,作为课程材料的论文也是非常的牛,作者都是来自于Stanford大学的教授。 课程材料的内容总结起来就是实现了一种针对ML优化的编程语言,该语言抽象了ML计算的硬件实现,就是说用这个语言编写的ML代码可以方便地利用ML的硬件加速器
Week 14 Lesson 2 第二堂课还是没课,学生需要写课程论文。 很好奇那里可以看看正规的学生在经过这个课程的学习以后能提交出什么程度的论文? 每周的课程都是一个全新的研究领域。
Week 12 Lesson 1 本周课程的材料是一篇关于预知报文流大小对改进网络性能作用的论文。 文章首先从如果预知了网络报文流大小,并且利用这些信息对报文流进行调度可以显著增强网络性能。 但是实际上很难预知这些信息,以前的研究基于的假设在实际中很难部署,比如通过报文发送前先发送包
本周收获 总结一下本周学习内容: 1、复习了Numpy的一些基础操作,主要是利用numpy来对ndarray数组进行操作
在一个 n * m 的二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个高效的函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。 示例:现有矩阵 matrix 如下:[ [1, 4, 7, 11, 15], [2, 5, 8, 12, 19], [
第一个Week 8的第二堂课 Week 8 Lesson 2, 后面还有第二个Week 8. 本节课程的材料是一篇关于Google TPU的介绍性文章,从DNN的计算需求、代码量、计算优化的介绍开始,接着介绍了TPU的起源、架构和具体实现。详细介绍了TPU的结构框图和芯片布局设计。 从TPU的架构框图看,输入输出接口是G
本周的课程只有一份材料,一般是一周两堂课的,这周只有一堂课。 按一周两堂课的频率,要真正理解每周课程的材料,需要大量的文献阅读才能领会材料讨论的问题。课程材料的选择每份材料都是选了一个研究的热点,内容跨度很大,绝对是高强度的学习,名校果然不同凡响。 说回来,本周课程的材料是一
# 环境搭建 ## 查看电脑独立显卡是否在运行 参考https://www.cnblogs.com/forforever/p/12367802.html ## 查看电脑有没有装显卡驱动 参考https://zhidao.baidu.com/question/588385501.html ## 显卡、显卡驱动、cuda 之间的关系是什么? 参考https://www.zhihu.com/q
ML.NET是微软提供的机器学习库,从VS2019开始直接集成在VS里,帮助.NET开发者快速开发自己的机器学习应用。目前ML.NET的资料已经非常丰富,开发者可以到其官网查阅相关资料。https://dotnet.microsoft.com/en-us/learn/ml-dotnet。 本篇博客以健康码识别(绿码/黄码/红码)为例,看在.NET中如
MLOps极致细节:14. Azure ML案例:数据集预处理 这一章节我们将介绍我们在Azure ML案例中所使用的数据集,并且对其进行一些预处理,包括填补空缺,编码,添加特征等。 Win10IDE:VSCodeAnaconda代码地址 文章目录 MLOps极致细节:14. Azure ML案例:数据集预处理 1 搭建虚拟环境2 数据集预处
MLOps极致细节:15. Azure ML数据集的上传(Azure Workspace DataStore Upload)与注册(Azure Dataset Register) 这一章节中,我们将基于上一章节预处理完的数据,将其上传至Azure Storage,并且将其注册到Azure ML Workspace。我们将学习Azure Workspace的用法,Azure Dataset Register的用