ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

10.4-10.5随笔

2021-10-06 17:03:56  阅读:201  来源: 互联网

标签:信息处理 10.5 10.4 函数 神经网络 随笔 数据 注意力 RNN


一、在爬虫过程中的心得:

  1、有些数据类型不一致,不能统一读取

  2、注意封装函数;

  3、添加注释:有助于后续他人维护,以及自己修改

  4、转txt的时候,注意空间的利用:如何节省空间,是否可以边存储边删除。

二、最近的新词:

1、损失函数:损失函数(loss function)或代价函数(cost function)是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。

2、学习率:learning rate.

3、高斯分布:正态分布

4、噪声:所有难以被机器正确理解和翻译的数据。

5、数据清洗的方式:利用有关技术如数理统计数据挖掘或预定义的清理规则将脏数据转化为满足数据质量要求的数据。如错误数据(偏差分析、识别不遵守分布或回归方程的值,也可以用简单规则库( 常识性规则、业务特定规则等)检查数据值,或使用不同属性间的约束、外部的数据来检测和清理数据)、重复数据(通过判断记录间的属性值是否相等来检测记录是否相等,相等的记录合并为一条记录(即合并/清除)。)、残缺数据。

6、注意力机制:注意力机制(Attention Mechanism)源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。上述机制通常被称为注意力机制。人类视网膜不同的部位具有不同程度的信息处理能力,即敏锐度(Acuity),只有视网膜中央凹部位具有最强的敏锐度。为了合理利用有限的视觉信息处理资源,人类需要选择视觉区域中的特定部分,然后集中关注它。例如,人们在阅读时,通常只有少量要被读取的词会被关注和处理。综上,注意力机制主要有两个方面:决定需要关注输入的哪部分;分配有限的信息处理资源给重要的部分。

7、LSTM:短期记忆网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的RNN循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。

8、CMM:全称Capability Maturity Model for Software,能力成熟度模型,它是对于软件组织在定义、实施、度量、控制和改善其软件过程的实践中各个发展阶段的描述.CMM

的核心是把软件开发视为一个过程,并根据这一原则对软件开发和维护进行过程监控和研究,以使其更加科学化、标准化、使企业能够更好地实现商业目标.

三、写作要注意的:

1、数据、图等的格式要清楚标准,易于他人使用

2、作图看重合率时,可以用不同标记(如叉号和方块)

 

四、值得学习的:

1、学会为任务分解、排期。

标签:信息处理,10.5,10.4,函数,神经网络,随笔,数据,注意力,RNN
来源: https://www.cnblogs.com/dianyue/p/15371069.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有