ICode9

精准搜索请尝试: 精确搜索
  • 【离线电商数仓】Day04-即席查询(Ad Hoc):Presto链接不同数据源查询、Druid建多维表、Kylin使用cube快速查询2021-12-06 22:35:31

     一、Presto 1、简介 概念:大数据量、秒级、分布式SQL查询engine【解析SQL但不是数据库】 架构 不同worker对应不同的数据源(各数据源有对应的connector连接适配器) 优缺点 缺点:读数据连查表会产生大量临时数据 与impala比较 Impala性能稍领先于Presto,但是Presto在数据源支持上非

  • Pytorch函数1 torch.max\ torch.min\ torch.squeeze\ torch.unsqueeze\ torch.rand \randn \randint2021-12-04 23:59:52

    1.torch.max(input)         输入input:任何形状的张量         输出:返回输入张量input中所有元素的最大值 。 import torch a = torch.randn((3,4,5)) b = torch.max(a) # 返回所有张量中的最大值 print(a) tensor([[[-0.5234, -2.3275, 1.8327, 0.53

  • 22种世界500强都在用的高效工作方法,你了解几种?2021-12-02 17:33:00

    1.30秒法则:在极短时间能将一件事情讲清楚; 2.PDCA:每一项工作的推进都应该包含计划、执行、检查、行动4个环节; 3.5W1H:将事情讲清楚的6个维度,又称六何法,即,何事(what)、何地(where)、何时(when)、何人(who)、为何(why)、如何做(how); 4.ECRS:改善最基础的思维方式,即,能否取消(Eliminate),合并(Combine),重组

  • 明细数据层(DWD)2021-12-01 13:59:40

    事实表设计原则 尽可能包含所有与业务过程相关的事实。 设计事实表的目的是度量业务过程,所以分析哪些事实与业务过程有关,是事实表设计中至关重要的。在事实表中应该尽量包含所有与业务过程相关的事实,即使存在冗余,但是因为事实通常为数字型,带来的存储开销不会很大。 只选择与业务

  • 深度学习模型tensor维度对不上怎么办2021-11-30 17:33:07

    深度学习模型tensor维度对不上是一个非常常见且有时比较难排查的现象。之所以难排查是因为报错信息和真实的错误原因之间的联系往往并不紧密,很难仅仅从PyTorch给出的数字上的信息判断错误在何处。 笔者在一个训练好的模型上测试单个样本时出现了这个问题,一度排查了图片读取、

  • 一文讲透,关于搭建指标体系,整理的重要知识点都在这里了2021-11-30 09:03:26

    数字化转型过程中,很多企业面临着指标体系不完整的问题。比如: 各部门根据业务需求,都有一部分量化指标,但不够全面,对企业整体数据分析应用能力提升的帮助有限; 缺乏整体考量而设置的指标体系,以及错误的指标分析方法,会产生错误的分析结果,进而影响企业经营层面的决策。 相比于单一

  • 预处理+条件的维度减少2021-11-29 11:03:36

    思维: 3个人的同时满足条件 通过预处理 (每2个人之间的关系) 来达到后面 操作的 O1 复杂度 》》达到降维 的目的(减少时间复杂度); title: 环岛三人行! time limit: 2s memory limit: 128m description : 舟游两周年啦~Keller决定叫上王浩源和dyp一起去罗德岛游玩! 罗德岛是希腊第

  • 数据可视化:如何选择图表2021-11-27 01:04:38

    在现今这个时代,数据可视化已经成为办公标配,很多策划、运营、分析师都需要制作以图表为主要元素的数据报告。数据报告的制作工具有很多,其中excel是大家比较常用的;另外很多低代码配置工具也渐渐开始流行起来,比如图表秀、网易有数、镝数、FineReport、Tableau等。这些工具提供了丰富

  • pytorch基础(七):卷积层的使用torch.nn.Conv2d和torch.nn.Conv1d2021-11-26 14:34:41

    文章目录 前言一、前置知识二、torch.nn.Conv2d三、torch.nn.Conv1d 前言   本系列主要是对pytorch基础知识学习的一个记录,尽量保持博客的更新进度和自己的学习进度。本人也处于学习阶段,博客中涉及到的知识可能存在某些问题,希望大家批评指正。另外,本博客中的有些内容

  • 数据仓库建模2021-11-25 14:04:13

    DataWareHouse数据建模 文章目录 DataWareHouse数据建模什么是数据建模?什么是数据模型?数据仓库模型的组成为什么需要数据模型?数据仓库的发展大致经历了三个过程 数据仓库数据模型架构最后引出什么是数据建模? 维度表的分类事实表维度表总结数据组织类型星型模型雪花模型星座

  • numpy根据值的大小来拆分数组,并新建一个轴2021-11-21 23:58:57

    在numpy中,常规的数据切片,根据轴来进行数据切分等,都很方便。但,如果要根据矩阵中的值来切分数组,并新建一个维度,这个还是有点麻烦。记录过程如下: 有这么一个数组: import numpy as np rs = [ [1, 23, 87], [2, 34, 98], [3, 32, 73], [4, 76, 74], [

  • 演员维度表和电影维度表2021-11-21 19:59:28

    一、加载演员数据至演员维度表 1.打开Kettle工具,创建转换  2.配置表输入控件     2.配置表输入2控件       4.配置插入/更新控件         双击“插入/更新”控件,进入“插入/更新”界面,单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。MySQL数据库

  • 数据仓库:维度分析和指标2021-11-20 12:33:34

    一、维度 介绍:指的是在分析一个问题的时候,可以从不同角度来看待,而这些角度就是维度,角度不同决定了维度不同维度的分类 定性维度:一般指的求 “每个” “各个” 等相关维度 在SQL上表示:一般都是放置group by中 定量维度:一般表示区间范围或者具体的值 SQL上表示:一

  • 数据洞察能力提升2021-11-17 22:31:24

    依靠数据分析来评估、诊断、优化 问题分析的思路: 1.问题定位 2.主要责任人 3.具体原因 分析原因的方式:对比分析、维度分析、漏斗分析等 下图为一个维度拆解法的思路: 主要是依据业务,思考可能有那种原因导致利润下滑,例如是员工原因还是店铺原因还是成本原因等。一一排除之后找到下

  • 第八章数据仓库2021-11-17 19:00:05

    一、加载日期数据至日期维度表 1.打开Kettle工具创建转换load_dim_date,并添加“生成记录”控件、“增加序列”控件、“JavaScript代码”控件、“表输出”控件以及Hop跳连接线。 2.配置“生成记录控件”,双击生成记录界面,在“限制”处添加生成的日期,默认为10,这里改为3650,即生成10

  • 大数据之路—— 维度设计2021-11-16 19:02:54

    十、数据模型篇—— 维度设计 10.1 维度设计基础10.1.1 基本概念10.1.2 维度的基本设计方法10.1.3 层次结构10.1.4 规范化和反规范化10.1.5 一致性维度和交叉探查 10.2 维度设计高级10.2.1 维度整合10.2.2 维度拆分10.2.3 历史归档 10.3 维度变化10.3.1 缓慢变化的维度10.3

  • Pytorch如何取出特定维的元素2021-11-16 18:04:50

    如何沿着某一维取出所有元素: torch.gather(input, dim, index) # 可以沿着某一维将需要的元素都取出来 # 一般input和index的维度除了要操作的那一维,其他维都是相同的 # 举例: input = torch.LongTensor([[[1,2],[3,4],[5,6]],[[7,8],[9,10],[11,12]]]) # shape = [2, 3, 2] inde

  • 多个卷积层间合并的分析2021-11-15 18:33:51

    1 经过卷积层前后的变化 假设输入数据为 channel1 × nh × nw 经过一个 kh × kw 的卷积核,步长为 s,padding为 p,则输出的空间维度为 ⌊( nh​ − kh​ + p​​ ) / s + 1⌋ × ⌊( nw​ − kw​ + p​ ) / s + 1​⌋,易知,输出空间存在 ⌊( nh​ − kh​ 

  • 亿信BI——维度转换组件使用2021-11-13 15:33:39

    功能模块: 用户点击“维度转换”模块进行维度转换操作,维度转换页面的顶部导航栏包括基本属性和转换设置两部分。 基础属性: 在基本属性模块部分,编号、标题和类型是必填项且系统已经默认填写,其中编号和类型用户无法进行修改,用户可以修改标题和填写文件描述(描述可以为空); 转换设置: 填

  • 阿里云毕龙飞:五个维度推进企业生产关系数字化2021-11-12 16:03:42

    云计算市场方兴未艾,企业的上云进程加快,传统IT资源管理方式却在拖慢企业数字化转型的步伐。近日,基于对客户和市场的充分了解,阿里云互联网举办了以“共话云上管理与治理”为主题的系列活动,邀请了埃森哲、流利说、中体彩、钉钉、德勤等众多企业代表,共同探讨云上管理的新方向,剖析

  • 《Action Recognition》-Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset(I3D)2021-11-11 15:03:25

    《Action Recognition》-I3D 目录 《Action Recognition》-I3DContributionsExperimentResult Contributions 在新的数据集Kinetics上对当时的SOTA模型进行了实验,并分析了在Kinetics预训练后模型的提升。Kinetics数据集包含了400种动作,每个动作有超过400个片段的视频。

  • 最强最全面的数仓建设规范指南2021-11-11 12:31:32

    本文将全面讲解数仓建设规范,从数据模型规范,到数仓公共规范,数仓各层规范,最后到数仓命名规范,包括表命名,指标字段命名规范等! 目录: 一、数据模型架构原则 数仓分层原则主题域划分原则数据模型设计原则 二、数仓公共开发规范 层次调用规范数据类型规范数据冗余规范NULL字段处理规范

  • 加载用户数据至用户维度表,加载商店数据至商店维度表2021-11-11 12:02:16

    一、加载用户数据至用户维度表 1.打开Kettle工具,创建转换: 使用Kettle工具,创建一个转换load_dim_customer,并添加表输入控件、映射控件、字段选择控件、值映射控件、维度查询/更新控件以及Hop跳连接线,具体如图所示。 2、配置表输入控件: 在SQL框中编写用于获取字段customer_last_u

  • TensorFlow数据合并、分割、统计2021-11-10 09:30:37

    目录 一、数据合并与分割 1.tf.concat() 2.tf.split() 3.tf.stack() 二、数据统计 1.tf.norm() 2.reduce_min/max/mean() 3.tf.argmax/argmin() 4.tf.equal() 5.tf.unique() 一、数据合并与分割 1.tf.concat() 填入两个tensor,  指定某维度,在指定的维度合并。除了合并的维度

  • 篇1-数组(定长数组,动态数组,关联数组,合并数组,非合并数组)2021-11-09 20:31:39

    参考资料: (1).公众号-芯片学堂; 1.定长数组与动态数组 1.1定长数组 (1)定长数组在声明时,必须制定数组的长度或者上下边界;在仿真编译完成后,系统需要为分配的内存空间大小就是已知的、确定的; 1.2动态数组 (1)动态数组在声明时,不需要指定数组长度; (2)动态数组在使用前,需要使用构

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有