ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

大数据漫谈

2022-05-31 12:33:40  阅读:164  来源: 互联网

标签:数据 读写 漫谈 com https Data 硬盘 随机


一 50年科技发展史

方向 公司组织 年代 代表
大型机 IBM 70年代 System z、AIX
小型机 DEC、SUN 80年代 SPARC、Solaris
廉价PC+光纤 Google 90年代 Intel、Seagate
大数据 Google 2003-2004 GFS、MapReduce、BigTable
开源 Apache 2006-2007 Hadoop、HBase
人工智能、深度学习 Google 2016 TensorFlow

“当网络变得像处理器一样快的时候,连到网络上的电脑就会变得空空如也。”
--埃里克 施密特,SUN CTO,1993

“互联网即将消失,物联网将无所不能。”
--埃里克 施密特,Google CEO,2015

背后的驱动力

网络->互联网->数据爆炸->大数据->人工智能

二 回到硬件

硬件 细节
CPU SIMD指令(Single Instruction Multiple Data)-向量化查询
GPU 矩阵运算加速-算法
内存 DDR、JVM-GC
硬盘 接口:IDE/ATA、SATA、PCLE、SCSI、SAS、FC;分类:机械硬盘、固态硬盘;机械硬盘:5600转、7200转、垂直式、叠瓦式;读写:顺序读写、随机读写;RAID;
网卡 千兆网卡、万兆网卡;交换机;网络抖动;

性能量级

标的 特点 量级-顺序读写 量级-随机读写
内存 容量小、特别贵、读写特别快、无持久化 10GB/S 10GB/S
机械硬盘HDD 容量大、寿命长、便宜、读写慢(尤其是随机读写) 100MB/S 1MB/S
固态硬盘SSD 容量中、寿命短、一般贵、读写快 100MB/s 10MB/s

性能实例

https://www.userbenchmark.com/

内存

机械硬盘

固态硬盘

常识

标的1 标的2 对比
GPU-矩阵运算 CPU-矩阵运算 10倍以上
内存-读写 硬盘-顺序读写 100倍
内存-读写 固态硬盘-随机读写 1000倍
内存-读写 机械硬盘-随机读写 10000倍
固态硬盘-顺序读写 固态硬盘-随机读写 10倍
机械硬盘-顺序读写 机械硬盘-随机读写 100倍
固态硬盘-顺序读写 机械硬盘-顺序读写 10倍以内
固态硬盘-随机读写 机械硬盘-随机读写 10倍
  • 机械硬盘随机读写瓶颈:机械臂寻址,寻址时间
  • 机械硬盘的反击:组RAID、拼数量、顺序读写

清楚这些量级差距之后,就能了解海量实时写入为什么要这样实现,例如:HBase、Kafka

三 发展历程

2016:Is Big Data Still a Thing? (The 2016 Big Data Landscape)
https://mattturck.com/big-data-landscape/

2017:Firing on All Cylinders: The 2017 Big Data Landscape
https://mattturck.com/bigdata2017/

2018:Great Power, Great Responsibility: The 2018 Big Data & AI Landscape
https://mattturck.com/bigdata2018/

2019:A Turbulent Year: The 2019 Data & AI Landscape
https://mattturck.com/data2019/

2020:Resilience and Vibrancy: The 2020 Data & AI Landscape
https://mattturck.com/data2020/

2021: Red Hot: The 2021 Machine Learning, AI and Data (MAD) Landscape
https://mattturck.com/data2021/

标签:数据,读写,漫谈,com,https,Data,硬盘,随机
来源: https://www.cnblogs.com/barneywill/p/16330009.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有