【存储基础】数据存储基础知识

article/2025/6/25 17:30:33

文章目录

  • 1. 概述:数据存储基础知识
  • 2. 存储物理介质
  • 3. 数据存储的分类
    • 3.1按存储架构分类
      • DAS 直连存储
      • SAN 存储区域网络
      • NAS 网络附加存储
      • 分布式存储
      • 四种架构之间的核心区别
    • 3.2 按数据模型分类
      • 块存储
      • 文件存储
      • 对象存储
  • 4. 数据存储的关键技术方案和核心机制
    • 冗余与容错
    • 数据保护与恢复
    • 缓存
    • 数据一致性模型
    • 数据压缩与数据去重
  • 参考内容

1. 概述:数据存储基础知识

数存的基础知识可以从以下几个方面出发去了解:

  1. 物理介质特性——数据真正存放的地方
  2. 存储架构——如DAS、SAN、NAS、分布式架构等
  3. 数据模型——数据的组织方式,如块、文件、对象等
  4. 数据存储的关键技术方案与核心机制

2. 存储物理介质

  • 机械硬盘 HDD
    • 原理:磁盘+机械臂读写
    • 特点:容量大、成本低、速度慢、怕震动
    • 场景:冷数据备份,归档存储等
  • 固态硬盘 SSD
    • 原理:基于NAND闪存芯片,无机械部件
    • 特点:速度快、抗震、功耗低;成本较高,写入寿命有限(需磨损均衡)
    • 类型:SATA SSD(兼容传统接口);NVMe SSD(PCIe通道,性能提升3~5倍)
    • 场景:数据库、操作系统、高频读写业务
  • 存储级内存 SCM
    • 特点:性能接近内存(纳秒级延迟),兼具持久化能力;
    • 场景:超低延迟缓存、金融高频交易等场景

3. 数据存储的分类

3.1按存储架构分类

按存储架构分类可分为:DAS、NAS、SAN、分布式存储

DAS 直连存储

DAS:Direct Attached Storage,存储设备(如硬盘)直接连接到单个服务器(通过SATA、SAS、NVMe等接口),存储资源无法共享,仅限连接的服务器访问。

  • 优点:简单、成本低,性能直接;
  • 缺点:存储资源无法在服务器之间共享,扩展性差;
  • 场景:如个人电脑的硬盘、本地服务器内置硬盘/SSD

SAN 存储区域网络

SAN:Storage Area Network,是一种用于在计算机系统和存储设备之间、或在多个存储设备之间传输数据的网络,能提供块级存储访问的高速专用网络(通常使用光纤通道FC或iSCSI)

  • 特点:通过高速专用网络连接服务器和存储,服务器看到的是一块“虚拟磁盘”,由SAN设备提供;高性能、高可靠性、支持快照、克隆、远程复制等高级功能;但成本高,配置管理复杂。
  • 场景:大型企业数据库、虚拟机集群的后端存储。

在这里插入图片描述

NAS 网络附加存储

NAS : Network Attached Storage,是一种连接到网络的存储设备,与该网络共享自己的存储,并用作文件服务器进行文件访问。

  • 特点:易于设置和管理,支持多客户端共享文件;但性能受网络影响;
  • 场景:企业级文件服务器
    在这里插入图片描述

三者之间的关系和区别:

分布式存储

分布式存储:数据分散存储在多个节点(服务器)上,通过网络协作提供服务。其核心目标是解决单点瓶颈,实现横向扩展性、高可用性、高容错性

  • 关键技术有:数据分片(shard)、复制、多协议互通、分布式元数据管理等。
  • 类型:
    • 分布式文件系统:如HDFS
    • 分布式对象存储:如Amazon S3, OpenStack Swift
    • 分布式块存储:如 iSCSI over Distributed Storage
    • 分布式数据库
  • 特点:扩展性强、容错性高、无单点故障;但系统复杂度高、维护难度大、网络依赖性强。

四种架构之间的核心区别

对比维度DASSANNAS分布式存储
连接方式直连(SATA/SAS)专用网络(FC/iSCSI)标准以太网(TCP/IP)以太网/Infiniband
共享性单服务器独占多服务器共享块设备多客户端共享文件全局共享
数据粒度块级块级文件级块/文件/对象
协议SCSIFC, iSCSI, FCoENFS,CIFSS3,HDFS
扩展性差,单机限制中,受SAN交换机端口限制中,受NAS网关性能限制高,横向线性扩展
延迟低(直连)极低(微秒级,FC网络)中(毫秒级,受网络影响)中高(依赖元数据查询)
成本高(专用硬件)中高(软件+服务器)
适用场景单机应用高性能数据库、虚拟化企业级文件共享云平台、大数据、海量非结构化

打个比方,比较这四种架构之间的联系和区别:

  • DAS:私人仓库,仅供自己使用;
  • SAN:共享货架,支持多人存取裸箱子;
  • NAS:共享文件柜,支持多人直接存取文件;
  • 分布式存储:智能云仓库,支持自动调度货物到最近网点

3.2 按数据模型分类

按照数据模型分类,可分为块存储、文件存储、对象存储

块存储

块存储存储结构化数据,通过读写存储空间中的一个或多个地址直接读写数据;直接访问裸盘,没有文件系统。

  • 结构:裸盘,无文件系统;
  • 协议:iSCSI、Fibre Channel(FC);
  • 场景:数据库裸设备、虚拟化磁盘等

在这里插入图片描述

文件存储

文件存储主要用于存储非结构化数据,通过在块存储设备上添加专业文件系统,实现文件共享。

  • 结构:树状目录(文件夹/文件)
  • 协议:NFS、SMB、FTP等
  • 场景:Windows文件共享、NAS设备、HDFS(分布式文件系统)等

在这里插入图片描述

对象存储

对象存储与块存储和文件存储的主要区别在于对象存储提供的接口;对象存储仅为存储数据的元数据生成一个ID,并存储该ID,而不管数据类型如何。

  • 结构:扁平化结构,数据以对象形式存储(含ID、数据、元数据);
  • 协议:HTTP、RESTful、S3等
  • 特点:无线扩展,适合非结构化数据;
  • 场景:Amazon S3等,适用于对性能要求不高但对容量要求较高的场景。

在这里插入图片描述

4. 数据存储的关键技术方案和核心机制

冗余与容错

  • RAID :将多个物理磁盘组合成一个逻辑单元,提供性能提升和数据冗余;
  • 复制 Replication(多副本):在分布式系统中,将同一份数据(分片/对象)的多个副本存储在不同节点,提高可用性和容错能力。

数据保护与恢复

  • 备份 Backup:将数据复制到另一个独立的存储介质/位置,用于灾难恢复;
  • 快照 Snapshot:在特定时间点创建数据集的只读副本,速度快(通常是指针引用),用于快速回复或克隆。
  • 复制/容灾(Replication/DR):将数据实时或近实时地复制到异地站点,保证业务连续性。

缓存

将频繁访问的数据副本存储在更快的介质(如内存、SSD)中,提升访问速度。
常见位置:CPU Cache;操作系统Page Cache;数据库缓存;应用缓存。

数据一致性模型

数据一致性:在分布式系统或并发访问下,客户端何时能看到最新的数据写入。

  • 强一致性:任何读取都能看到最新写入的结果,实现复杂且可能影响性能;
  • 最终一致性:若不再有新的写入,经过一段时间后,所有副本最终会达到一致状态

数据压缩与数据去重

  • 数据压缩 Compression :减少数据占用的物理存储空间;
  • 数据去重:识别并消除存储系统中重复的数据块,常用于备份系统和对象存储。

参考内容

  • 架构师之路 - 存储架构-阿里云开发者社区
  • 存储系列之 DAS、SAN、NAS三种常见架构概述 - orange-C - 博客园
  • 一文读懂三种存储技术DAS,SAN和NAS的区别 - 知乎

http://www.hkcw.cn/article/HwUFFAZwOx.shtml

相关文章

【Part 3 Unity VR眼镜端播放器开发与优化】第二节|VR眼镜端的开发适配与交互设计

文章目录 《VR 360全景视频开发》专栏Part 3|Unity VR眼镜端播放器开发与优化第一节|基于Unity的360全景视频播放实现方案第二节|VR眼镜端的开发适配与交互设计一、Unity XR开发环境与设备适配1.1 启用XR Plugin Management1.2 配置OpenXR与平…

小米YU7还有5款颜色即将发布 更多色彩敬请期待

6月1日,小米在5月22日的发布会上公布了YU7的四款颜色:钛金属色、宝石绿、熔岩橙和寒武岩灰。官方透露,除了这四款已发布的颜色外,还有五款新颜色即将推出,每一种都设计得非常经典。回顾之前的小米SU7,在刚推出时就提供了9种颜色选择,涵盖了跑车色系、时尚色系、豪华色系…

老人被甩客执法人员送其回家 温情护送获赠枇杷

日前,重庆交通执法总队轨道交通支队三大队在重庆西站巡查时发现一名老人误乘“黑车”。考虑到她年近九旬行动不便,执法人员开车将其安全护送回家。老人感激地拿出自己种的枇杷送给执法人员以示感谢。5月27日上午,执法人员在巡查过程中发现一辆渝A籍车辆正在下客,随即上前检…

2025最新 MacBook Pro苹果电脑M系列芯片安装zsh教程方法大全

2025最新 MacBook Pro苹果电脑M系列芯片安装zsh教程方法大全 本文面向对 macOS 环境和终端操作尚不熟悉的“小白”用户。我们将从最基础的概念讲起,结合实际操作步骤,帮助你在 2025 年最新 MacBook Pro(搭载苹果 M 系列芯片)的环境…

女子多次上门骚扰邻居 持刀砍门引发恐慌

近日,辽宁大连有网友发布视频称,疑似患有精神疾病的邻居多次持刀上门砍其家门。当事人刘女士向媒体透露,楼下60多岁的邻居自去年10月搬家入住后,就反复上门找事,声称刘女士一家是脑控组织,想要入侵她的大脑。刘女士表示自己是外地人,去年刚搬进来,为方便孩子上学才购买…

遥控器竟牵出10亿元大案 数据篡改揭秘

涉及河南、四川、浙江等16省市,涉案交易金额达10.3亿元的合同诈骗案成功告破。内蒙古自治区鄂尔多斯市杭锦旗警方通过流量计调节流量和篡改数据的方式,将27名犯罪嫌疑人全部抓获。2024年3月,一封匿名举报信揭露了某石油工程有限公司通过更改流量计数据窃取国家能源的行为。杭…

弗朗西斯卡说樊振东加盟像做梦一样 莫大荣耀与期待

6月2日,据外媒报道,队长弗朗西斯卡在接受采访时谈到夺冠以及樊振东加盟表示:“感觉像做梦一样,樊振东加盟是我们莫大的荣耀。”决赛周末俱乐部宣布了轰动消息,奥运冠军兼前世界冠军樊振东将代表球队出战全部三项赛事。对于下赛季谁能击败他们的问题,弗朗西斯卡表示这取决…

董宇辉在陕西汉江赛龙舟夺冠 体验传统民俗乐趣

5月31日,陕西安康第25届汉江龙舟节开幕。当日,龙舟方阵展演,龙舟横渡汉江,抢鸭子、摸鲤鱼等传统环节亮相开幕式,节日氛围浓厚。今年有27支队伍600多名选手参加龙舟竞渡比赛。董宇辉现身安康龙舟文化园,与现场市民、游客热情互动,齐喊端午安康。他和团队成员在汉江边进行…

租客退房现垃圾场 下水道都堵了 屋内堆满垃圾几乎无处下脚

山东潍坊一名租客租住半年退房时,房东发现屋内堆满生活垃圾。发布视频的当地民宿工作人员称租客是一名年轻女生,房东已报警。辖区派出所表示正在处理此事。5月31日,抖音实名认证的潍坊潍城区怀夏民宿发布了一段54秒的现场视频,显示屋内一片狼藉,堆满了生活垃圾,几乎无处下…

上迪情侣和一家三口扭打 拍照冲突引发热议

5月31日,有网友发布视频称,在上海迪士尼乐园内一对情侣与一家三口发生冲突并扭打在一起,此事引发广泛关注。视频中可以看到双方在现场互相推搡,周围游客纷纷上前劝阻。据权威人士透露,事件发生在5月31日,地点并非排队区域,而是游客自由拍照的点位。情侣和一家三口因拍照…

北京大兴警方严查炸街摩托 夜查行动见效

大兴公安分局针对南海子公园南环路牡丹园南广场区域夜间改装摩托车聚集扰民问题,开展了专项整治行动。这些非法改装的摩托车不仅存在安全隐患,其巨大的噪音也严重干扰了周边居民的生活。5月30日晚,大兴交通支队旧宫中队在“炸街车”夜间活动高发时段,科学部署警力,采取定点…

AI矢量软件|Illustrator 2025网盘下载与安装教程指南

说起AI,很多人第一印象可能是AI人工智能,是与Python相关。实际上,本文要讲的AI,是Adobe Illustrator的缩写,它是一款基于矢量的图形制作软件,主要应用于插画、包装、印刷出版、书籍排版、动画和网页制作等领…

【Spring】RAG 知识库基础

1. RAG 基础概念 1.1 什么是 RAG? RAG(Retrieval-Augmented Generation,检索增强生成)是一种将检索技术与人工智能生成技术相结合的混合架构,用于解决大模型时效性限制与幻觉问题 你可以这样理解:RAG 技…

NLP学习路线图(十七):主题模型(LDA)

在浩瀚的文本海洋中航行,人类大脑天然具备发现主题的能力——翻阅几份报纸,我们迅速辨别出"政治"、"体育"、"科技"等板块;浏览社交媒体,我们下意识区分出美食分享、旅行见闻或科技测评。但机器如何…

信息安全管理与评估山东卷无线部分答案

配置解析 配置解析 配置解析 radio 1工作在2.4g频段下 radio 2工作在5.0g频段下 配置解析 station-isolation配置关联在同一个VAP下的用户无法互通,但是可以和其他VAP下关联的用户互通,这里的隔离功能类似于交换的端口隔离功能。 arp-suppression开启该功能后则自动使能ARP…

Netty学习example示例

文章目录 simpleServer端NettyServerNettyServerHandler Client端NettyClientNettyClientHandler tcp(粘包和拆包)Server端NettyTcpServerNettyTcpServerHandler Client端NettyTcpClientNettyTcpClientHandler protocolcodecCustomMessageDecoderCustomM…

Linux系统精准定位创建句柄的进程

在Linux系统中,可以通过以下方法精准定位创建句柄的进程: 🔍 一、核心排查命令 ​​lsof 命令​​ ​​查看所有进程的句柄占用​​: lsof | awk {print $1, $2} | sort | uniq -c | sort -nr | head -n 20 ​​输出说明​​&…

ASP.NET Core OData 实践——Lesson8增删改查单值类型Property(C#)

大纲 支持的接口主要模型设计控制器设计数据源查询(GET)查询基类类型Entity的基础类型属性的值查询派生类型Entity的基础类型属性值查询基类类型Entity的派生类型属性值查询派生类型Entity的派生类型属性值 完整更新(PUT)完整更新基类类型Entity的基础类型属性值完整更新派生类…

(LeetCode 每日一题)135. 分发糖果 ( 贪心 )

题目:135. 分发糖果 思路:贪心两遍循环,时间复杂度0(n)。 在满足所有人都有一个糖果的情况下,进行两遍循环 第一遍循环:从左到右,满足当ratings[i]>ratings[i-1]时,v[i]v[i-1]1 第二遍循环&a…

DAX权威指南6:DAX 高级概念(扩展表)、DAX 计算常见优化

文章目录 十四、 DAX 高级概念14.1 扩展表14.1.1 扩展表的定义14.1.2 表扩展与双向过滤14.1.3 筛选上下文传播14.1.4 RELATED 和 LOOKUPVALUE14.1.5 扩展表结构在表定义时就已经确定 14.2 表筛选和列筛选14.2.1 表筛选和列筛选14.2.1.1 DAX筛选机制 14.2.2 ALL函数的真实含义14…