数据治理的演变与AI趋势

article/2025/6/29 10:27:46

 知识星球:数据书局。打算通过知识星球将这些年积累的知识分享出来,让各位在数据治理、数据分析的路上少走弯路,另外星球也方便动态更新最近的资料,提供各位一起讨论数据的小圈子

1.数据治理的演变

1.1.摘要

数据治理是指组织管理和利用数据的人员、流程和技术之间的关系,确保正确的人有正确级别的数据访问权限。数据治理是许多企业尚未重视的一个概念,但它对未来越来越重要,因为数据量、类型和来源不断增加,而且受到法规、安全和质量等方面的限制。

2.2.介绍

数据治理有不同的层次和范围,从企业级到部门级再到项目级。不同层次的数据治理需要协调一致,以实现组织的战略目标。数据治理也有不同的方法和模式,从集中式到分散式再到联邦式。不同方法和模式有各自的优缺点,需要根据组织的文化、结构和需求进行选择。

数据治理涉及多个方面,包括数据策略、政策、标准、规范、框架、角色、职责、流程、度量、工具等。这些方面需要协同工作,以提高数据质量、一致性、可信度、安全性和价值。数据治理还需要与其他相关领域进行协作,如数据管理、元数据管理、主数据管理、参考数据管理等。

随着技术和业务环境的变化,数据治理也在不断演进。一些新兴的趋势和挑战包括:

数据民主化:让更多用户能够自主获取和分析所需的数据。

数据伦理:在收集、存储和使用个人或敏感信息时遵循道德原则。

数据隐私:保护用户或客户信息免受未经授权或非法使用。

数据安全:防止外部或内部攻击者窃取或破坏组织拥有或处理的信息。

数据合规:遵守适用于特定行业或地区的法律法规。

数据云化:利用云计算平台提供更灵活和可扩展的存储和处理能力。

数据智能:利用人工智能技术提高对大规模复杂信息进行分析和决策支持。

由于数据仍然是业务决策的基础,因此每个公司现在从事数据业务。适当的数据治理策略和实践有助于确保正确处理这一关键业务资产,特别是随着技术的新进步,对隐私的新要求,消费者行为的新趋势出现了。

2.数据治理AI发展趋势

2.1.摘要

数据治理是指组织对其数据进行管理和监督的过程和实践,以确保数据的质量、安全、合规和价值。数据治理是2022年影响分析领域的主要趋势之一,因为它既能促进自助BI的普及,又能保护数据免受泄露或滥用。

2.2.介绍

自助BI是指用户可以根据自己的需求获取和分析数据,而不需要依赖IT部门或专业人员。自助BI可以提高用户的效率和满意度,同时减轻IT部门的负担。但是,自助BI也带来了一些挑战,如数据质量、一致性、可信度等问题。因此,数据治理在自助BI中起着至关重要的作用,它可以通过制定和执行数据策略、政策、标准、规范等来规范用户对数据的访问和使用。

除了支持自助BI外,数据治理还能帮助组织保护其数据资产免受内外部威胁。随着网络攻击、隐私泄露等事件的频发,组织需要加强对其敏感或机密信息的保护,并遵守相关法律法规。数据治理可以通过定义和实施数据安全、隐私、合规等方面的措施来降低风险并提高信任。

除了数据治理外,人工智能(AI)也是2022年分析领域的重要趋势之一。AI指利用计算机系统模拟人类智能行为的技术,如学习、推理、决策等。AI可以帮助组织从大量复杂多样的信息中提取有价值的洞察力,并提供更智能更快速更准确更个性化的分析解决方案。

AI在分析领域有多种应用场景和形式,如增强型智能(augmented intelligence)、机器学习(machine learning)、深度学习(deep learning)、预测分析(predictive analytics)、推荐系统(recommendation systems)等。

AI还可以与其他技术相结合,如云计算(cloud computing)、物联网(internet of things)、区块链(blockchain)等,以创造新的可能性和价值。然而,在使用AI时也需要注意一些挑战和风险,如技术成熟度、人才缺乏、伦理道德、偏见歧视、可解释性透明性等。因此,在引入AI时也需要进行相应的评估测试验证监督调整等工作,以确保AI符合组织的目标期望。


http://www.hkcw.cn/article/YJfZLgLESi.shtml

相关文章

Fullstack 面试复习笔记:操作系统 / 网络 / HTTP / 设计模式梳理

Fullstack 面试复习笔记:操作系统 / 网络 / HTTP / 设计模式梳理 面试周期就是要根据JD调整准备内容(挠头),最近会混合复习针对全栈这块的内容,目前是根据受伤的JD,优先选择一些基础的操作系统、Java、Nod…

【MIMO稳定裕度】基于数据驱动的多输入多输出系统稳定裕度分析

最近一直在忙着写论文,只能说要写一篇高水平论文确实不容易,要一直反复来回修改调整,要求比较高,所以没太有时间和精力写博客,这两天结束了初稿,又正好是假期,出来冒个泡。 本次分享的主题是&am…

Python 训练营打卡 Day 33-神经网络

简单神经网络的流程 1.数据预处理(归一化、转换成张量) 2.模型的定义 继承nn.Module类 定义每一个层 定义前向传播流程 3.定义损失函数和优化器 4.定义训练过程 5.可视化loss过程 预处理补充: 分类任务中,若标签是整…

TDengine 的 AI 应用实战——电力需求预测

作者: derekchen Demo数据集准备 我们使用公开的UTSD数据集里面的电力需求数据,作为预测算法的数据来源,基于历史数据预测未来若干小时的电力需求。数据集的采集频次为30分钟,单位与时间戳未提供。为了方便演示,按…

【03】完整开发腾讯云播放器SDK的UniApp官方UTS插件——优雅草上架插件市场-卓伊凡

【03】完整开发腾讯云播放器SDK的UniApp官方UTS插件——优雅草上架插件市场-卓伊凡 一、项目背景与转型原因 1.1 原定计划的变更 本系列教程最初规划是开发即构美颜SDK的UTS插件,但由于甲方公司内部战略调整,原项目被迫中止。考虑到: 技术…

(aaai2024) Omni-Kernel Network for Image Restoration

代码:https://github.com/c-yn/OKNet 研究动机:作者认为Transformer模型计算复杂度太高,因此提出了 omni-kernel module (OKM),可以有效的学习局部到全局的特征表示。该模块包括:全局、大分支、…

useMemo useCallback 自定义hook

useMemo & useCallback & 自定义hook useMemo 仅当依赖项发生变化的时候,才去重新计算;其他状态变化时则不去做不必要的计算。 useCallback 缓存函数。但是使用注意📢 ,useCallback没有特别明显的优化。 *合适的场景——父…

android binder(二)应用层编程实例

一、binder驱动浅析 从上图看出,binder的通讯主要涉及三个步骤。 在 Binder Server 端定义好服务,然后向 ServiceManager 注册服务在 Binder Client 中向 ServiceManager 获取到服务发起远程调用,调用 Binder Server 中定义好的服务 整个流…

GESP2024年3月认证C++二级( 第三部分编程题(2)小杨的日字矩阵)

参考程序&#xff1a; #include <iostream> using namespace std;int main() {int n;cin >> n; // 读入奇数 n// 外层循环控制每一行for (int i 0; i < n; i) {// 内层循环控制每一列for (int j 0; j < n; j) {char ch;// 如果当前列是最左或最右&#x…

BUUCTF[ACTF2020 新生赛]Exec 1题解

BUUCTF[ACTF2020 新生赛]Exec 1题解 分析解题过程总结: 分析 先分析题目&#xff1a;exc()是一个内部调用shell命令的函数&#xff0c;同样的函数还有system(), 创建靶机&#xff0c;打开网址&#xff0c;是一个和PING相关的网页&#xff0c;查看源代码&#xff0c;没有提示&a…

NX869NX874美光固态颗粒NX877NX883

NX869NX874美光固态颗粒NX877NX883 美光固态硬盘颗粒技术解析与市场展望 近年来&#xff0c;固态硬盘&#xff08;SSD&#xff09;市场呈现出蓬勃发展的态势&#xff0c;而作为核心组件的存储颗粒&#xff0c;其技术进展与市场动态自然吸引了众多关注。在众多品牌中&#xff…

CodeTop100 Day20

58、翻转字符串中的数字 class Solution {public String reverseWords(String s) {s s.trim(); int j s.length() - 1, i j;StringBuilder res new StringBuilder();while (i > 0) {while (i > 0 && s.charAt(i) ! ) i--…

重温经典算法——快速排序

版权声明 本文原创作者&#xff1a;谷哥的小弟作者博客地址&#xff1a;http://blog.csdn.net/lfdfhl 基本原理 快速排序基于分治思想&#xff0c;通过选取基准元素将数组划分为两个子数组&#xff08;小于基准和大于基准&#xff09;&#xff0c;递归排序子数组。平均时间复…

【机器学习】集成学习与梯度提升决策树

目录 一、引言 二、自举聚合与随机森林 三、集成学习器 四、提升算法 五、Python代码实现集成学习与梯度提升决策树的实验 六、总结 一、引言 在机器学习的广阔领域中,集成学习(Ensemble Learning)犹如一座闪耀的明星,它通过组合多个基本学习器的力量,创造出…

Python量化交易:K线形态识别与技术分析可视化

引言 在量化交易领域&#xff0c;K线形态识别是一种重要的技术分析方法&#xff0c;可以帮助投资者预测市场趋势并制定交易策略。本文将介绍如何使用Python实现K线形态的自动识别与可视化分析&#xff0c;无需依赖复杂的第三方库如TA-Lib&#xff0c;完全使用纯Python实现。通…

前端自动化测试利器:Playwright 全面介绍

目录 &#x1f9ea; 前端自动化测试利器&#xff1a;Playwright 全面介绍 ✨ 为什么选择 Playwright&#xff1f; 1. 跨浏览器支持 2. 多语言支持 3. 自动等待机制 4. 强大的页面交互能力 &#x1f527; Playwright 快速上手 &#x1f4f8; 更强的调试体验 &#x1f9…

华为云Flexus+DeepSeek征文|华为云 Dify 打造智慧水果分析助手,实现“知识库 + 大模型”精准赋能

前言 本文聚焦基于华为云平台部署的智慧水果分析助手 AI Agent&#xff0c;通过 Dify 平台集成 Embedding、Rerank 及 DeepSeek 模型&#xff0c;构建工作流&#xff0c;实现提问内容驱动的 “知识库 大模型” 与 “联网搜索 大模型” 智能切换。 ECS控制台&#xff1a;https…

【算法设计与分析】实验——改写二分搜索算法,众数问题(算法分析:主要算法思路),有重复元素的排列问题,整数因子分解问题(算法实现:过程,分析,小结)

说明&#xff1a;博主是大学生&#xff0c;有一门课是算法设计与分析&#xff0c;这是博主记录课程实验报告的内容&#xff0c;题目是老师给的&#xff0c;其他内容和代码均为原创&#xff0c;可以参考学习&#xff0c;转载和搬运需评论吱声并注明出处哦。 要求&#xff1a;2.…

MCP协议学习

MCP协议出现的背景 MCP&#xff08;Model Context Protocol&#xff0c;模型上下文协议&#xff09;由Anthropic公司于2024年11月推出&#xff0c;旨在解决大语言模型&#xff08;LLM&#xff09;与外部数据源、工具和服务之间的标准化交互问题。例如某金融科技公司需开发一款…

【笔记】Windows 部署 Suna 开源项目完整流程记录

#工作记录 因篇幅有限&#xff0c;所有涉及处理步骤的详细处理办法请参考文末资料。 Microsoft Windows [Version 10.0.27868.1000] (c) Microsoft Corporation. All rights reserved.(suna-py3.12) F:\PythonProjects\suna>python setup.py --admin███████╗██╗…