Big Data Analytics 简明教程

Big Data Adoption and Planning Considerations

采用大数据会带来其自身的一系列挑战和考虑因素,但通过仔细规划,组织可以最大化其好处。大数据举措应该具有战略性和业务导向。大数据的采用可以促进这种变革。大数据的利用可以具有变革性,但它通常具有创新性。变革活动通常风险较低,旨在提高效率和效力。

大数据的本质及其分析能力包含一些问题和挑战,需要在开始之前进行规划。例如,采用新技术的做法会引发有关是否符合现有公司标准的关注,需要解决这个问题。跟踪数据集从采购到利用来源相关的问题通常是组织的新需求。必须规划管理数据被处理或分析过程揭示了其身份的成分的隐私。

所有上述因素都要求组织识别并实施一系列独特的治理流程和决策框架,以确保所涉及的所有方都理解大数据的性质、后果以及管理要求。随着大数据的采用,进行业务分析的方法正在发生改变。大数据分析生命周期是一种有效的解决方案。实施大数据时需要考虑不同的因素。

下面的图片描述了大数据的采用和计划注意事项

big data adoption and planning considerations

Big Data Adoption and Planning Considerations

主要潜在大数据采用和计划注意事项如下 −

Organization Prerequisites

大数据框架不是交钥匙解决方案。企业需要数据管理和大数据治理框架,才能使数据分析和分析发挥效用。需要有效的流程来实施、定制、填充和利用大数据解决方案。

Define Objectives

概述实施大数据的目标和目的。无论是提高客户体验、优化流程还是改善决策制订,明确的目标始终会为决策者制定战略指明积极的方向。

Data Procurement

由于有开源平台和工具以及利用商品硬件的潜力,大数据解决方案的获取可能具有成本效益。获取外部数据仍可能需要大量的预算。必须购买大多数商业相关数据,这可能需要持续的订阅费用,以确保向获取的数据集提供更新。

Infrastructure

评估当前的基础设施,看看它是否可以处理大数据的处理和分析。考虑是否需要投资新的硬件、软件或基于云的解决方案,以管理数据的量、速度和多样性。

Data Strategy

制定一个与业务目标相一致的全面数据战略。这包括确定需要哪些类型的数据、在哪里获取它们、如何存储和管理它们以及如何确保其质量和安全。

Data Privacy and Security

对数据集进行分析可能会揭示关于组织或个人的机密数据。分析不同的数据集包括良性数据,而这些数据在对数据集进行集体审查时可能会揭示个人信息。解决这些隐私问题需要了解收集到的数据的性质以及相关数据隐私规则和特定数据标记和匿名化程序。随着时间的推移积累的诸如汽车 GPS 记录或智能电表数据读取等遥测数据可能会暴露个人的位置和行为。

big data adoption and planning considerations1

安全性 使用身份验证和授权机制确保数据网络和存储库的安全性是大数据安全保护中的一个必不可少的元素。

big data adoption and planning considerations2

Provenance

来源是指有关数据的起源和处理的信息。来源信息用于确定数据的有效性和质量,也可用于审计。随着大数据使用不同的阶段进行收集、整合和处理,维护来源可能很困难。

Limited Realtime Support

需要流式传输数据和警报的仪表盘和其他应用程序通常需要实时或准实时数据传输。不同的开源大数据解决方案和工具是面向批处理的;然而,实时开源技术的新阶段支持流式数据处理。

Distinct Performance Challenges

对于大数据解决方案必须处理的大量数据,性能通常是一个问题。例如,海量数据集与高级搜索算法结合会导致较长的查询时间。

Distinct Governance Requirements

大数据解决方案访问并生成数据,这些数据成为企业资产。治理结构对于确保数据和解决方案环境都以受控的方式进行监管、标准化和进化至关重要。建立强有力的数据治理政策,以确保数据质量、完整性、隐私和符合 GDPR 和 CCPA 等法规。定义数据管理角色和职责,以及数据访问、使用和安全流程。

Distinct Methodology

将会有必要建立一个机制来管理流入和流出大数据系统的数据。

big data adoption and planning considerations3

它需要探索如何构建反馈回路,以便可以再次修改已处理的数据。

Continuous Improvement

大数据计划是迭代的,需要随着时间的推移不断开发。监控绩效指标,获取反馈,并微调您的策略,以确保您最大化利用您的数据投资。

通过仔细检查和规划这些因素,组织可以成功采用和利用大数据,以推动创新,提高效率并在当今数据驱动的世界中获得竞争优势。