Big Data Analytics 简明教程
Big Data Adoption and Planning Considerations
采用大数据会带来其自身的一系列挑战和考虑因素,但通过仔细规划,组织可以最大化其好处。大数据举措应该具有战略性和业务导向。大数据的采用可以促进这种变革。大数据的利用可以具有变革性,但它通常具有创新性。变革活动通常风险较低,旨在提高效率和效力。
大数据的本质及其分析能力包含一些问题和挑战,需要在开始之前进行规划。例如,采用新技术的做法会引发有关是否符合现有公司标准的关注,需要解决这个问题。跟踪数据集从采购到利用来源相关的问题通常是组织的新需求。必须规划管理数据被处理或分析过程揭示了其身份的成分的隐私。
所有上述因素都要求组织识别并实施一系列独特的治理流程和决策框架,以确保所涉及的所有方都理解大数据的性质、后果以及管理要求。随着大数据的采用,进行业务分析的方法正在发生改变。大数据分析生命周期是一种有效的解决方案。实施大数据时需要考虑不同的因素。
下面的图片描述了大数据的采用和计划注意事项
Big Data Adoption and Planning Considerations
主要潜在大数据采用和计划注意事项如下 −
Organization Prerequisites
大数据框架不是交钥匙解决方案。企业需要数据管理和大数据治理框架,才能使数据分析和分析发挥效用。需要有效的流程来实施、定制、填充和利用大数据解决方案。
Data Procurement
由于有开源平台和工具以及利用商品硬件的潜力,大数据解决方案的获取可能具有成本效益。获取外部数据仍可能需要大量的预算。必须购买大多数商业相关数据,这可能需要持续的订阅费用,以确保向获取的数据集提供更新。
Data Privacy and Security
对数据集进行分析可能会揭示关于组织或个人的机密数据。分析不同的数据集包括良性数据,而这些数据在对数据集进行集体审查时可能会揭示个人信息。解决这些隐私问题需要了解收集到的数据的性质以及相关数据隐私规则和特定数据标记和匿名化程序。随着时间的推移积累的诸如汽车 GPS 记录或智能电表数据读取等遥测数据可能会暴露个人的位置和行为。
安全性 使用身份验证和授权机制确保数据网络和存储库的安全性是大数据安全保护中的一个必不可少的元素。
Limited Realtime Support
需要流式传输数据和警报的仪表盘和其他应用程序通常需要实时或准实时数据传输。不同的开源大数据解决方案和工具是面向批处理的;然而,实时开源技术的新阶段支持流式数据处理。