Big Data Analytics 简明教程
Big Data Analytics - Characteristics
大数据是指大到可以分析以揭示模式、趋势和关联的数据集,特别是与人类行为和交互相关的数据集。
Big Data Characteristics
大数据的特征通常用“五个 V”来总结,这些特征包括:
Volume
顾名思义,量指每秒使用 IoT 设备、社交媒体、视频、金融交易和客户日志生成和存储的庞大数据。从设备或不同来源生成的数据可能是数 terabyte 到 petabyte,甚至更多。管理如此海量的数据需要强大的存储解决方案和先进的数据处理技术。Hadoop 框架用于存储、访问和处理大数据。
Facebook 每天生成 4 petabyte 的数据,即一百万千兆字节。所有这些数据都存储在所谓的 Hive 中,包含约 300 petabyte 的数据 [1]。
Fig :每天在社交应用上花费的分钟数(图片源:Recode)
Fig :印度主要社交媒体应用的用户参与度(图片源:www.statista.com)[2]
从上面的图表中,我们可以预测用户如何花时间访问不同的频道和转换数据,因此数据量正在日益增大。