Big Data Analytics 简明教程

Big Data Analytics - Data Scientist

数据科学家的作用通常与预测建模、开发细分算法、推荐系统、A/B 测试框架以及经常处理原始非结构化数据等任务相关。

他们工作的性质要求深入了解数学、应用统计学和编程。数据分析师和数据科学家之间有一些共同的技能,例如查询数据库的能力。两者都分析数据,但数据科学家的决策对组织的影响可能会更大。

以下是数据科学家通常需要具备的一组技能 −

  1. 使用统计软件包编程,例如:R、Python、SAS、SPSS 或 Julia

  2. 能够从不同来源清理、提取和探索数据

  3. 统计模型的研究、设计和实施

  4. 深入的统计学、数学和计算机科学知识

在数据大分析中,人们通常混淆数据科学家和数据架构师的角色。事实上,两者的差别非常简单。数据架构师定义工具和数据存储体系结构,而数据科学家使用这种体系结构。当然,数据科学家应该能够在特别项目需要时建立新工具,但基础设施定义和设计不应该是其工作的一部分。