Big Data Analytics 简明教程
Big Data Analytics - Data Scientist
数据科学家的作用通常与预测建模、开发细分算法、推荐系统、A/B 测试框架以及经常处理原始非结构化数据等任务相关。
他们工作的性质要求深入了解数学、应用统计学和编程。数据分析师和数据科学家之间有一些共同的技能,例如查询数据库的能力。两者都分析数据,但数据科学家的决策对组织的影响可能会更大。
以下是数据科学家通常需要具备的一组技能 −
-
使用统计软件包编程,例如:R、Python、SAS、SPSS 或 Julia
-
能够从不同来源清理、提取和探索数据
-
统计模型的研究、设计和实施
-
深入的统计学、数学和计算机科学知识
在数据大分析中,人们通常混淆数据科学家和数据架构师的角色。事实上,两者的差别非常简单。数据架构师定义工具和数据存储体系结构,而数据科学家使用这种体系结构。当然,数据科学家应该能够在特别项目需要时建立新工具,但基础设施定义和设计不应该是其工作的一部分。