大数据架构师的职责
大数据架构师的职责
大数据架构师负责大数据仓库、数据集市的规划及实现,负责大数据中台的设计和核心开发工作。下面是学习啦小编为您精心整理的大数据架构师的职责。
大数据架构师的职责1
职责:
1、负责大数据基础平台、海量数据存储处理分布式平台、数据分析系统架构设计和研发;
2、负责实时计算平台基础架构设计、部署、监控、优化升级;
3、制定项目数据仓库设计及实现规范,指导设计研发和部署;
4、协助策略和算法团队工作,保障数据挖掘建模和工程化;
5、深入研究大数据相关技术和产品,跟进业界先进技术。
任职要求:
1、3年以上大数据系统架构经验;
2、精通Hadoop HBase Hive Spark Flink Kafka Redis技术及其生态圈;
3、具备Java Scala Python等开发经验,熟悉数据挖掘和分析的策略与算法;
4、精通数据抽取,海量数据传输,数据清洗的常用方法和工具。
5、具备良好的系统分析能力、故障诊断能力;
6、有大数据策略、算法、可视化经验优先;
7、有在华为云存储产品和大数据产品的开发使用经验优先。
大数据架构师的职责2
职责:
1、负责公司的大数据平台的数仓架构、系统架构设计;
2、负责带领团队完成舆情分析相关的挖掘方案设计;
3、负责大数据研发组团队管理;
4、负责带领团队完成舆情平台的方案文档撰写、迭代开发;
5、负责研发规范制定,研究行业前沿技术;
6、参与产品规划及设计讨论。
任职要求:
1、本科五年工作经验及以上,有至少五年的大数据技术实践经验,有NLP或AI相关经验;
2、有很强的架构设计能力和良好的表达能力;
3、有一定的项目管理及团队管理能力;
4、精通Hadoop、Spark生态圈中的常用组件原理及应用;
6、理解媒体业务,精通数据仓库的规划和设计;
5、精通掌握Java或Python编程,有性能调优能力;
4、熟悉NLP算法原理及应用;
6、对新生事物或者新技术有浓厚兴趣,学习能力强。
大数据架构师的职责3
职责
1、参与打造数据中内容的规划、设计、开发和优化工作,实现高质量数据的互通与共享;
2、参与数据模型体系构建及数据主题设计和开发,搭建离线、实时数据公共层;
3、参与数据产品与应用的数据研发,发掘数据商业价值,打造极致体验的数据产品;
4、深入理解数据产品的使用场景,为业务方在可用性、成本上做更好的设计做参考;
5、团队成员的搭建与培养,任务划分,进度监控,代码规范,质量保证。
任职要求
1、熟悉数据仓库建模理论,3年以上相关领域实践经验;
2、Hadoop、Hive、Hbase、Storm、Spark等技术框架;
3、精通Java、Python、Scala、go等开发语言中的1到2种;
4、熟练使用Python/Java/scala或其他语言进行复杂业务逻辑的数据处理工作,具备海量数据处理以及性能优化的能力;
5、对MySQL、Redis、HBase等数据库有一定的了解和使用经验;
6、对olap,多维分析及kylin熟悉的更好;
7、思路清晰,具备良好的沟通能力和理解能力,较强的学习能力以及快速解决问题的能力;
8、对新技术,新事物有很好的探索和求知欲;
9、熟悉常规的机器学习算法:降维(PCA、SVD)、SVM、逻辑回归(LogisticsRegression)、决策树(GBDT、RandomForest)、关联规则(Apriori、FP-Growth)、聚类(K-Means)等优先。
大数据架构师的职责4
职责
1、负责公司大数据平台的整体架构设计,包含数据收集、数据存储、数据挖掘、数据输出;
2、负责规划从数据源到数据应用的整体流程,并参与用户产品和数据产品的决策;
3、负责海量数据分析、用户行为分析,构建用户数据模型;
4、负责解决核心技术问题,对技术方案进行决策;
5、技术团队管理。
6、熟悉手机IOS、安卓系统APP开发
任职资格
1、计算机相关专业毕业,本科以上学历;
2、5年以上相关工作经验,具备软件产品架构设计经验,熟练掌握高性能、高扩展性架构设计方法;
3、熟练掌握java或c++任意一门语言、熟悉linux操作系统;
4、熟悉Hadoop/MR/Hbase/Mahout/Spark等大数据技术,并能够基于上述项目开发大数据相关应用;
5、熟悉基本数据挖掘方法和技术;
6、强烈的敬业精神,良好的沟通与协调能力,能有效组织协调团队完成各类开发工作;
7、热爱技术,相信数据的价值,对大数据有深刻的理解。
大数据架构师的职责5
职责:
1、负责规划科技大数据平台及科技数据入库自动化的方案设计;
2、负责大数据平台的开发和维护,以及对外服务接口的开发;
3、负责大数据平台的优化和改进工作。
任职要求
1、计算机相关专业本科及以上学历,5年以上开发经验,其中3年以上为互联网、大数据相关的开发经验;
2、熟知Hadoop生态圈体系,精通Hadoop/Spark/Storm/Kafka中的一项或几项,深刻理解MapReduce的运行原理和机制,有MPI经验者尚佳;
3、熟悉Elasticsearch、Redis、Hbased等相关数据库的构建和操作,尤其是数据库集群的构建和操作,熟悉Neo4j者尚佳;
4、具有机器学习相关项目经验者优先。