数据挖掘工程师的主要职责表述
数据挖掘工程师的主要职责表述
数据挖掘工程师需要整理行业案例,深入研究分析市场需求趋势、行业知识及发展方向,并进行行业案例与解决方案的包装和推广。下面是学习啦小编为您精心整理的数据挖掘工程师的主要职责表述。
数据挖掘工程师的主要职责表述1
职责:
1、负责海量科技数据(含文本数据)的挖掘工作;
2、负责科技数据挖掘算法模型的构建、应用、评测、报告;
3、主持或参与海量科技数据的入库工作,科技数据知识图谱的构建;
4、负责或参与数据挖掘成果论文、专利、标准的撰写;
5、负责或参与制定数据加工清洗的方案,并形成操作手册;
6、为指定的课题提出解决方案,并主持或参与方案实施;
7、完成安排的各项工作,与其他部门合作。
岗位要求:
1、数学、统计、金融、科技管理、计算机等相关专业,博士学历优先;
2、具有2年及以上海量数据挖掘经验,有文本挖掘、非结构化文本处理经验者优先;
3、精通Matlab/Python/R/Scala之一,熟悉Java/C/C++等编程语言,熟练掌握Linux各项操作指令;
4、熟练掌握Hadoop/Spark/Storm/Kafka中的一项或几项,有MPI经验者尚佳;
5、掌握机器学习的基本算法框架,有自然语言处理和丰富的特征工程(特征选择/特征抽取)经验者优先;
6、掌握关系型数据库的基本操作,有图形数据库、其他非关系型数据库经验者尚佳;
7、在医疗信息化从事产品开发工作者优先,有顶会paper或人工智能领域国际比赛中获奖者优先;
8、有比较强的组织协调能力,可同时处理好多个任务,具备一定的管理能力;
9、性格开朗,具有团队精神;较强的沟通能力,能与相关业务和开发人员讨论并快速理解需求。
数据挖掘工程师的主要职责表述2
职责:
对业务数据进行采集、清洗、整理、标签、分层;
根据业务需求,应用统计学、数据挖掘等建立精准数据模型,满足业务需求;
能从业务和产品角度出发,利用数据来发现产品或业务的瓶颈,提出优化方案;
探索业界和学术界前言的数据挖掘、机器学习理论与实践。
任职资格:
本科及以上学历,数学、统计学、计算机专业优先;
精通数据挖掘脚本语言,能灵活运用R、Python中的一种,熟练sklean/numpy/pandas等科学计算相关库,有统计建模、机器学习或数据挖掘应用的项目经验优先;
对大数据技术有深入了解,能够使用Hadoop、spark等相关技术;
勤奋踏实,乐于学习新事物,有良好团队合作精神和高度的责任感;
医疗、生物背景人员优先。
数据挖掘工程师的主要职责表述3
职责:
1.负责大数据项目需求调研及分析、模型设计工作。
2.负责规划数据挖掘的整体流程,并参与用户产品和数据产品的决策。
3.与业务部门密切配合,寻求数据层面的业务价值,利用数据分析结论推动产品优化。
4.带领团队对于产品数据进行分析,指导工程师完成数据挖掘相关的算法、应用的设计与开发。
5.技术团队的管理,制定开发规范,撰写相关技术文档指导和培训工程师。
任职要求:
1.计算机、数学、统计等相关专业本科以及以上学历;两年及以上工作经验。
2.具备良好的数据结构和算法基础。
3.熟练掌握数据挖掘算法模块关联分析、聚类分析、分类分析、回归分析里的经典算法。
4.熟悉深度学习里的经典神经网络,包括并不限于MLP/CNN/RNN。
5.熟悉Python, Java等常用编程语言。
6.熟悉分布式数据处理系统的开发,Hadoop/Spark/Hive等。
7.全面了解机器学习应用于实际问题的完整流程,有相关实际项目经验。
数据挖掘工程师的主要职责表述4
职责:
1、负责大数据平台数据仓库建设、数据分析挖掘工作;
2、负责大数据的处理、整合及数据建模,协同业务开发人员,将模型算法成果应用到实际业务系统中,并通过可视化工具进行分析成果展示;
3、基于用户数据,研究用户行为,构建用户画像。
任职要求:
1、应用数学、计算机、信息处理等相关专业本科及以上学历;
2、3年以上大数据开发经验;
3、熟悉hadoop的大数据生态,精通SQL语法【有较好的SQL性能调优能力,掌握基于Hive或者Spark sql的HQL脚本编写;
4、具有从数据查询,聚合,分析到可视化的整套实践经验;
5、熟练使用java或者python、基础扎实、能编写Hive环境下或者Spark sql环境下的UDF;
6、具备良好的表达和沟通能力、学习能力,具备极强的团队合作精神,能够承受一定的工作压力。
数据挖掘工程师的主要职责表述5
职责:
1. 从事精准医疗领域的大数据管理分析、BI数据挖掘;
2. 熟练使用脚本工具访问数据库,并完成相应的脚本分析,以图形界面的方式呈现;
3. 熟练使用统计或者机器学习算法,对结构化数据进行统计分析,包括分类和聚类,并进行预测建模等;
4. 与相关项目开发组沟通,明确其需求并给予数据分析统计结果等支持。
任职要求:
1、应用数学,计算机,生物等相关专业硕士以上学历;
2、有生命科学、基因、医药等生物科技行业2年以上工作经验;
3、熟练运用各种常用算法和数据结构,熟悉常用的机器学习算法,了解各种算法的优缺点和局限性;
4、熟悉R、Python 等数据分析平台及工具,有搭建hadoop、spark或类似平台从业经验;
5、 熟悉主流数据库Oracle、MySQL对 NoSql 有一定了解及应用经验;
6、 有团队精神,能够承担责任和压力。
相关文章: