求职者,请将简历发送至 resumes@btsjrjx.com
必备:
- 10年以上数据工程/数据科学开发和实施经验 毫升模型 在大数据生态系统中.e. Hadoop、Spark、HBase、Hive / Impala或其他类似的分布式计算技术
- 熟练(专家级)使用Python和PySpark以及机器学习的基本库,如scikit-learn, 熊猫
- 熟练使用DataIku或类似工具(Alteryx), 砖, MatLab, Knime, AWS机器学习, Azure机器学习, Datarobot)
- 熟练使用复杂和优化的SQL和/或上述技术进行数据分析
分:
- 云体验,包括砖、Snowflake、Azure或AWS
- 团队最终将过渡到带有砖、Azure、Snowflake的云环境
- 金融服务经验
- 有直接与业务团队合作收集需求以构建机器学习算法的经验
- 了解数据结构,数据建模和软件架构
- 建筑经验, 为实际用例设计和实现数据密集型应用程序
职责包括:
- 大数据生态系统中ML模型的开发与实现.e. Hadoop、Spark、HBase、Hive / Impala或其他类似的分布式计算技术
- 使用高级Python/PySpark和用于机器学习的基本库(如scikit-learn)诊断和修复数据管道问题, 熊猫
- 使用复杂和优化的SQL查询进行数据分析