高级智驾大数据工程师_XC
核心职责
智驾数据平台架构与开发
负责智驾大数据平台架构设计、开发和优化,支撑PB级数据存储与计算
构建高可靠、高性能的数据处理流水线,支持自动驾驶算法训练和验证
设计并实现智驾数据湖分层模型,将各种来源的数据抽象为标准化数据表
数据处理与计算
负责单表TB级别以上的大规模数据分布式计算和特征工程
开发和维护离线计算(Spark)和实时计算(Flink)任务
优化数据处理性能,降低计算成本,提升数据处理效率
数据体系建设
设计并搭建智驾领域特有的标签(tag)计算框架体系
建立数据质量监控和治理体系,确保数据准确性和一致性
实现数据血缘追踪、元数据管理和数据版本控制
Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance to improve quality of life all across the globe. Welcome to Bosch.
行业经验
必须具有智驾(智能辅助驾驶)行业相关工作经验
熟悉智能辅助驾驶数据特点,包括感知、预测、规划、控制等模块数据
理解智驾领域动静态元素, 轨迹,特征等含义,有能力抽象为数据模型
技术栈要求
精通大数据相关生态系统(Hadoop, HDFS, YARN, Ray, Iceberg等)
精通大数据计算框架:Spark、Flink等离线和实时计算框架, 能独立完成单个复杂任务的设计,开发,测试和部署
熟练掌握消息中间件:Kafka、RocketMQ,Pulsar等
熟练编程语言:Scala、Python
熟悉数据湖技术(Iceberg/Hudi/Delta Lake至少一种), 熟悉常见OLAP数据库, 如Doris, Clickhouse, Greeplum等
以上技术栈都需要有实际生产应用经验
项目经验要求
有单表TB级别以上数据进行聚合计算的实战经验
具备PB级别数据管理和治理经验
有从0到1构建数据标签(tag)计算框架的经验
有智驾数据湖各层(ODS/DWD/DWS/ADS)表设计经验
加分项
熟悉自动驾驶数据格式:Rosbag、Mcap, HDF5等
了解并处理过各种2D/3D标注、场景标注、事件标注数据
有云原生大数据平台(K8s + 大数据组件)经验
有高精地图数据、传感器数据(激光雷达、摄像头、毫米波雷达)处理经验
熟练使用 Copilot 或其他 AI 开发工具,能够通过高质量 Prompt 引导 AI 辅助开发,并对结果进行严格验证
具备很强的工程质量意识,擅长 Code Review,有良好的单元测试和交付习惯
对复杂系统开发中的边界条件、稳定性风险和可维护性问题有较强判断力