大模型算法
150-200元/天
更新 2025-12-16 18:57:59
浏览 388
职位详情
算法工程师
经验不限
发表算法相关优秀论文 · 混元 · 机器学习 · 深度学习 · 大模型算法 · 自然语言处理算法 · 大数据处理框架(Spark/Hadoop/Hive) · 参加算法相关竞赛/获奖 · 日常实习生 · Python
岗位职责
1.数据特征算法:负责大规模代码数据的挖掘工作(如标签体系构建、结构化拼接、数据比例配置等),开展数据质量检测(包括低质内容识别、优质代码筛选等)以及数据合成相关算法研发;
2.数据pipeline建设:主导数据筛选、清洗、标注及质量评估流程的设计与实现。协同模型业务团队,深度挖掘数据价值,搭建自动化数据处理系统,支撑模型的持续优化与迭代;
3.数据实验分析:针对代码大模型训练所用数据进行系统性分析,建立规范化的实验评估机制,发现样本缺失、数据偏差、分布失衡等问题,推动数据质量、覆盖范围与多样性的全面提升,助力模型生成能力不断优化。
岗位要求
1.硕士及以上学历,计算机科学、自然语言处理等相关专业背景优先考虑;
2.熟悉主流深度学习框架(如PyTorch、TensorFlow),具备模型训练与数据处理实践经验,拥有出色的独立开发、问题分析与研究能力;
3.具备良好的沟通协作意识,自我驱动性强,能独立完成系统层面的分析与调优,推动大模型技术的实际落地应用;
4.可进行日常实习,每周至少全职投入4天,连续实习6个月以上者优先;27届毕业生优先考虑。
加分项
1.掌握HiveSQL、Spark、Ray中至少两项数据处理与分析工具;
2.对代码大模型有较深认知,具备敏锐的数据感知力和扎实的数据洞察分析能力;
3.有大模型训练或数据工程相关项目经验者优先。
1.数据特征算法:负责大规模代码数据的挖掘工作(如标签体系构建、结构化拼接、数据比例配置等),开展数据质量检测(包括低质内容识别、优质代码筛选等)以及数据合成相关算法研发;
2.数据pipeline建设:主导数据筛选、清洗、标注及质量评估流程的设计与实现。协同模型业务团队,深度挖掘数据价值,搭建自动化数据处理系统,支撑模型的持续优化与迭代;
3.数据实验分析:针对代码大模型训练所用数据进行系统性分析,建立规范化的实验评估机制,发现样本缺失、数据偏差、分布失衡等问题,推动数据质量、覆盖范围与多样性的全面提升,助力模型生成能力不断优化。
岗位要求
1.硕士及以上学历,计算机科学、自然语言处理等相关专业背景优先考虑;
2.熟悉主流深度学习框架(如PyTorch、TensorFlow),具备模型训练与数据处理实践经验,拥有出色的独立开发、问题分析与研究能力;
3.具备良好的沟通协作意识,自我驱动性强,能独立完成系统层面的分析与调优,推动大模型技术的实际落地应用;
4.可进行日常实习,每周至少全职投入4天,连续实习6个月以上者优先;27届毕业生优先考虑。
加分项
1.掌握HiveSQL、Spark、Ray中至少两项数据处理与分析工具;
2.对代码大模型有较深认知,具备敏锐的数据感知力和扎实的数据洞察分析能力;
3.有大模型训练或数据工程相关项目经验者优先。
相似职位
很抱歉,暂无相似职位!