返回 职位详情 登录/注册
大模型应用研发工程师(需出差)
1-1.5万元/月
定位 长春南关区吉林·铜锣湾广场1层
更新 2025-12-21 14:26:32 浏览 970
职位详情
大模型算法 1年以下
岗位职责
1.大模型应用功能二次开发与参数优化:依托LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源平台进行定制化开发及深度参数配置,实现专属文档解析模块、向量索引机制、Agent工具集成、Prompt构建体系、结果重排逻辑、权限控制接口等功能适配。
2.大模型推理引擎部署与效能调优:结合pytorch、vllm、sglang等开源技术栈,根据客户硬件环境调整推理参数,实现推理效率与资源占用的最优平衡。
3.全流程私有化部署与项目交付:基于K8S完成大模型应用的定制化构建,并完成从环境准备到生产上线的端到端交付实施。
4.系统持续维护与技术支持:承担系统上线后的版本迭代、问题排查与应急响应等运维任务,输出运维文档、故障处理流程、培训资料等交付物。

任职要求
1.计算机类相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付实践经验。
2.熟练掌握以下至少两类开源框架,并拥有实际部署与二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.熟悉主流大模型推理方案中的一种或多种,如hf原生/vllm/sglang,理解其底层推理并行机制与性能影响因素。
4.精通Python及PyTorch框架,具备扎实的工程实现能力;可使用C++/CUDA或Golang开发高性能计算组件或辅助服务模块。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能优化策略及数据迁移方法;
6.具备强烈的技术探索意愿,良好的表达能力和协作意识,对新技术保持敏感度,能快速融入新场景;拥有较强的逻辑分析能力、沟通协调能力、抗压能力与情绪管理能力。
公司信息
中科聚信信息技术(北京)有限公司
明细
北京市海淀区学院南路62号中关村资本大厦4层401室
大渡口人才网温馨提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
相似职位
很抱歉,暂无相似职位!