
工作职责:
1.应用落地:负责大模型的模型适配与应用落地,包括但不限于LLM、Langchain、Agent等技术;
2.性能评估监测与部署:定期监控模型性能,进行在特定应用场景下的各类模型能力的评估,确保模型达到业务要求,能够进行模型的容器化部署;
3.负责将大模型应用到留学及考培教育业务场景,协同完成智能化场景的建设,实现价值的创造;
4.模型微调与优化:参与大模型在留学及考培教育业务场景下的应用,包括但不限于:基于公有云大模型做局部私有资料的对接微调,基于私有大模型做垂直领域的数据抓取、自动标注、微调训练。
任职资格:
1.统招本科及以上学历,计算机或数学等相关专业,3年以上相关工作经验;
2.参与过大模型相关开发工作,包括但不限于:数据清洗、训练框架开发、评测、推理部署等; 有针对开源模型实际微调 ,并使其形成行业领域模型者优先;
3.精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;
4.具备大模型应用开发和落地经验,包括Prompt Engining、LangChain、RAG、Agent等方面,有体系化产品架构设计者优先;
5.熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验;
6.熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验;熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;
7.熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验;
8.良好的团队沟通协作能力,能够快速掌握业务领域和业务知识,擅于分析和解决复杂问题。