工作职责:
1.负责基于大模型的业务应用系统与开发,通过Promot Engineering、RAG、Agent等技术,将大模型能力转化为可落地的产品功能;
2.使用LORA/QLORA等参数高效微调技术,对开源大模型进行业务领域的适配与优化,确保模型在实际业务场景中效果达标且资源可控;
3.负贵大模型环境的工程化部署,优化响应延迟、并发吞吐及资源成本;
4.针对业务场景进行提示词设计与效果调优,持续提升模型输出质量;
5.与业务专家、软件专家团队协作,完成大模型应用从方案设计到上线的全生命周期开发;
6.跟踪大模型应用最新技术动态、持续引入新工具、新框架提升开发效率。
任职资格:
1.博士研究生学历或硕士研究生2年以上相关工作经历,研究课题与大模型应用相关,人工智能、计算机科学、自然语言处理、深度学习等相关理工科专业优先;
2.熟练掌握大模型底层核心原理与前沿技术,深入理解Transformer架构、注意力机制及主流大模型(GPT、DeepSeek、Qwen、Clauld)的核心原理;
3.熟练掌握大模型微调技术(LORA, QLORA, Prefix Tuning等)及对齐方法(SFT, RLHF, DPO);
4.熟练掌握大模型全流程应用操作能力,熟练掌握Prompt工程、RAG检索增强、向量数据库使用、大模型Agent应用搭建、模型调用与开发,具备从0到1搭建大模型业务应用实战能力:5.熟练掌握Python开发及LangChain, Llamalndex, Dify常用应用框架,具备良好工程代码能力,能够独立完成大模型应用开发、对接、调试部署全流程工作,具备较强问题排查能力与业务逻辑能力;
6.具备良好的业务理解能力、逻辑思维能力及跨部门沟通协作,工作态度踏实严谨,责任心强,具备较强抗压能力与执行力。
7.有大模型应用落地项目经验、NLP科研成果、相关顶会论文、行业知识库及RAG实战经验者优先。