
河北ty8天游平台登录 “点燃职场,成就梦想”2026届毕业生秋季双选会
2025/10/17 14:00
【取消】三一集团2025校园招聘
2025/09/28 19:00
北方华创微电子2026届秋季校园招聘宣讲会
2025/09/28 18:40
文墨新星——经管、文法、外语、艺术类专场招聘会
2025/09/23 14:00
【深圳佑驾创新科技股份有限公司】
发布时间:2025-09-05 浏览量:84
工作地域:广东省 职位类别:工程技术人员 学历要求:硕士 招聘人数: 4人
岗位职责:
1. 负责语言及视觉大模型(如LLaVA等)的量化技术研究、开发与优化。
2. 设计并实现高效的量化算法,降低模型存储占用和计算开销,提升推理速度,同时尽可能保持模型精度。
3. 跟踪学术界和工业界前沿量化技术(如FP8、INT8、INT4、混合精度量化等),推动技术落地。
4. 编写量化工具链,支持主流框架(PyTorch、ONNX等)的量化部署。
5. 针对芯片特性(如高通8295/8255系列及MTK8676/8678系列NPU)进行量化方案定制化优化,提升硬件利用率。
6. 技术调研和编写文档,性能评估与调优,以及跨平台适配。
任职资格:
1.计算机科学、电子工程、数学或相关专业,硕士及以上学历。
2. 扎实的编程能力,精通Python,熟悉C++/CUDA等高性能计算语言。
3. 熟练大模型推理框架(Deepseed、vLLM、Llama.cpp等)以及模型量化工具链(如ONNX、TensorRT~LLM、AIMET、LLMC等)。
4. 深入理解量化技术原理(如PTQ、QAT、混合精度量化),熟悉主流量化算法(如GPTQ、AWQ、SmoothQuant)与其他模型压缩技术(剪枝、稀疏化)的协同优化。
5. 有Transformer类大模型NPUd端量化及部署经验(必须项),熟悉LLM/VLM架构及推理流程优化。
6 良好的沟通能力,能与算法、硬件团队高效协作。