NLP(七十二)使用知识蒸馏提升模型推理性能 本文将会介绍模型压缩方法——知识蒸馏,通过对训练后的BERT模型在小模型上进行蒸馏,在小模型上提到推理性能的极大提升,同时也不会过多损失模型效果。 2024-01-10 NLP #知识蒸馏
PyTorch入门(八)Optuna的使用 本文将会介绍机器学习领域的自动化超参优化软件框架——`Optuna`,它能在很大程度上让我们专注于模型实现,因为它让超参优化变得更加简洁、高效! 2024-01-10 深度学习框架 #Optuna
NLP(七十)使用LLAMA-2模型微调Multiple-Choice-MRC 本文将介绍如何在Firefly大模型训练框架中,使用LLAMA-2 7B模型,对多项选择阅读理解数据集RACE middle进行微调,最终效果提升明显。 2024-01-09 NLP #LLM #MRC
NLP(六十九)智能文档助手升级 本文在笔者之前研发的大模型智能文档问答项目中,开发更进一步,支持多种类型文档和URL链接,支持多种大模型接入,且使用更方便、高效。 2023-09-09 NLP #文档问答
NLP(六十八)使用Optimum进行模型量化 本文介绍了如何使用HuggingFace的`Optimum`,来对微调后的BERT模型进行量化(Quantization),在`optimum.onnxruntime`模块中,平均推理时间提速约1.8倍。 2023-09-06 NLP #BERT #模型量化 #Optimum
NLP(六十七)BERT模型训练后动态量化(PTDQ) 本文介绍了量化基本概念,PyTorch模型量化方式,以及对BERT模型训练后进行动态量化后在推理效果和推理性能上的实验。 2023-09-03 NLP #模型量化