My Github Blog

NLP（七十三）从BERT模型训练到量化、蒸馏之路

本文将会介绍笔者从BERT模型训练到模型量化、蒸馏的旅程，通过一系列文章的回顾，不难掌握模型训练和模型压缩的技能。

2024-01-10

NLP

#模型量化 #知识蒸馏

NLP（七十二）使用知识蒸馏提升模型推理性能

本文将会介绍模型压缩方法——知识蒸馏，通过对训练后的BERT模型在小模型上进行蒸馏，在小模型上提到推理性能的极大提升，同时也不会过多损失模型效果。

2024-01-10

NLP

#知识蒸馏

NLP（七十一）大模型微调RACE数据集的进一步实验

本文将介绍大模型微调RACE数据集的进一步实验。

2024-01-10

NLP

#LLM #RACE数据集

Python代码整洁之道及代码注释

本文将主要Python中的代码整洁之道及代码注释。

2024-01-10

Python

#Python

PyTorch入门（八）Optuna的使用

本文将会介绍机器学习领域的自动化超参优化软件框架——`Optuna`，它能在很大程度上让我们专注于模型实现，因为它让超参优化变得更加简洁、高效！

2024-01-10

深度学习框架

#Optuna

Apollo配置中心及Python连接

本文将会介绍如何启动Apollo，在Apollo中配置参数，以及如何使用Python连接Apollo.

2024-01-09

Python

#Apollo

NLP（七十）使用LLAMA-2模型微调Multiple-Choice-MRC

本文将介绍如何在Firefly大模型训练框架中，使用LLAMA-2 7B模型，对多项选择阅读理解数据集RACE middle进行微调，最终效果提升明显。

2024-01-09

NLP

#LLM #MRC

NLP（六十九）智能文档助手升级

本文在笔者之前研发的大模型智能文档问答项目中，开发更进一步，支持多种类型文档和URL链接，支持多种大模型接入，且使用更方便、高效。

2023-09-09

NLP

#文档问答

基于token的编辑距离计算

本文的想法较为简单，是将字符串的编辑距离推广至token列表的编辑距离，可以作为一种衡量字符串相似度的指标。

2023-09-09

Python

#编辑距离

NLP（六十八）使用Optimum进行模型量化

本文介绍了如何使用HuggingFace的`Optimum`，来对微调后的BERT模型进行量化（Quantization），在`optimum.onnxruntime`模块中，平均推理时间提速约1.8倍。

2023-09-06

NLP

#BERT #模型量化 #Optimum