NLP(一百一十)创建HuggingFace Spaces应用 本文将会介绍如何在HuggingFace Spaces中创建应用,方便别人使用。 2025-01-08 NLP #HuggingFace Spaces
NLP(一百零九)Embedding中的Late-Chunking(迟分)策略 本文将会介绍Embedding模型中的Late Chunking(迟分)策略,演示多个中文Late Chunking的例子,并搭建相关Gradio服务,最后再展示其在RAG框架中对于大模型回复质量的提升作用。 2025-01-08 NLP #Late Chunking #Embedding
深度解析ElasticSearch同义词管理:打造更智能的搜索体验 本文将会介绍ElasticSearch中的同义词管理方案,分别为同义词库和同义词API。 2025-01-08 数据库 #ElasticSearch
pytest测试框架使用笔记(一) 本文将会介绍Python最常用的测试框架之一的pytest,介绍该测试框架的常见用法,也是笔者近期使用该框架的一些总结。 2025-01-08 Python #pytest
Gradio入门(2)表格DataFrame的进阶使用 本文主要介绍Gradio中的表格DataFrame的进阶使用,包括表格单元格内的文本换行和文本颜色设置(或者文本高亮)。 2025-01-08 Python #Gradio
OCR入门(一)OCR模型训练实战:破解汉字验证码 本文将会介绍如何使用CnOCR工具包来训练自己的OCR模型,实现汉字验证码的破解。本文作为OCR入门的第一篇文章,具有很强的实战性和一定的趣味性,适合新手入门。 2024-11-13 Python #OCR #验证码
NLP(一百零八)一个好用的标注平台Label-Studio 本文将会介绍一个在深度学习领域很好用的开源标注平台工具Label Studio,并演示在该平台上进行常见的NLP和CV任务的标注。 2024-11-13 NLP #标注平台 #Label Studio