LLMForEverybody

一、任务失败概率

1.1 常见错误来源

alt text

1.2 LLM应用的3个能力

LLM应用最重要的3个能力,分别是架构、知识、模型

二、LLM应用的架构思路

LLM应用架构主要做任务的拆解和检索增强

2.1 架构图

alt text

2.2 任务拆解

在任务拆解部分,一般会分成多个Agent

三、LLM应用的知识工程

从数据原始的结构形式出发

alt text

3.3 结构化数据

3.4 非结构化数据

四、LLM应用的模型优化

4.1 prompt优化

4.2 模型微调

五、LLM应用的迭代优化过程

5.1 评估指标

alt text

5.2 试验记录

和传统的机器学习、深度学习一样,LLM应用也是需要将每次运行的实验都记录在案的,MLflow就是一个很不错的工具,可以帮助我们把Prompt、Temperature、Top P等参数以及实验运行的结果都记录下来。下图就是MLflow某个实验的多次运行结果的截图,每次运行的参数、要监控的指标都可以在总览中很直观的看到,每次运行时的测试数据和Prompt在详情页中也会记录

注:本文除了一些图是重绘之外,内容基本复制于参考1-thoughtworks的一篇公众号

参考

[1]LLM应用落地实施手册