如何使用Rust创建一个基于ChatGPT的RAG助手

如今，chatgpt 已经成为家喻户晓的名字，每个开发者都主动或被动地使用过 chatgpt 或者是基于 chatgpt 的产品。chatgpt 很好，但是应用到实际工作与生活场景，chatgpt 经常会出现一些幻觉，“一本正经”地为我们提供一些错误答案，没有办法为我们提供专业的意见或指导。那我们如何让 chatgpt 具备某个专业领域的知识，提升回答的正确率，从而让 chatgpt 真的用起来？比如训练 chatgpt 成为企业的智能客服助手，解放客服的双手。
如何构建一个具有专业知识的机器人
为了解决这个问题，一般我们有两种解决方法。第一种是利用自己的数据在大模型的基础上进行 fine-tune（微调），训练出一个具备相关领域的知识的大模型，另一种方法称作 rag (retrieval-augmented generation)，检索增强生成，利用向量数据库的能力，将专业的知识数据转换成多个向量，然后再利用大模型的能力进行检索，最后回答问题。两种方法各有自己的优势和劣势，总体来说，尽管 rag 的准确度不如 fine-tune 高，但是 rag 的性能比更适合普罗大众，因为 rag 更简化，更高效。rag 的优势有以下几点：
相较于微调大模型需要 gpu 算力等硬件设备支持，rag 只需要在软件层面添加向量数据库，操作起来更加简单，成本也更低。
当有数据更新时，rag 允许开发者通过添加新的 embedding 以保证内容的时效性，但是微调大模型则需要反复重新训练模型，耗费资源比较多
fine-tune rag
是否需要 gpu 资源是否
开发周期长短
更新/删除知识需要重新训练更新 embedding
适合场景赋予大模型某种能力赋予大模型某种知识
结果准确度高于 rag 低于 fine-tune
如何使用 rust 创建一个基于 chatgpt 的 rag 助手
常见的构建 rag 助手的工具是以 python 为主的 langchain，但是如何使用 rust 来构建呢？这就需要我们有一套围绕 rust 语言打造的 llm 工具链。flows.network 就是这样一个专门为 rust 开发者打造的构建 llm agent 的平台。和 langchain 一样，flows.network 为 rust 开发者包装了常用的 llm 工具库，比如 chatgpt 、claude、llama2 以及我们常用的 saas 工具 github 、discord、telegram、slack。但是更进一步的是，flows.network 是一个 serverless rust 平台，开发者只需构建业务逻辑，编译以及部署 rust 函数都由平台完成。
具体到构建基于 chatgpt 的 rag 助手，flows.network 已经开源了一套开箱即用的框架供 rust 开发者使用。最近新发布 learn rust 助手就是基于这套框架所实现的。
为了方便大家理解基于 chatgpt 的 rag 助手，我在这里补充了一张在 learn rust 助手询问问题的流程图。从用户问一个问题开始，agent 就要和向量数据库和 llm 打交道，为没有记忆的大模型补充手脚、眼睛和记忆。
下面我们来详细看看怎么使用 rust 构建 rag 助手。开源的代码分为两部分，一部分是利用向量数据库创建 embedding，另一部分是把加好 embedding 的向量数据库与我们常用的工具结合起来。这两部分代码都是完全用 rust 编写的。
这篇文章主要聚焦如何搭建 rag 知识库助手，不会对代码进行详细解释。对源代码感兴趣的朋友，敬请期待我们下一篇文章。
首先先来看第一部分在向量数据库中创建 embedding。
在创建 embedding 的这个 demo repo 我们需要做三件事：
fork 这个 repo，把文件 text1.txt 里的内容换成自己的内容。这里要注意 embedding 的方法，要把相似的内容放在一个 embedding 里，每个空行代表一个 embedding。你也可以直接在本地存储自己的 embedding。
将 rag-embedding repo 的代码部署在 flows.network 上，得到一个可以访问向量数据库的 webhook。
在这个 webhook 中添加 embedding 的内容以及命名 collection。
第一步是主要是开发者自己的工作，你可以选择手动分段，也可以选择使用算法进行分段。
第二步需要用到 flows.network，简单来说，我们需要把包含源代码的 repo 导入到 flows.network 平台，并且添加 openai 的 api key。因为把 text 转换成 embedding 的工作是调用 openai 的 embedding api 完成的。部署完成后，我们会在页面看到一个 webhook 链接。这个 webhook 链接需要保存下来，因为接下来我们将通过这个 wbhook 添加 embedding 的内容。
// webhook 示例https://code.flows.network/webhook/i9gngd5hkhfly25dsoui
第三步是用 curl 为这个向量数据库添加 embedding 内容。打开终端命令行工具，输入下面的命令行。
// 获取源代码及准备好的 txt 文件 git clone https://github.com/alabulei1/demo-rag-embeddings.gitcd demo-rag-embeddings// 上传创建好的 embedding 文件。// webhook 链接要替换成在 flows.network 生成的链接// collection_name 可以随意替换，要记住这个名字，后面需要用到// @test1.txt 根据实际情况替换即可curl https://code.flows.network/webhook/i9gngd5hkhfly25dsoui?collection_name=laokeshi&vector_size=1536&reset=1 -x post --data-binary @test1.txt//添加成功后，终端会提示总共创建了多少个 embeddingsuccessfully inserted 7 records. the collection now has 7 records in total
看到终端输出如上的命令行，就意味着我们的 embedding 已经创建好了。
下面的视频展示了如何在 flows.network 上部署这个创建 embedding 的 repo，并且在得到 webhook 链接后，如何把 embedding 添加到向量数据库。
接下来就可以将这些 embedding 与其他 saas 工具自由组装。这时候就用到我们的第二个 demo repo：使用这些 embedding 创建一个 discord 机器人（agent），让用户能够在 discord 直接咨询相关问题。
同样，我们需要将 rag-discord-bot demo repo 导入到 flows.network 进行部署。我们需要配置五个环境变量。discod_token 和 bot_id 是设置 discord 机器人的。这两个参数在 discord 的开发者中心获取。
还有一个 collection_name ，这里要填入我们在上一步创建 embedding 的是所设置的 collection_name 的值，让 discord agent 知道去找哪个数据库检索相关内容。
另外两个是 agent 本身的信息。error-mesg 是发生错误时，给用户的错误提示信息，system_promopt 是 agent 总的 prompt，给 chatgpt 规划任务。
同样，下面有一个视频展示了如何在 flows.network 上导入 github repo，创建这个 discord 机器人。
当 flow 的状态变成 ready 后，就可以去 server 里找刚刚创建的 discord 机器人，让这个 discord 机器人回答问题。注意，这时的 discord 机器人应该是 online 的状态，如果 discord 机器人是 offline 的状态，请检查 discord 机器人是否设置正确。
这就是使用 rust 创建一个基于 chatgpt 的 rag 助手的全部过程。当然你也可以把 chatgpt 换成其他的大模型，比如 llama2。
使用 rust 构建 llm agent 并没有那么难！如果你正在发愁不知道怎么把 rust 用起来，来试试构建这个 rag agent 吧。你可以构建企业手册助手、开发手册助手、开源项目助手等等。
下一篇文章，我们将详细解读这个 rag 助手的 rust 源代码，帮助大家更好地理解这背后的原理。敬请期待！

PLC的选型方法及硬件配置
新基建会如何引领智慧交通的发展方向
真实的案例，带你走进工业4.0时代
2014 MWC 爱立信携五大主题诠释ICT
三星8英寸平板电脑发布小米MIX4搭载可升降加全面屏
如何使用Rust创建一个基于ChatGPT的RAG助手
中芯国际3.97亿美元紧急采购！美国拿下2019年全球55%半导体市场占有率
羽迹人工智能极速3D人脸建模让美在指尖跃动
智能制造的五个特点
资深攻城狮解读5个被误解的CPUGPU概念
介绍Gx汗液贴片的商业化进程
锤子坚果Pro评测：锤子发新品坚果Pro，到底值不值得买？超低功耗、超级双摄、超长续航！
Covestro为未来汽车照明研发创新型汽车前大灯概念
无人多旋翼飞行器如何应用于公路桥梁检测、线路巡检中
针对华为的禁令，导澳大利亚运营商放弃进一步建设旗下的移动网络建设
LED显示屏“触”之可及可以实现吗
TFT LCD、OLED和Micro LED 的区别
RECOM全新的微型封装稳压型DC/DC转换器
MSP430单片机的加密熔断器设计
iOS11.1 beta2下周将带来表情热潮，苹果又给你找了一个升级iOS11的理由