semaphore提示您:看后求收藏(乡村小说网www.xcxs5200.com),接着再看更方便。

个模块。数据处理模块主要包括对电力LCA这个特定领域的英文文献进行选择和初步处理,而后将有关数据全部转化成结构化数据。知识库构建模块主要是将数据向量化并构建向量知识库。Chatbot构建分为功能部分和前端部分,功能包括基于OpenAI的大语言模型基座调用、知识库检索、在线检索;前端部分为web可视化以及UI设计。首先是数据处理模块。数据的范围,我选择了常见的五种发电方式,火力,水力,太阳能,核能,风能。确定每个主题的关键词和大主题生命周期评价后记录所有可能出现的形式,比如说,生命周期评价出现在论文里,可能是LCA,也可能是lifecycle assessment,罗列所有可能性,做到不遗漏数据。

在 RAG 技术中,整个过程主要分为三个步骤如图 2.2 所示:索引( Indexing)、检索

(Retrieval)和生成(Generation)。首先,索引步骤是将大量的文档或数据集合进行预处理,将

其分割成较小的块(chunk)并进行编码,然后存储在向量数据库中。这个过程的关键在于将非结

构化的文本数据转化为结构化的向量表示,以便于后续的检索和生成步骤。接下来是检索步骤,它

根据输入的查询或问题,从向量数据库中检索出与查询最相关的前 k 个 chunk。这一步依赖于高效

的语义相似度计算方法,以确保检索到的 chunk 与查询具有高度的相关性。最后是生成步骤,它将

原始查询和检索到的 chunk 一起输入到预训练的 Transformer 模型(如 GPT 或 BERT)中,生成最

终的答案或文本。这个模型结合了原始查询的语义信息和检索到的相关上下文,以生成准确、连贯

且相关的文本。

RAG 的概念和初步实现是由 Douwe Kiela、Patrick Lewis 和 Ethan Perez 等人在 2020 年首次

提出的。他们在论文《Retrieval-augmented generation for knowledge-intensive nlp tasks》

中详细介绍了 RAG 的原理和应用,随后谷歌等搜索引擎公司已经开始

科幻灵异推荐阅读 More+
第一女婿

第一女婿

我不做屈原
数入赘女婿,还看今朝我!凡是辱我、骂我、打我的人,对我妻子心存不轨的人,你们的噩梦来临了……
科幻 连载 1343万字
星际种田:指挥官的小娇娇软又甜

星际种田:指挥官的小娇娇软又甜

李心语
机甲残骸,红雨灾害,充满酸性难解物质的不毛之地··· 陶夭夭叹了一口气她是来自世的种植大师,重生到了星际,垃圾星的星主是什么鬼?谁说这是星际的末等公民? 空间在手,星球我有,变异种子,满山妖植,N98垃圾星才是遗忘的瑰宝。 “听说那个傻子千金要在N98种植?” “就她?” 因为整个星际的人都知道酸性土地不长植物。 但是打脸来的太快,一夜之间,N98垃圾星被一种绿色的变异植物给侵占了··· 陶夭夭
科幻 连载 17万字
孤楼

孤楼

风雨如书
情感失败,新书陷入困惑期的我(陆安)在朋友的推荐下来到怪物楼闭关创作,在房东阿婆(梅淑芳)的安排下,我住到了205房间。在收拾房间的时候,我发现了原住户丁洋遗留在床底下的日记,通过日记我了解到了孤楼的住户,除去房东阿婆以外,一共还有七户,每个人都性格诡异,从事的职业也都是五花八门。并且每个人都有不愿意让别人知道的秘密…
科幻 连载 89万字