手机浏览器扫描二维码访问
本项目选择OpenAI的GPT模型作为Chatbot的大语言模型基座,GPT模型基于Transformer
架构,相较于其他模型,这种架构允许模型在处理长文本时保持较好的性能,同时具有良好的并行
化能力,使得模型的训练和推理速度得到提升。
5.2.1Chatbot后端
基于先前构建的针对电力LCA领域的向量知识库构建Chatbot测试模型性能,主要设计思路是
为了实现检索功能,大致可分为知识库检索功能和在线搜索。
Chatbot功能流程图如图5.1所示。
用户通过Chatbot界面输入他们的问题或请求。
对用户输入文本进行清洗,包括去除标点符
号,进行分词等。
转化为结构化数据后将预处理后的文本转换为向量形式,以便于机器理解。
将向
量化处理后的用户问题构建成搜索向量。
使用搜索向量与知识库中已向量化的内容进行匹配,找出
相关的信息。
对匹配到的知识库内容进行排序,选择最相关的几个回答候选。
为保证性能设置最相
关的问答数量。
基于排序和选择的结果,生成回答,将最终确定的回答返回给用户。
对于用户输入的问题语句进行文本预处理,随后将其变成机构化数据后向量化,与先前处理文
献数据类似,因此这里不再赘述。
知识库搜索:
以下是通过Weaviate在名为“Water”
的集合中搜索与特定查询文本相近的文档,并返回相
关文档的内容和来源,设置top_k=3,考虑计算机性能与运行速度,只寻找三个匹配项。
这段代码最终返回一个包含匹配文档内容和来源的列表。
在线搜索:
以下是通过在线搜索引擎在互联网上搜索相关内容,并返回格式化的文档列表,其中包含每个
搜索结果的摘要内容和来源链接的代码,同样设置top_k=3,返回三个匹配项。
小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!
通过DuckDuckGo搜索引擎在互联网上搜索相关内容,并返回格式化的文档列表,其中包含每
个搜索结果的摘要内容和来源链接。
代码利用正则表达式提取搜索结果中的摘要、标题和链接信
息,并对结果进行整理和格式化,以便展示给用户。
通过这个函数,用户可以通过输入查询来搜索
互联网上的相关信息,并查看摘要和链接。
Streamlit是一个强大的Python库,主要用于机器学习、数据可视化和Web应用程序的快速
开发。
用户在编写代码时可以实时看到应用界面的变化,快速调试和验证结果。
前世被当副镇长的老婆离婚后,崔向东愤怒下铸成了大错,悔恨终生!几十年后,他却莫名重回到了这个最重要的时刻!他再次面对要和他离婚的副镇长老婆,这次,他会怎么做?...
性格嚣张的林飞扬走马上任镇委书记当天就得罪了顶头上司,让大领导颜面无存,差点被就地免职,且看这个嚣张到骨子里的家伙如何凭借孙子兵法和三十六计勇闯重重危机,智破层层陷阱,在官场上混得风生水起,扶摇直上…...
他们都是草根出生,凭自己的努力走上仕途,但一个清廉,一个腐败,于是一见面就成了格格不入的对手...
林风因意外负伤从大学退学回村,当欺辱他的地痞从城里带回来一个漂亮女友羞辱他以后,林风竟在村里小河意外得到了古老传承,无相诀。自此以后,且看林风嬉戏花丛,逍遥都市!...
官场是什么?官场是权力的游戏。官场远比江湖更为险恶。千帆竞渡百舸争流!跨过去那就是海阔任潮涌风劲好扬帆!官场的规矩是什么?正确就是官场的最大规矩!重活一世。刘项东洞悉一切。他不仅能正确,还会一直正确下去!重生是风自身为鹏大鹏一日同风起,这辈子,我刘项东要扶摇直上九万里!...
精神发疯文学,没有原型,没有原型,没有原型(讲三遍),请不要在评论区提真人哦。金手指奇大,cp沈天青。日六,防盗八十,上午十一点更新江繁星八岁时候看见律政电视剧里的帅哥美女环游世界谈恋爱...