基于llms提示词优化的电网调度智能问答系统及方法
技术领域
1.本发明属于人工智能领域,具体地,涉及一种基于llms提示词优化的电网调度智能问答系统及方法。
背景技术:
2.电网调度是电力系统的重要组成部分,负责实时监控和控制电力系统的运行状态,保证电力供应的安全、稳定和经济。电网调度人员需要掌握大量的专业知识,同时面对复杂的运行环境和突发事件,需要快速准确地回答各种问题,提供决策支持。
3.传统的电网调度问答系统主要基于规则或者知识库的方法,通过预先定义好的问题和答案进行匹配,或者通过查询结构化的知识库返回相关信息。这些方法存在以下缺点:一是需要人工编写和维护大量的规则或者知识库,工作量大,更新困难;二是无法处理语义复杂或者模糊不清的问题,容易出现匹配错误或者无法回答的情况;三是无法利用非结构化的文本数据,如文档、报告、论文等,导致知识覆盖不全面,回答不完善。
4.大语言模型(llm)是一种利用深度学习技术训练出来的通用语言生成模型,能够根据输入的文本生成相关的输出文本。llm具有强大的语言理解和表达能力,其最重要的一项应用就是针对特定环境的内容生成。为了实现这一目的,目前主要有全量微调和lora微调方法。全量微调是指在原始llm的基础上,使用特定领域的数据进行再训练,以适应特定任务或场景。这种方法可以提高llm在特定领域的生成效果,但需要巨大的算力支持,成本过高,只有少数大公司才能负担。lora微调是指在原始llm中添加一个局部可重参数化(lora)层,在不改变原始llm参数的情况下,使用特定领域的数据进行微调。这种方法可以降低微调所需的算力和成本,但需要牺牲基础能力,换取单任务效果。
技术实现要素:
5.本发明的目的是提供一种基于llms提示词优化的电网调度智能问答系统及方法,能够有效地利用结构化和非结构化的数据源,提高问答的准确性和全面性,降低人工编写和维护规则或者知识库的工作量,提升电网调度人员的工作效率和质量。
6.为了实现上述目的,本发明采用以下技术方案:基于llms提示词优化的电网调度智能问答系统,包括:
7.用户界面模块,用于接收用户输入的问题,并将问题转换为标准格式,所述标准格式是能够被知识管理模块通过内容解析算法进行内容解析的文本格式或者是语音格式,同时用户界面模块还配置为用于向问答引擎模块发送所选择的知识库和知识搜索模式,用户界面模块将问答引擎模块输出的回答展示给用户,并收集用户对回答的反馈和评价,并将其传递给评估优化模块;
8.知识管理模块,用于管理和维护知识库,通过ocr、nlp、cv等技术作为内容解析算法处理不同格式和来源的文档,提取出实体词信息,转换为结构化数据,根据用户输入的不同范围的电网调度技术问题和上下文信息,动态地选择知识源,并将从选择的知识源中搜
索到的与用户提问关键词相关或语义相关可用作答案素材的内容作为辅助信息传递给问答引擎模块;
9.问答引擎模块,用于根据用户选择的知识库和知识搜索模式,调用相应的子模块用自动脚本对相应的知识库进行搜索,找到相关关键词后插入到对话里面生成提示信息并进行优化,这样知识库中的信息就会被大语言模型利用了,然后将优化后的提示信息作为大语言模型的输入,由大语言模型进行综合分析与总结生成答案,最后将回答返回给用户界面模块;
10.所述知识搜索模式包括fess搜索模式、rtst搜索模式和mix搜索模式;
11.所述子模块包括fess关键词搜索子模块、rtst语义搜索子模块和mix搜索子模块;
12.其中:
13.fess关键词搜索子模块是一个本地搜索引擎,它能够爬取本地文件的内容并进行关键词提取。利用本地部署的fess搜索服务器,能够在内网网页、txt文件、pdf文件和数据库中检索出可用于生成用户输入问题答案的相关内容,并将其插入到对话里面生成提示信息,然后将优化后的该提示信息作为大语言模型的输入,以激发大语言模型的生成能力;fess关键词搜索子模块能够根据用户选择的知识库进行检索,并支持关键词提取和相似度排序;
14.rtst语义搜索子模块是一个基于对txt、pdf等知识进行向量化处理的文本相似度计算引擎,能够解决用户输入文本与给定语料库记录间相似度的对比问题,利用sentence_transformers和faiss构建语义搜索引擎,在预先定义的问答对库中匹配出与用户输入的问题语义最相似的记录内容,并返回其对应的可用于生成问题答案的上下文信息,将其插入到对话里面作为大语言模型的输入,以激发大语言模型的生成能力;
15.mix搜索子模块,用于综合利用fess关键词搜索子模块和rtst语义搜索子模块,在本地不同类型和来源的数据中检索或匹配出与用户输入的问题最相关的内容,并将其插入到对话里面生成提示信息,然后将优化后的该提示信息作为大语言模型的输入,以激发大语言模型的生成能力;
16.所述评估优化模块,用于评估和优化问答引擎的性能和质量,收集和分析用户的反馈和评价。
17.进一步,所述知识库包括电力基础知识库、电网调度知识库和电力设备知识库,内容涵盖用户所在区域电网各设备的基本信息和网架结构及拓扑关系、电网调度运行规程、方案等本地化信息以及电网调度领域的国标、行标、企标、制度、规定等。
18.进一步,所述大语言模型是chatglm-6b、chatrwkv及llama,但并不限制于此。
19.进一步,所述rtst搜索子模块中文本相似度计算采用的是bert算法。
20.进一步,所述评估优化模块采用的评估方法包括准确率、召回率和响应时间指标。
21.进一步,所述评估优化模块采用的优化方法包括迁移学习、强化学习和元学习。
22.基于llms提示词优化的电网调度智能问答方法,该方法利用上述基于llms提示词优化的电网调度智能问答系统进行操作,具体该方法包括:
23.用户输入问题,并选择知识库和知识搜索模式;
24.根据用户输入的不同范围的电网调度技术问题和上下文信息,动态地选择知识源;
25.根据用户选择的知识库和知识搜索模式,调用fess关键词搜索子模块、rtst语义搜索子模块或mix搜索子模块,用自动脚本对相应的知识库进行搜索,找到相关关键词生成提示信息并进行优化,然后将优化后的提示信息和问题作为大语言模型的输入,并将回答返回给用户;
26.用户查看回答并反馈评价;
27.收集并分析用户反馈评价;
28.利用评估优化模块进行评估和优化。
29.本发明相比现有技术具有以下有益效果:
30.本发明提出了一种基于llms提示词优化的电网调度智能问答系统及方法,能够在不改变原始llm参数也不增加额外参数层的情况下,为llm提升生成能力,实现了一种能够独立部署于本地或内网且适应多个场景和任务的电网调度智能问答系统。
31.本发明能够有效地利用结构化和非结构化的数据源,提高问答的准确性和全面性,降低人工编写和维护规则或者知识库的工作量,提升电网调度人员的工作效率和质量。
32.本发明采用了fess搜索模式、rtst搜索模式和mix搜索模式三种提示信息搜索模式,分别利用本地部署的fess关键词搜索服务器、rtst语义搜索技术和两者的综合,在不同类型和来源的本地文件数据中检索或匹配出与用户问题最相关的内容,并将其插入到对话里面生成提示信息,然后将优化后的提示信息作为大语言模型的输入,以激发大语言模型的生成能力,最后由大语言模型进行综合分析与总结生成答案。
33.本发明提出的基于llms提示词优化的电网调度智能问答系统包括用户界面模块、知识管理模块、问答引擎模块、和评估优化模块,分别用于接收和展示用户输入和输出、管理和维护多个知识库、生成答案、收集用户反馈和评价并进行系统优化。
34.本发明能够独立部署于本地或内网环境中,不依赖于外部网络或者云服务,保证了数据安全和私密性,并且支持多用户同时使用,在多用户同时使用时会自动进行排队,并显示当前用户的信息。
附图说明
35.图1是本发明基于llms提示词优化的电网调度智能问答系统总体结构功能框图;
36.图2是本发明基于llms提示词优化的电网调度智能问答系统模块调用链路图;
37.图3是是本发明基于llms提示词优化的电网调度智能问答系统工作流程图。
具体实施方式
38.为使得本发明技术方案以及优点更加的清晰,下面将结合本发明实例中的附图,对本发明的技术方案进行完整地、清晰地描述。
39.如图1所示,本发明基于llms提示词优化的电网调度智能问答系统包括用户界面模块、问答引擎模块、知识管理模块和评估优化模块。用户通过用户界面模块输入问题,并选择知识搜索模式(关键词搜索或语义搜索)和知识库(电力基础知识库、电网调度知识库、电力设备知识库等),然后提交问题。问答引擎模块根据用户选择的知识搜索模式和知识库,调用相应的子模块用自动脚本对相应的知识库进行搜索,找到相关关键词或相关语义内容生成提示信息并进行优化,然后将优化后的提示信息和问题作为大语言模型的输入由
其作答,并将其回答返回给用户界面模块显示。知识管理模块负责管理和维护多个知识库,支持知识增量更新,文档上传与内容解析等功能。评估优化模块负责评估和优化问答引擎的性能和质量,收集和分析用户的反馈和评价,提供一些评估和优化的方法和指标。
40.用户界面模块是本发明系统与用户交互的界面,提供webui页面,支持模型问答与检索问答模式切换,知识库选择功能,文档上传与内容解析功能等。用户可以在webui页面上输入问题,并选择提示信息搜索模式和知识库,然后点击提交按钮。用户界面模块将用户输入的问题以及选择的知识搜索模式和知识库发送给问答引擎模块,并等待回答。当问答引擎模块返回回答时,用户界面模块将回答显示在webui页面上,并提示用户是否满意回答,以及是否需要提供反馈或评价。用户可以在webui页面上查看回答,并选择是否满意回答,以及是否提供反馈或评价。用户界面模块将用户的反馈或评价发送给评估优化模块,并保存在数据库中。用户还可以在webui页面上上传文档,并选择文档类型(如pdf、word、ppt等),然后点击上传按钮。用户界面模块将上传的文档发送给知识管理模块,并等待内容解析结果。当知识管理模块返回内容解析结果时,用户界面模块将内容解析结果显示在webui页面上,并提示用户是否确认添加到相应的知识库中。用户可以在webui页面上查看内容解析结果,并选择是否确认添加到相应的知识库中。用户界面模块将用户的确认信息发送给知识管理模块,并保存在数据库中。
41.知识管理模块是本发明系统管理和维护知识库,支持知识增量更新,文档上传与内容解析等功能的模块。知识管理模块可以将不同格式和来源的文档转换为结构化的数据,并存储在数据库中,以便于检索和使用。当知识管理模块接收到来自用户界面模块上传的文档以及选择的文档类型时,首先根据文档类型调用相应的内容解析算法,将文档中包含的文本、图片、表格等内容提取出来,并转换为结构化数据;然后将结构化数据存储在数据库中,并更新相应知识库中预先定义好的问答对库;最后将内容解析结果返回给用户界面模块,并等待用户确认是否添加到相应知识库中。当知识管理模块接收到来自用户界面模块的确认信息时,根据确认信息将结构化数据添加到相应知识库中,并更新数据库。本发明系统采用了ocr、nlp、cv等技术作为内容解析算法,可以有效地处理不同格式和来源的文档,提取出有用的信息,并转换为结构化数据。
42.如图2所示,问答引擎模块是本发明系统进行问答的核心模块,包括fess关键词搜索子模块、rtst语义搜索子模块和mix搜索子模块。当问答引擎模块接收到来自用户界面模块的问题以及选择的问答模式和知识库时,根据选择的问答模式调用相应的子模块进行问答,并将回答返回给用户界面模块。如果选择的是fess搜索模式,那么调用fess关键词搜索子模块进行问答;如果选择的是rtst搜索模式,那么调用rtst语义搜索子模块进行问答;如果选择的是mix搜索模式,那么调用mix搜索子模块进行问答。
43.如图2所示,fess关键词搜索子模块是本发明系统利用本地部署的fess搜索服务器,在网页、文件、数据库等各种类型的数据中检索出与用户输入的问题相关的内容,并在回答之前插入一些提示信息,以激发大语言模型的生成能力的子模块。该子模块可以根据用户选择的知识库进行检索,并支持关键词提取、相似度排序等功能。当fess关键词搜索子模块接收到来自问答引擎模块的问题以及选择的知识库时,首先根据知识库生成相应的搜索脚本,然后将问题和搜索脚本作为输入发送给fess搜索服务器,得到搜索结果;然后根据搜索结果生成一些提示信息,并将提示信息插入到对话当中,由大语言模型形成完整的回
答;最后将回答返回给问答引擎模块。本发明系统采用了fess作为搜索服务器,该服务器可以在本地或内网部署,支持多种类型和来源的数据检索,并提供强大的搜索功能和灵活的配置选项。
44.如图2所示,rtst语义搜索子模块是本发明系统利用sentence_transformers faiss技术,在预先定义的问答对库中匹配出与用户输入的问题语义最相似的问题,并返回其对应的答案及上下文信息,并在回答之前插入一些提示信息,以激发大语言模型的生成能力的语义搜索子模块。该rtst语义搜索子模块可以支持多种文本格式,如txt、doc、pdf和md等,并支持预先构建索引和运行中构建索引两种方式。当rtst语义搜索子模块接收到来自问答引擎模块的问题以及选择的知识库时,首先加载对应知识库中预先定义好的问答对库,以及预先构建好或运行中构建好的索引;然后利用sentence_transformers技术将用户问题转换为向量表示,并利用faiss技术在索引中查找最相似的向量,并返回其对应的问题和答案;然后根据返回的问题和答案生成一些提示信息,并将提示信息插入到回答之前,形成完整的问题;最后将回答返回给问答引擎模块。
45.如图2所示,mix搜索子模块是本发明系统利用fess关键词搜索子模块和rtst语义搜索子模块的综合优势,在不同类型和来源的数据中检索或匹配出最相关的内容,并在回答之前插入一些提示信息,以激发大语言模型的生成能力的mix搜索子模块。该mix搜索子模块可以兼具fess关键词搜索子模块和rtst语义搜索子模块的功能,并根据用户输入的问题和上下文信息动态地生成最合适的提示信息。当mix搜索子模块接收到来自问答引擎模块的问题以及选择的知识库时,首先根据知识库选择相应的fess搜索脚本和rtst索引;然后将问题分别发送给fess关键词搜索服务器和rtst语义搜索引擎,得到两种类型的搜索或匹配结果;并将其插入到对话里面生成提示信息,然后将优化后的该提示信息作为大语言模型的输入,以激发大语言模型的生成能力,最后由大语言模型进行综合分析与总结生成答案返回给问答引擎模块。本发明系统采用了一种基于权重和相似度的提示信息生成算法,可以根据不同类型和来源的数据,动态地调整提示信息的数量、内容和顺序,以达到最佳的激发效果。
46.评估优化模块是本发明系统评估和优化问答引擎的性能和质量,收集和分析用户的反馈和评价,提供一些评估和优化的方法和指标的模块。评估优化模块可以实现系统的持续改进。当评估优化模块接收到来自用户界面模块的反馈或评价时,首先将反馈或评价存储在数据库中,并进行统计分析;然后根据反馈或评价内容调用相应的评估或优化方法,对问答引擎进行评估或优化;最后将评估或优化结果返回给用户界面模块,并显示在webui页面上。本发明系统采用了准确率、召回率、响应时间等指标作为评估方法,可以客观地反映问答引擎的性能和质量;采用了迁移学习、强化学习、元学习等技术作为优化方法,可以根据用户反馈或评价对问答引擎进行动态调整和改进。
47.如图3所示,基于llms提示词优化的电网调度智能问答方法,包括:
48.用户输入问题,并选择知识库和知识搜索模式;
49.根据用户输入的不同范围的电网调度技术问题和上下文信息,动态地选择知识源;
50.根据用户选择的知识库和知识搜索模式,调用fess关键词搜索子模块、rtst语义搜索子模块或mix搜索子模块,用自动脚本对相应的知识库进行搜索,找到相关关键词或相
关语义内容生成提示信息并进行优化,然后将优化后的提示信息和问题作为大语言模型的输入,并将回答返回给用户。
51.以下是一轮对话过程的具体实例:
52.在本地的“地区电网调度技术问答知识库.txt”文本中存在数万对问答对,其中有如下内容:
53.11、分布式电源接入系统母线保护有哪些配置原则?
54.分布式电源接入系统母线保护应满足以下配置原则:(一)分布式电源系统设有母线时,可不设专用母线保护,发生故障时可由母线有源连接元件的后备保护切除故障。如后备保护时限不能满足稳定要求,可相应配置保护装置,快速切除母线故障;(二)应对系统侧变电站或开关站侧的母线保护进行校验,若不能满足要求时,则变电站或开关站侧应配置保护装置,快速切除母线故障。
55.12、什么是分布式光伏发电?
56.分布式光伏发电,是指采用光伏组件,将太阳能直接转换为电能的分布式发电系统。它是一种新型的、具有广阔发展前景的发电和能源综合利用方式,它倡导就近发电,就近并网,就近转换,就近使用的原则,不仅能够有效提高同等规模光伏电站的发电量,同时还有效解决了电力在升压及长距离输送中的损耗问题。
57.13、分布式光伏发电系统分为几种类型?
58.分布式光伏发电系统可以分为独立光伏发电系统和并网光伏发电系统。独立光伏发电系统也叫离网光伏发电系统,是指太阳能发电系统不与公用电网连接的发电方式。并网太阳能光伏发电系统是指将太阳能发电系统直接连接到公用电网的发电方式。
59.当用户的对话提问发出“请简要介绍一下分布式光伏发电系统”时,本发明系统会优先搜索本地知识库,并从中找到以上与“分布式光伏发电系统”相关的内容,并向大语言模型发出如下提问:请对以下文段进行归纳与总结,并用中文回答问题,如果无法从以下文段中得到答案,请忽略文段内容并用中文回答问题:(这里是上述搜索到的文本内容)。
60.大语言模型接收到上述提问后,便会综合上述搜索到的文本内容,做出如下回答:
61.分布式光伏发电系统是指采用光伏组件,将太阳能直接转换为电能的分布式发电系统。它倡导就近发电、就近并网、就近转换、就近使用的原则,不仅能够有效提高同等规模光伏电站的发电量,同时还有效解决电力在升压及长距离输送中的损耗问题。
62.分布式光伏发电系统可以分为独立光伏发电系统和并网光伏发电系统。独立光伏发电系统需要将光伏组件安装在用户家中或屋顶上,通过收集太阳能并将其转化为电能,同时需要连接到电网,实现发电和供电的分离。并网光伏发电系统则只需要将光伏组件安装到屋顶或公共场合,通过控制器将组件的发电并入电网,实现发电和供电的统一。
63.分布式光伏发电系统的优点包括:(1)倡导就近发电、就近并网、就近转换、就近使用的原则,有效提高同等规模光伏电站的发电量;(2)运行没有噪声;(3)没有燃烧过程,发电过程不需要燃料。
64.本发明采用知识库和自动脚本的形式,对大语言模型提示信息进行优化,在不改变原始llm参数也不增加额外参数层的情况下,为llm提升生成能力;在保留llm通用性和灵活性的同时,实现了一种能够独立部署于本地或内网且适应多个场景和任务的电网调度智能问答系统。