一种核电厂质量缺陷报告与外部事件信息的精准匹配方法与流程-j9九游会真人

文档序号:35890231发布日期:2023-10-28 19:44阅读:3来源:国知局
一种核电厂质量缺陷报告与外部事件信息的精准匹配方法与流程

1.本发明属于核电技术领域,具体涉及一种应用于核电厂质量缺陷报告精确匹配核电厂外部事件信息的方法,为填报人在填写质量缺陷报告时提供相关外部事件信息的精准推送。


背景技术:

2.目前的核电基地大多经过多年的运行,在现有已建设投用的业务系统和经验反馈系统中分别积累了大量质量缺陷报告数据和外部事件信息数据。由于这些数据均分散在不同的业务系统中,形成了信息孤岛,未得到有效的整合,业务部门主要通过经验反馈部门的定期推送进行学习,但定期推送无法满足业务人员对当前工作中历史经验反馈的实时需求,往往无法及时得到最想要的经验反馈数据信息。
3.一般产生质量缺陷报告后,业务人员需要自己去其他业务系统搜索相应的外部事件信息(包括国外的iaea事件报告、wano事件报告)对其进行原因分析,并制定相应的纠正措施。因此有必要设计一种外部事件信息的经验反馈智能推送方法应用于质量缺陷报告准备期间,在核电厂质量缺陷报告填写人填报质量缺陷报告时,实现对历史外部事件信息的精准推送。


技术实现要素:

4.本发明的目的是提供一种核电厂质量缺陷报告与外部事件信息的精准匹配方法,为质量缺陷报告填报人填写质量缺陷报告时,提供外部经验的参考和借鉴。
5.本发明的技术方案如下:一种核电厂质量缺陷报告与外部事件信息的精准匹配方法,包括以下步骤:
6.步骤1:设备编码计算规则;
7.步骤2:核电专业语义相似度计算规则;
8.步骤3:各堆型的设备编码与语义相似度分值计算;
9.步骤4:修正因子处理,增强经验反馈数据的准确性;
10.步骤5:智能推荐。
11.所述的步骤1将数据根据堆型和设备编码归类计算,利用设备编码的匹配规则匹配,其中,质量缺陷报告的“设备编码”字段根据所属堆型类型进行划分,包括:cnp300、candu、cnp-600、cnp-1000、hpr1000、cpr-1000,利用正则表达式判断该质量缺陷报告数据的“设备编码”是否符合其堆型的设备编码规则。
12.所述的步骤1中的设备编码规则包括如下:
13.1)“设备编码”字段不符合该堆型的设备编码规则
14.如不符合,则基于自然语言处理方法将质量缺陷报告的“qdr主题”字段与外部事件信息中的“cr主题”字段剔除相关设备编码后根据步骤3中的语义相似度方法进行自然语言语义相似度匹配,对相似度的打分进行归一化,得到匹配分值w
主题得分
,如果w
主题得分
大于等于
给定的相关分值w
限定分值
,则计入集合s
得分集合

15.2)“设备编码”字段符合该堆型的设备编码规则
16.如果输入的设备编码符合该堆型的设备编码规则,通过以下规则进行匹配:外部事件信息的“涉及设备”字段,与输入的质量缺陷报告的“设备编码”字段进行完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码去机组号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码 设备编号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数;
17.如果以上规则都不成立,使用正则表达式提取外部事件报告的“主题”字段中的相关设备编码,与输入的质量缺陷报告的“设备编码”字段进行完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码去机组号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码 设备编号后再完全匹配,相等则获得相关的设备编码分数;如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数。
18.所述的步骤2在采用堆型和设备编码类型匹配的基础上,引入核电专业分词语义相似度匹配方法,基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图dag,动态规划查找最大概率路径,找出基于词频的最大切分组合,采用基于汉字成词能力的hmm模型,调用了viterbi算法得到分词结果,根据分词结果调用余弦相似度算法获得相似度值。
19.所述的步骤3包括:
20.1)质量缺陷报告属于cnp300、candu;
21.2)质量缺陷报告属于cnp-600、cnp-1000、hpr1000、cpr-1000;
22.3)若质量缺陷报告的“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段按照上述规则都不一致。
23.所述的步骤3中的步骤1)包括:
24.a)设备编码分值为wa,若质量缺陷报告“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段全部一致时,wa取最大分值,如果不一致,判断上述编码去掉第一位机组号后比较是否一致(堆型cnp300除外);如果一致,设备编码分值wa=0.9wa;如果不一致,判断质量缺陷报告是否属于candu,如果是则判断上述设备编码中包含的系统编码、设备编码是否一致,如果一致,设备编码分值wa=0.8wa;如果不一致,设备编码分值wa=0;然后考虑质量缺陷报告中的“qdr主题”字段与外部事件信息中的“事件标题”字段进行自然语言语义相似度匹配,对相似度的打分进行归一化;最高分值wb;匹配的总得分w
设备 主题得分
=wa wb,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

25.b)若质量缺陷报告的“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段按照上述规则都不一致,用缺陷报告数据qdr中的“qdr主题”、“设备名称”、“初步原因分析”字段与外部事件信息中的“事件标题”、“事件概要”、“事件描述英文”字段进行自然语言语义相似度匹
配,对相似度的打分进行归一化,匹配的总得分we,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

26.所述的步骤3中的步骤2)包括:
27.设备编码分值为wa,若质量缺陷报告“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段全部一致时,wa取最大分值,如果不一致,判断上述编码去掉第一位机组号后比较是否一致;如果一致,设备编码分值wa=0.9wa;如果是则判断上述系统编码中包含的系统编码是否一致,如果一致,设备编码分值wa=0.8wa。如果不一致,设备编码分值wa=0。然后考虑质量缺陷报告中的“qdr主题”字段与外部事件信息中的“事件标题”字段进行自然语言语义相似度匹配,对相似度的打分进行归一化;最高分值wb。匹配的总得分w
设备 主题得分
=wa wb,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

28.所述的步骤3中的步骤3)包括:
29.用缺陷报告数据qdr中的“qdr主题”、“设备名称”、“初步原因分析”字段与外部事件信息中的“事件标题”、“事件概要”、“事件描述英文”字段进行自然语言语义相似度匹配,对相似度的打分进行归一化,匹配的总得分we,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

30.所述的步骤4包括:
31.对关键的数据进行加分处理,质量缺陷报告相匹配的外部事件信息s
得分集合
中的分值相同的外部事件信息的“ines分级”字段;
32.如果有得分相同的情况,则判断外部事件信息中的“ines分级”字段,为n则额外增加wi*n分;
33.如果有得分相同的情况,则判断外部事件信息数据中的“直接原因”和“根本原因”字段,都不为空,则加d分;
34.如果有得分相同的情况,外部事件信息的“事件标题”与质量缺陷报告中“qdr主题”可语义匹配到如下关键字时,匹配到任一关键词并且相同,增加一定的优先推送分值,比如关键字为:“巡检”、“高处作业”、“淹溺”、“焊接”、“射线”、“rt”、“探伤”、“腐蚀检查”、“脚手架”、“超声检查”、“射线检查”、“电焊”,“气割”,“砂轮打磨切割”、“研磨”,“烘烤”、“氩弧焊”、“气焊”、“在役检查”等。如匹配上,则推荐度分数相同的情况下优先推送。
35.所述的步骤5包括:
36.根据以上匹配规则,将质量缺陷报告对应外部事件信息的每个s
得分集合
,按照分值从高到低的顺序进行推荐,根据业务规则和相似度计算方法,调整各分数之间的比重,统计数据之间的相似度、准确率、匹配率,得出最佳匹配结果,实现精准推送功能。
37.本发明的有益效果在于:目前,核电厂在进行质量缺陷报告填报工作时,只能通过手动查询的方式查找历史外部事件信息,面临效率低下以及准确率不高的问题。通过本发明可以在质量缺陷报告填报时自动快速定位并推送相关外部事件信息这一经验反馈数据,为质量缺陷报告的填报提供参考,减轻质量缺陷报告填报人员的时间和精力。
附图说明
38.图1为数据关系图-质量缺陷报告与外部事件信息匹配。
具体实施方式
39.下面结合附图及具体实施例对本发明作进一步详细说明。
40.本发明提供了一种核电厂质量缺陷报告与外部事件信息的精准匹配方法,它以质量缺陷报告信息为输入,以外部事件信息为查询对象,输出质量缺陷报告相匹配的外部事件信息。包括以下三个方面:
41.(1)本发明通过梳理并建立质量缺陷报告与外部事件信息两类信息中不同字段间的业务逻辑规则,实现部分信息的精准匹配。
42.(2)无法通过第(1)步业务逻辑规则建立匹配关系的,通过采用语义相似度技术实现对质量缺陷报告与外部事件信息另一部分信息的精准匹配。
43.(3)通过对质量缺陷报告与外部事件信息两类信息中权重修正因素的引入,可对第(1)步和第(2)步中匹配结果进行再次排序,精准的满足业务人员对相关信息的需求。
44.通过上述步骤,最终实现将质量缺陷报告相匹配的外部事件信息精准的推送给所需人员。
45.一种核电厂质量缺陷报告与外部事件信息的精准匹配方法,包括以下步骤:
46.步骤1:设备编码计算规则
47.设计统计各种复杂繁多的设备编码的规则,以及电厂与堆型之间的规则,将复杂繁多的数据根据堆型和设备编码归类计算,利用设备编码的匹配规则匹配,大大的减少了计算误差与时间,同时提升数据匹配的精准度。
48.所述的质量缺陷报告的“设备编码”字段根据所属堆型类型划分为:
49.·
cnp300
50.·
candu
51.·
cnp-600、cnp-1000、hpr1000、cpr-1000
52.利用相关正则表达式判断该质量缺陷报告数据的“设备编码”是否符合其堆型的设备编码规则。
53.1)“设备编码”字段不符合该堆型的设备编码规则
54.如不符合,则基于自然语言处理技术将质量缺陷报告的“qdr主题”字段与外部事件信息中的“cr主题”字段剔除相关设备编码后根据步骤3中的语义相似度方法进行自然语言语义相似度匹配,对相似度的打分进行归一化,得到匹配分值w
主题得分
。如果w
主题得分
大于等于给定的相关分值w
限定分值
,则计入集合s
得分集合

55.2)“设备编码”字段符合该堆型的设备编码规则
56.如果输入的设备编码符合该堆型的设备编码规则,通过以下规则进行匹配:外部事件信息的“涉及设备”字段,与输入的质量缺陷报告的“设备编码”字段进行完全匹配,相等则获得相关的设备编码分数。如果不相等,将两边设备编码去机组号后再完全匹配,相等则获得相关的设备编码分数。如果不相等,将两边设备编码提取系统代码 设备编号后再完全匹配,相等则获得相关的设备编码分数。如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数。
57.如果以上规则都不成立,使用正则表达式提取外部事件报告的“主题”字段中的相关设备编码,与输入的质量缺陷报告的“设备编码”字段进行完全匹配,相等则获得相关的设备编码分数。如果不相等,将两边设备编码去机组号后再完全匹配,相等则获得相关的设
备编码分数。如果不相等,将两边设备编码提取系统代码 设备编号后再完全匹配,相等则获得相关的设备编码分数。如果不相等,将两边设备编码提取系统代码后再完全匹配,相等则获得相关的设备编码分数。
58.步骤2:核电专业语义相似度计算规则
59.在采用堆型和设备编码类型匹配的基础上,引入核电专业分词语义相似度匹配方法,达到更高的精确度。基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(dag)。动态规划查找最大概率路径,找出基于词频的最大切分组合。采用了基于汉字成词能力的hmm模型,调用了viterbi算法得到分词结果。根据分词结果调用余弦相似度算法获得相似度值。
60.步骤3:各堆型的设备编码与语义相似度分值计算
61.1)质量缺陷报告属于cnp300、candu
62.a)设备编码分值为wa,若质量缺陷报告“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段全部一致(一对多,同一设备)时,wa取最大分值,如果不一致,判断上述编码去掉第一位机组号后比较是否一致(堆型cnp300除外)。如果一致,设备编码分值wa=0.9wa。如果不一致,判断质量缺陷报告是否属于candu,如果是则判断上述设备编码中包含的系统编码、设备(工作项)编码是否一致(candu设备编码规则示例:pylq-lqs-01-tpc,其中pylq为系统,lqs-01为设备(工作项)编码),如果一致,设备编码分值wa=0.8wa。如果不一致,设备编码分值wa=0。然后考虑质量缺陷报告中的“qdr主题”字段与外部事件信息中的“事件标题”字段进行自然语言语义相似度匹配(剔除设备编码与干扰符号),对相似度的打分进行归一化。最高分值wb。匹配的总得分w
设备 主题得分
=wa wb,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

63.b)若质量缺陷报告的“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段按照上述规则都不一致,用缺陷报告数据qdr中的“qdr主题”、“设备名称”、“初步原因分析”字段与外部事件信息(国外)中的“事件标题”、“事件概要”、“事件描述英文”字段进行自然语言语义相似度匹配(剔除设备编码与干扰符号),对相似度的打分进行归一化,匹配的总得分we,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

64.2)质量缺陷报告属于cnp-600、cnp-1000、hpr1000、cpr-1000
65.设备编码分值为wa,若质量缺陷报告“设备编码”字段与外部事件信息的“事件标题”、“事件概要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段全部一致(一对多,同一设备)时,wa取最大分值,如果不一致,判断上述编码去掉第一位机组号后比较是否一致。如果一致,设备编码分值wa=0.9wa。如果是则判断上述系统编码中包含的系统编码是否一致(去掉设备编码中的数字),如果一致,设备编码分值wa=0.8wa。如果不一致,设备编码分值wa=0。然后考虑质量缺陷报告中的“qdr主题”字段与外部事件信息中的“事件标题”字段进行自然语言语义相似度匹配(剔除设备编码与干扰符号),对相似度的打分进行归一化。最高分值wb。匹配的总得分w
设备 主题得分
=wa wb,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

66.3)若质量缺陷报告的“设备编码”字段与外部事件信息的“事件标题”、“事件概
要”、“事件描述英文”按该数据对应电厂的设备编码规则提取的设备编码字段按照上述规则都不一致。
67.用缺陷报告数据qdr中的“qdr主题”、“设备名称”、“初步原因分析”字段与外部事件信息(国外)中的“事件标题”、“事件概要”、“事件描述英文”字段进行自然语言语义相似度匹配(剔除设备编码与干扰符号),对相似度的打分进行归一化,匹配的总得分we,只推送总得分在给定的相关分值w
限定分值
及以上分数的数据计入集合s
得分集合

68.步骤4:修正因子处理,增强经验反馈数据的准确性
69.对关键的数据进行加分处理,比如,质量缺陷报告相匹配的外部事件信息s
得分集合
中的分值相同的外部事件信息的“ines分级”字段。
70.如果有得分相同的情况,则判断外部事件信息中的“ines分级”字段,为n则额外增加wi*n分。
71.如果有得分相同的情况,则判断外部事件信息数据中的“直接原因”和“根本原因”字段,都不为空(不考虑“无”字),则加d分。
72.如果有得分相同的情况,外部事件信息的“事件标题”与质量缺陷报告中“qdr主题”可语义匹配到如下关键字时,匹配到任一关键词并且相同,增加一定的优先推送分值,比如关键字为:“巡检”、“高处作业”、“淹溺”、“焊接”、“射线”、“rt”、“探伤”、“腐蚀检查”、“脚手架”、“超声检查”、“射线检查”、“电焊”,“气割”,“砂轮打磨切割”、“研磨”,“烘烤”、“氩弧焊”、“气焊”、“在役检查”等。如匹配上,则推荐度分数相同的情况下优先推送。
73.步骤5:智能推荐
74.根据以上匹配规则,将质量缺陷报告对应外部事件信息的每个s
得分集合
,按照分值从高到低的顺序进行推荐。根据业务规则和相似度计算方法,调整各分数之间的比重,统计数据之间的相似度、准确率、匹配率,得出最佳匹配结果,实现精准推送功能。
75.本发明的一种核电厂质量缺陷报告与外部事件信息的精准匹配方法,该方法可以为核电厂提供一种量化技术手段,实现外部事件信息这一经验反馈案例的精准推送,促进经验反馈信息得到有效的利用。所涉及的自然语言处理相似度匹配中的语义相似度方法基于核电专业词库对匹配数据进行分词,对分词结果向量化(特征工程),然后对这两个向量进行相似度计算,计算得到的数值越大,表示相似度越高,反之,相似度越低。最后通过业务数据得分和语义相似度匹配得分形成最终的权重分值,按照权重分值从高到低顺序进行自动推送。
当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图