你好,我想在基巴纳脚本字段中使用正则表达式获取日志消息的子字符串。我遇到了一个有趣的场景,但没有加起来。我将消息字段转换为关键字,以便可以对其执行脚本化的字段操作。
当我与以下条件匹配时:
if (doc['message'].value =~ /(\b(?:\d{1,3}\.){3}\d{1,3}\b)/) {
return "match"
} else {
return "no match"
}
这将匹配ip,并正确返回消息中有一个ip。但是,每当我尝试执行将匹配的文本拆分为子字符串的匹配器功能时,都找不到任何匹配项。
按照Elastic的文档指南进行操作,位于此处: https://www.elastic.co/blog/using-painless-kibana-scripted-fields
这是他们提供的示例脚本,用于匹配日志消息中ip的第一个八位字节。但是,如果日志消息中确实有IP地址,则此方法不返回任何匹配项。无论我做什么,我什至不能匹配仅文本字符,它返回0个匹配项。
我也在集群的elasticsearch.yml中启用了rexex。
def m = /^([0-9]+)\..*$/.matcher(doc['message'].value);
if ( m.matches() ) {
return Integer.parseInt(m.group(1))
} else {
return m.matches() + " - " + doc['message'].value;
}
这将返回0个匹配项。即使我使用与条件相同的表达式:
/(\ b(?:\ d {1,3}。){3} \ d {1,3} \ b)/
匹配器仍将返回false。
任何想法,根据文件的正确性,我在这里做错了什么。
当值存在于if条件中但日志消息之间有很多变化时,我尝试使用subs字符串。如果仅在脚本字段中使用条件,我也看不到一种拆分并浏览输出列表以选择带ip的方法。
关于如何解决此问题的任何想法:
以下是返回表单的示例
def m = /^([0-9]+)\..*$/.matcher(doc['message'].value);
if ( m.matches() ) {
return Integer.parseInt(m.group(1))
} else {
return m.matches() + " - " + doc['message'].value;
}
有趣的是,它们都返回false,这实际上只是在查找带有的数字。而且我已经尝试过各种正则表达式组合,但是都没有运气。
[
{
"_id": "VRYK_2kB0_nHZ_3qyRwt",
"Source-IP": [
"false - #Version: 1.0"
]
},
{
"_id": "VhYK_2kB0_nHZ_3qyRwt",
"Source-IP": [
"false - 2019-02-17 00:34:11 127.0.0.1 GET /status/web - 8611 - 127.0.0.1 ELB-HealthChecker/2.0 - 200 0 0 31"
]
},
{
"_id": "VxYK_2kB0_nHZ_3qyRwt",
"Source-IP": [
"false - #Software: Microsoft Internet Information Services 10.0"
]
},
{
"_id": "WBYK_2kB0_nHZ_3qyRwt",
"Source-IP": [
"false - #Date: 2019-03-26 00:00:08"
]
},
{
"_id": "WRYK_2kB0_nHZ_3qyRwt",
"Source-IP": [
127.0.0.1 ELB-HealthChecker/2.0 - 200 0 0 15"
]
},
{
答案 0 :(得分:0)
最终如下:
if (doc["message"].value != null) {
def m = /(\b(?:\d{1,3}\.){3}\d{1,3}\b)/.matcher(doc["message"].value);
if (m.find()) { return m.group(1) }
else { return "no match" }
}
else { return "NULL"}