文本的正则表达式模式

时间:2019-03-25 06:36:50

标签: python python-3.x nsregularexpression

我正在寻找RE模式以提取文本的这一部分:

お疲れ様です。Sidebooksのサービス側で、回線障害が発生しておりまして、復旧までに暫く時間がかかりそうです。復旧次第、こちらで共有いたします。

从这里:

text': 'お疲れ様です。\nSidebooksのサービス側で、回線障害が発生しておりまして、復旧までに暫く時間がかかりそうです。\n復旧次第、こちらで共有いたします。', 'thread_ts': '1547522930.043100', 'ts': '1547522930.043100

里面有日语字符和字母。 我已经在行的开头和结尾尝试过此方法,但是它不起作用...

pattern = r"\A:\s'\Z',"

1 个答案:

答案 0 :(得分:0)

假设JSON是包含text的对象的列表,如注释中所列:

import json
with open('file.json') as r:
    data = json.load(r)
texts = [item['text'].replace('\n', '') for item in data if 'text' in item]