从字符串中提取键和值

时间:2016-12-19 15:22:27

标签: python regex split

这可能很容易,但我觉得我做错了。 假设我有以下字符串:

user: bob status: married age:45

现在我想将其分解为:

user = 'bob'
status ='married'
age = 45

目前我正在做很多肮脏的分裂工作,但是使用Regex需要更好的Pythonic方式。 这是我的所作所为:

full_text = 'user: bob status: married age:45'
type = 'user'        
cut_string = full_text_string.split(type + ":", 1)[1].split(" ")[0]

谢谢!

3 个答案:

答案 0 :(得分:3)

这是我的解决方案。正则表达式:(\w+)\s*:\s*((?:\w+\b\s*)+)(?!\s*:)

<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
package="com.example.minecraft_pc.test">
<uses-permission android:name="android.permission.INTERNET" />
<application
    android:allowBackup="true"
    android:icon="@mipmap/ic_launcher"
    android:label="@string/app_name"
    android:supportsRtl="true"
    android:theme="@android:style/Theme.NoTitleBar.Fullscreen">
    <activity
        android:name=".FullscreenActivity"
        android:configChanges="orientation|keyboardHidden|screenSize"
        android:label="@string/app_name"
        android:theme="@style/FullscreenTheme">
        <intent-filter>
            <action android:name="android.intent.action.MAIN" />

            <category android:name="android.intent.category.LAUNCHER" />
        </intent-filter>
    </activity>
</application>
</manifest>

打印

import re 

s = 'user: bob status: married with children age:45'

pat = re.compile(r'(\w+)\s*:\s*((?:\w+\b\s*)+)(?!\s*:)')

print(pat.findall(s))

然后,您可以使用类似[('user', 'bob '), ('status', 'married with children '), ('age', '45')] 的内容来获取正确的类型

答案 1 :(得分:0)

re.findall(r'(?:([0-9a-zA-Z]+): ?([0-9a-zA-Z]+))+',s)

这将回馈:[('user', 'bob'), ('status', 'married'), ('age', '45')]

第一组是非捕获组,这意味着它不会出现在findall的结果中。

[0-9a-z-A-Z]部分相当于\w

答案 2 :(得分:0)

对于我们这些可以避免正则表达式的人:

>>> full_text='user: bob status: married age:45'
>>> alt_text = full_text.replace(':',' ').split()
>>> print alt_text[0],"=",alt_text[1]
>>> print alt_text[2],"=",alt_text[3]
>>> print alt_text[4],"=",alt_text[5]
user = bob
status = married
age = 45

如果您在age:45之间留出空格,则不必使用replace只需full_text.split()即可。