我正在尝试从文本文件中提取文本,但要收集的文本长度各不相同。这是我第一次使用RegEx并可以使用一些sugestions
这是源文本。我正在尝试提取.parse Name,Email,Birthdat&仅限电话号码。任何帮助将不胜感激。
Basic data
</td><td align="left" width="10" style="padding:0; margin:0;"> </td><td align="left" width="290" style="padding:0;"> </td></tr><tr><td align="right" width="250" style="padding-bottom:8px; margin:0; color: #555555; font-family: Arial, Helvetica, sans-serif; font-size:14px;">
Name:
</td><td align="left" width="10" style="padding:0; margin:0;"> </td><td align="left" width="290" style="color: #262626; padding-bottom:8px ; font-family: Arial, Helvetica, sans-serif; font-size:14px;">Test User3</td></tr><tr><td align="right" width="250" style="padding-bottom:8px; margin:0; color: #555555; font-family: Arial, Helvetica, sans-serif; font-size:14px;">
Email:
</td><td align="left" width="10" style="padding:0; margin:0;"> </td><td align="left" width="290" style="color: #262626; padding-bottom:8px ; font-family: Arial, Helvetica, sans-serif; font-size:14px;"><span style="color: #262626; text-decoration:none;">testuser3@busystreet.com</span></td></tr><tr><td align="center" colspan="3" height="20" width="100%" style="color: #262626; padding:0; margin:0; line-height:20px;"> </td></tr><tr><td align="right" width="250" style="padding-bottom:8px; margin:0; color: #002a5c; font-family: Arial, Helvetica, sans-serif; font-size:14px;">
Custom data
</td><td align="left" width="10" style="padding:0; margin:0;"> </td><td align="left" width="290" style="padding:0;"> </td></tr><tr><td align="right" width="250" style="padding-bottom:8px; margin:0; color: #555555; font-family: Arial, Helvetica, sans-serif; font-size:14px;">ref:
</td><td align="left" width="10" style="padding:0; margin:0;"> </td><td align="left" width="290" style="color: #262626; padding-bottom:8px ; font-family: Arial, Helvetica, sans-serif; font-size:14px;">06/16/1963</td></tr><tr><td align="right" width="250" style="padding-bottom:8px; margin:0; color: #555555; font-family: Arial, Helvetica, sans-serif; font-size:14px;">cellphone:
</td><td align="left" width="10" style="padding:0; margin:0;"> </td><td align="left" width="290" style="color: #262626; padding-bottom:8px ; font-family: Arial, Helvetica, sans-serif; font-size:14px;">6152498588</td></tr><tr><td align="center" colspan="3" height="20" width="100%" style="color: #262626; padding:0; margin:0; line-height:20px;"> </td></tr><tr><td align="right" width="250" style="padding-bottom:8px; margin:0; color: #002a5c; font-family: Arial, Helvetica, sans-serif; font-size:14px;">
提前完成,
道格
答案 0 :(得分:2)
请改用HTML Agility Pack。使用正则表达式解析HTML是一件坏事,除非是非常具体的情况。
答案 1 :(得分:0)
最好使用SimpleXML而不是正则表达式来解析HTML!