从C#中的文本文件中提取数据

时间:2017-05-30 20:03:54

标签: c# regex

我正在尝试从.txt文件中提取数据。我需要从不同的.txt文件中提取组号,订户ID,名称和地址(您的网络)。

使用flexireader ocr从保险卡中提取文本文件中的数据

sample Text file 1:
---------------------
Subscriber ID: AH0002305 
PAUL KELLERMAN
Medical plan: PPO 
Group number: L16788344 
Allied 
Pharmacy benefit: CVS Caremark 
RXBIN: 004336 
RXPCN: ADV 
RXGRP: RX4219 
ORX mail order: 
855.566.8393 
Pharmacy help desk: 
800.364.6331 
a remark.com 

Sample Text file 2:
----------------------
 • 
'11, • 
cStarmark 
A Morn, a k ompam 
Employee 
Member: JOHN ABRUZZ 
ID: 3780-1290 Mem Eff: 09/01/2016 
Group ID: MF873078E 
Employer: MINDFLOW 
INC 
Copay: OV $40 \ UC $85 \ ER $500 
Ded: $3000 \ $6000 Fam Ded: $6000 \ $12000 
Coins: 80% \ 60% 
Claims Submission 
Aetna partopa ing 
EDI: 61425 
Mail: Starmark 
P.O. Box 2942 
Clinton, IA 52733-2942 
• • t. doctors and hospitals are independent 
providers and are neither agents nor employees of Aetna. 
Self-funded Plan Administered by Starmark 
llr 
Pharmacy Vendor 
CVS/caremark 
877-876-7217 
RxID: 32149890C 
RxBIN: 004336 
RxPCN: ADV 
RxGRP: RX0022 
ISSUER: 80840 
Ded: $0 Copay: $15 \ $45 \ $75 
Medical PPO Network 
Aetna Signature 
Administrators' PPO 
By aetna 
To locate a PPO provider: 
 www.aetna.com/asa 
 800-522-1246 

对我来说主要的问题是,在一个文件中它是订户ID,其他文件被提及为会员ID,我怎么能认为它们是相同的,任何人都可以帮助我。我是实习开发人员,我对C#没有太多经验。

我尝试了这段代码,但它与模式匹配

    class Program
    {
        static void Main(string[] args)
        {
            string path = @"C:\Users\Kumar\Desktop\Insurance text\Previous.out.txt";
            StringBuilder buffer = new StringBuilder();
            using (StreamReader sr = new StreamReader(path))
            {
                while (sr.Peek() >= 0)
                {
                    String str = sr.ReadLine();
                    if (Regex.IsMatch(str, "Subscriber ID"))
                        buffer.Append(str + "\n");  
                }
            }
            Console.WriteLine(buffer.ToString());
             Console.ReadLine();
    }
}

1 个答案:

答案 0 :(得分:0)

  

在一个文件中是订户ID,其他文件被提及为会员ID,我怎么能认为它们是相同的

可以编写一个映射函数,但是将数据视为id,然后在读入实体之后关联主程序中的数据,并存储这两个变量。 / p>

  

我正在尝试从.txt文件中提取数据。我需要从不同的.txt文件中提取组号,订户ID,名称和地址(您的网络)。

您需要编写两个不同的进程来提取数据。为每一个使用两个不同的正则表达式。