我有一张带有服务器日志的CSV。我需要将日期/时间格式作为附加图像分割成我的数据表。
CSV txt文件样本
10.115.10.74 - - [20 / Mar / 2016:03:38:14 +0800]“GET /portal/images/banners/iot.jpg HTTP / 1.1”404 918“http://www.utem.edu.my/portal/”“Mozilla /5.0(Windows NT 6.3; WOW64; rv:45.0)Gecko / 20100101 Firefox / 45.0“
172.16.75.219 - [20 / Mar / 2016:03:38:17 +0800]“GET / HTTP / 1.1”200 98“http://192.168.0.1:8090/httpclient.html”“Mozilla / 5.0(Windows NT 10.0; WOW64) AppleWebKit / 537.36(KHTML,与Gecko一样)Chrome / 43.0.2357.124 Safari / 537.36“
我有什么方法可以做到这样的事情吗?
到目前为止我尝试了什么
string[] raw_text = System.IO.File.ReadAllLines("C:\\log4.csv");
string[] data_col = null;
int x = 0;
foreach (string text_line in raw_text)
{
//MessageBox.Show(text_line);
data_col = text_line.Split(' ', '<', '>', '[', ']', '-', '"', ';', '(', ')', '+', ':');
if (x == 1)
{
for (int i = 0; i <= data_col.Count() - 1; i++)
{
my_datatable.Columns.Add(data_col[i]);
}
x++;
}
else
{
my_datatable.Rows.Add(data_col);
}
答案 0 :(得分:1)
检查以下代码。我希望它有所帮助
string[] raw_text = System.IO.File.ReadAllLines("C:\\log4.csv");
string[] data_col = null;
int x = 0;
foreach (string text_line in raw_text)
{
//MessageBox.Show(text_line);
data_col = text_line.Split(' ', '<', '>', '[', ']', '-', '"', ';', '(', ')', '+', ':');
if (x == 1)
{
for (int i = 0; i <= data_col.Count() - 1; i++)
{
my_datatable.Columns.Add(data_col[i]);
my_datatable.Columns.Add(Convert.ToDateTime(data_col[i]).ToString("ddMMMyyyy"));
my_datatable.Columns.Add(Convert.ToDateTime(data_col[i]).ToString("HH:mm tt"));
my_datatable.Columns.Add(Convert.ToDateTime(data_col[i]).ToString("zzz"));
my_datatable.Columns.Add(data_col[i]);
}
x++;
}
else
{
my_datatable.Rows.Add(data_col);
}
答案 1 :(得分:0)
你可以这样做;这是一个骨架。您将需要循环,(或使用linq)来转换日期。使下面的代码成为一个函数,并将日期作为参数传递。
var parts = ("20/Mar/2016:03:38:17 +800").Split(':').ToList();
var datePart = parts[0];
var timePart = parts.Except(new[]{datePart});
var timeString = string.Join(":", timePart);
var time = timeString.Split('+')[0];
var gmt = "+" + timeString.Split('+')[1];
Console.WriteLine(datePart);
Console.WriteLine(time);
Console.WriteLine(gmt);
答案 2 :(得分:0)
我根据您现有的源代码提供了这个答案。根据您的需要进行调整。
从示例日志文件:
10.115.10.74 - - [20/Mar/2016:03:38:14 +0800] "GET /portal/images/banners/iot.jpg HTTP/1.1" 404 918 "http://www.utem.edu.my/portal/" "Mozilla/5.0 (Windows NT 6.3; WOW64; rv:45.0) Gecko/20100101 Firefox/45.0"
172.16.75.219 - - [20/Mar/2016:03:38:17 +0800] "GET / HTTP/1.1" 200 98 "http://192.168.0.1:8090/httpclient.html" "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.124 Safari/537.36"
控制台应用程序:
class Foo
{
public string IPAddress { get; set; }
public string Date { get; set; }
public string Time { get; set; }
public string TimeZone { get; set; }
public string Request { get; set; }
}
class Program
{
static void Main(string[] args)
{
string[] lines = File.ReadAllLines("Log.txt");
DataTable dt = new DataTable();
dt.Columns.Add("IP Address");
dt.Columns.Add("Date");
dt.Columns.Add("Time");
dt.Columns.Add("GMT");
dt.Columns.Add("Method");
foreach(string line in lines)
{
string[] split = line.Split(' ', '<', '>', '[', ']', '-', '"', ';', '(', ')', '+', ':');
split = split.Where(r => !string.IsNullOrWhiteSpace(r)).ToArray();
Foo foo = new Foo();
foo.IPAddress = split[0];
foo.Date = split[1];
foo.Time = string.Format("{0}:{1}:{2}", split[2], split[3], split[4]);
foo.TimeZone = split[5];
foo.Request = split[6];
dt.Rows.Add(foo.IPAddress, foo.Date, foo.Time, foo.TimeZone, foo.Request);
}
foreach(DataRow dr in dt.Rows)
{
Console.WriteLine(string.Format("{0} {1} {2} {3} {4}", dr[0], dr[1], dr[2], dr[3], dr[4]));
}
Console.ReadLine();
}
}