如何拆分由项目符号

时间:2015-05-18 12:55:30

标签: python mysql bash

我正在尝试拆分一个包含多个段落的大文件,每个段落的长度可变,唯一的分隔符将是下一段的子弹点......

有没有办法在每个段落中获得几个不同的文件? 最后一件事是将每个段落写入MySQL DB ......

示例输入:

  • Lorem ipsum dolor sit amet,consectetur adipiscing elit,sed do eiusmod tempor incididunt ut labore et dolore magna aliqua。 Ut enim ad minim veniam,quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat。

  • Duis aute irure dolor in repreptderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur。 Excepteur sint occaecat cupidatat non proident,sunt in culpa qui officia deserunt mollit anim id est laborum。“

输出:每个段落都是DB中的单独条目

2 个答案:

答案 0 :(得分:3)

这是按子弹点分割文件的方式:

new_files = open(source_file).read().split(u'\u2022')
for par in new_files:
  open("%s.txt"%new_files.index(par),"w").write("%s"%par) 
  LOAD DATA INFILE "%s.txt"%new_files.index(par) INTO TABLE your_DB_name.your_table; 

答案 1 :(得分:0)

这符合mysql DB并读取文件并在每个项目符号点拆分并将数据插入mysql DB表

我的代码:

#Server Connection to MySQL:

import MySQLdb
conn = MySQLdb.connect(host= "localhost",
              user="root",
              passwd="newpassword",
              db="db")
x = conn.cursor()

try:
    file_data = open("FILE_NAME_WITH_EXTENSION").read().split(u'\u2022')
    for text in file_data:
        print text
        x.execute("""INSERT INTO TABLE_NAME VALUES (%s)""",(text))
        conn.commit()
except:
    conn.rollback()

conn.close()