我有一个从文本文件导入的字符串,其中包含以下内容
code: input_file.open("text_file.txt", 'r')
text = input_file.read()
input_file.close()
现在我的问题是字符串将介于1-999之间。我需要在每10个字母之后以某种方式有一个空格,并且每60个字母都有一个新行。
目前我尝试过使用:
def insertNewLines(text, lineLength):
if len(text) <= lineLength:
return text
else:
return text[:60] + ' '.join(text[i:i+10] for i in range(0,len(text),10)) + insertNewLines(text[60:],60)
我想要做的是从文本文件中导入一系列字母(1-999),然后使用python将序列导入HTML文件,然后使用导入的序列颜色编码/编号/编写HTML文件拆分并以可查看的格式。 我已经让HTML文件正常工作了,但是我不能让文字在10个字母之后留出空格,并且每隔60个字母就有一个新行。
这是我目前的尝试like。
答案 0 :(得分:1)
您可以使用join
并使用nth
逐步执行每个range
字符来完成此操作。按照您希望的方式拆分文本后,您可以将其拆分为\n
,然后在每行之间插入p
元素。
f = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ' * 35 #this generates a 910 character string
def break_apart(sep, step):
return sep.join(f[n:n + step] for n in range(0, len(f), step))
f = break_apart(' ', 10)
f = break_apart('\n', 60)
p = '<p>1 10 20 30 40 50 60</p>'
fp = '\n'.join(j for i in f.split('\n') for j in [p, i])
html = '<div>{}</div>'.format(fp)
print(html)
<div>
<p>1 10 20 30 40 50 60<p>
ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTUVWX YZABC
<p>1 10 20 30 40 50 60<p>
DEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV WXYZABCDEF
<p>1 10 20 30 40 50 60<p>
GHIJKLMNOP QRSTUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGH
<p>1 10 20 30 40 50 60<p>
IJKLMN OPQRSTUVWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJK
<p>1 10 20 30 40 50 60<p>
L MNOPQRSTUV WXYZABCDEF GHIJKLMNOP QRSTUVWXYZ ABCDEFGHIJ KLM
<p>1 10 20 30 40 50 60<p>
NOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTUVWX YZABCDEFGH IJKLMNOP
<p>1 10 20 30 40 50 60<p>
QR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV WXYZABCDEF GHIJKLMNOP QR
<p>1 10 20 30 40 50 60<p>
STUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTU
<p>1 10 20 30 40 50 60<p>
VWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV W
<p>1 10 20 30 40 50 60<p>
XYZABCDEF GHIJKLMNOP QRSTUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZ
<p>1 10 20 30 40 50 60<p>
ABCD EFGHIJKLMN OPQRSTUVWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB
<p>1 10 20 30 40 50 60<p>
CDEFGHIJKL MNOPQRSTUV WXYZABCDEF GHIJKLMNOP QRSTUVWXYZ ABCDE
<p>1 10 20 30 40 50 60<p>
FGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTUVWX YZABCDEFGH
<p>1 10 20 30 40 50 60<p>
IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV WXYZABCDEF GHIJ
<p>1 10 20 30 40 50 60<p>
KLMNOP QRSTUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLM
<p>1 10 20 30 40 50 60<p>
N OPQRSTUVWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNO
<p>1 10 20 30 40 50 60<p>
PQRSTUV WXYZABCDEF GHIJKLMNOP QRSTUVWXYZ
</div>
答案 1 :(得分:0)
我假设你的'text_file'中有Newlines,逐行阅读。
text = []
# My Sample Text files are utf-8 encoded
with io.open( 'text_file.txt','r', encoding='utf8') as fh:
for row,line in enumerate(fh,1):
text.append(line)
#end for
#end with = closing fh
使用Python测试:3.4.2
答案 2 :(得分:0)
假设一致的文本字符串作为输入:
import string
import random
text = ''
for i in range(16):
text += random.choice(string.ascii_lowercase)*10
def insert_new_lines(input_string):
output = []
for i in range(0, len(text), 60):
output.append(' '.join([text[j:j+10] for j in range(i, i+60, 10)]))
return '\n'.join(output)
print insert_new_lines(text)
返回,使用随机字母作为示例:
ssssssssss mmmmmmmmmm mmmmmmmmmm wwwwwwwwww zzzzzzzzzz aaaaaaaaaa
llllllllll llllllllll ffffffffff rrrrrrrrrr cccccccccc nnnnnnnnnn
rrrrrrrrrr xxxxxxxxxx uuuuuuuuuu qqqqqqqqqq