每个第n个字符

时间:2017-02-13 15:11:56

标签: python

我有一个从文本文件导入的字符串,其中包含以下内容

code: input_file.open("text_file.txt", 'r')
text = input_file.read()
input_file.close()

现在我的问题是字符串将介于1-999之间。我需要在每10个字母之后以某种方式有一个空格,并且每60个字母都有一个新行。

目前我尝试过使用:

def insertNewLines(text, lineLength):
  if len(text) <= lineLength:
     return text
  else:
     return text[:60] + ' '.join(text[i:i+10] for i in range(0,len(text),10)) + insertNewLines(text[60:],60)

我想要做的是从文本文件中导入一系列字母(1-999),然后使用python将序列导入HTML文件,然后使用导入的序列颜色编码/编号/编写HTML文件拆分并以可查看的格式。 我已经让HTML文件正常工作了,但是我不能让文字在10个字母之后留出空格,并且每隔60个字母就有一个新行。

这是我目前的尝试like

3 个答案:

答案 0 :(得分:1)

您可以使用join并使用nth逐步执行每个range字符来完成此操作。按照您希望的方式拆分文本后,您可以将其拆分为\n,然后在每行之间插入p元素。

f = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ' * 35 #this generates a 910 character string

def break_apart(sep, step):
    return sep.join(f[n:n + step] for n in range(0, len(f), step))


f = break_apart(' ', 10)
f = break_apart('\n', 60)    

p = '<p>1 10 20 30 40 50 60</p>'
fp = '\n'.join(j for i in f.split('\n') for j in [p, i])

html = '<div>{}</div>'.format(fp)

print(html)

<div>
<p>1 10 20 30 40 50 60<p>
ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTUVWX YZABC
<p>1 10 20 30 40 50 60<p>
DEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV WXYZABCDEF
<p>1 10 20 30 40 50 60<p>
 GHIJKLMNOP QRSTUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGH
<p>1 10 20 30 40 50 60<p>
IJKLMN OPQRSTUVWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJK
<p>1 10 20 30 40 50 60<p>
L MNOPQRSTUV WXYZABCDEF GHIJKLMNOP QRSTUVWXYZ ABCDEFGHIJ KLM
<p>1 10 20 30 40 50 60<p>
NOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTUVWX YZABCDEFGH IJKLMNOP
<p>1 10 20 30 40 50 60<p>
QR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV WXYZABCDEF GHIJKLMNOP QR
<p>1 10 20 30 40 50 60<p>
STUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTU
<p>1 10 20 30 40 50 60<p>
VWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV W
<p>1 10 20 30 40 50 60<p>
XYZABCDEF GHIJKLMNOP QRSTUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZ
<p>1 10 20 30 40 50 60<p>
ABCD EFGHIJKLMN OPQRSTUVWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB 
<p>1 10 20 30 40 50 60<p>
CDEFGHIJKL MNOPQRSTUV WXYZABCDEF GHIJKLMNOP QRSTUVWXYZ ABCDE
<p>1 10 20 30 40 50 60<p>
FGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLMN OPQRSTUVWX YZABCDEFGH
<p>1 10 20 30 40 50 60<p>
 IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNOPQRSTUV WXYZABCDEF GHIJ
<p>1 10 20 30 40 50 60<p>
KLMNOP QRSTUVWXYZ ABCDEFGHIJ KLMNOPQRST UVWXYZABCD EFGHIJKLM
<p>1 10 20 30 40 50 60<p>
N OPQRSTUVWX YZABCDEFGH IJKLMNOPQR STUVWXYZAB CDEFGHIJKL MNO
<p>1 10 20 30 40 50 60<p>
PQRSTUV WXYZABCDEF GHIJKLMNOP QRSTUVWXYZ
</div>

答案 1 :(得分:0)

我假设你的'text_file'中有Newlines,逐行阅读。

  text = []
  # My Sample Text files are utf-8 encoded
  with io.open( 'text_file.txt','r', encoding='utf8') as fh:
    for row,line in enumerate(fh,1):
      text.append(line)
    #end for
  #end with = closing fh

使用Python测试:3.4.2

答案 2 :(得分:0)

假设一致的文本字符串作为输入:

import string
import random


text = ''
for i in range(16):
    text += random.choice(string.ascii_lowercase)*10

def insert_new_lines(input_string):
    output = []
    for i in range(0, len(text), 60):
        output.append(' '.join([text[j:j+10] for j in range(i, i+60, 10)]))
    return '\n'.join(output)


print insert_new_lines(text)

返回,使用随机字母作为示例:

ssssssssss mmmmmmmmmm mmmmmmmmmm wwwwwwwwww zzzzzzzzzz aaaaaaaaaa
llllllllll llllllllll ffffffffff rrrrrrrrrr cccccccccc nnnnnnnnnn
rrrrrrrrrr xxxxxxxxxx uuuuuuuuuu qqqqqqqqqq