我正在阅读与Recurrent Neural Network for Natural Language Processing相关的博客文章,并试图重新创建实践代码。该示例代码使用一种方法来读取名为file().read()
的.txt文件。我不熟悉此方法,并且想知道它是否包含在可导入模块中,或者至少包含在返回的内容中,所以我可以使用不同的代码重新创建该方法。
我确实尝试替换了with open(filename) as f
,但是它没有返回与file().read()
方法似乎相同的格式的数据。如果您要查找特定的结果,“文件”对Google来说不是最简单的名词!
def train_char_lm(fname, order=4):
data = file(fname).read()
lm = defaultdict(Counter)
pad = "~" * order
data = pad + data
for i in xrange(len(data)-order):
history, char = data[i:i+order], data[i+order]
lm[history][char]+=1
def normalize(counter):
s = float(sum(counter.values()))
return [(c,cnt/s) for c,cnt in counter.iteritems()]
outlm = {hist:normalize(chars) for hist, chars in lm.iteritems()}
return outlm
答案 0 :(得分:0)
输入
help(file)
进入IDLE解释器产量
Help on class file in module __builtin__:
为您提供其他有用的信息。它是内置模块的一部分。