版本: Python 3.4.3
嗨,我正在尝试创建一个脚本,该脚本从html文件中的某些选项中读取可用选项,并创建一个包含所有可能选项的数据库,根据它们的值为它们分配唯一ID。
这是html的结构:
<select id="perforar" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)">
<option value="g1">sin perforacion</option>
<option value="g2">1 Linea de perforación</option>
<option value="g3">2 Lineas de perforación</option>
<option value="g4">3 Lineas de perforación</option>
<option value="g5">4 Lineas de perforación</option>
<option value="g6">5 Lineas de perforación</option>
<option value="g7">6 Lineas de perforación</option>
</select></td>
</tr><tr><td>Ennoblecimiento: </td><td>
<select id="ennoblecimiento" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)">
<option value="h1">sin ennoblecimiento</option>
<option value="h2">barniz UV</option>
<option value="h3">laminado</option>
</select></td>
</tr><tr><td>Plegado: </td><td>
<select id="plegado" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)">
<option value="i1">plegado envolvente</option>
<option value="i2">plegado en acordéon</option>
<option value="i3">plegado en ventana</option>
我手动将所有内容复制/粘贴到.txt中,然后运行此代码:
#load file into buffer
leyendo = open("generadorbasedatos.txt", 'r')
archivotxt = leyendo.read()
leyendo.close()
#split it for lines
listadividida = []
listadividida= archivotxt.split("\n")
#create a dict for later
basededatos = {}
#for each line
for i in listadividida:
if not "<option" in i: #if isn't an option, delete that line
i = ""
else: #if it's an option, get the value and the text
#the text
desde = '>'
hasta = '<'
_,_,resto = i.partition(desde)
opcion,_,_ = resto.partition(hasta)
#the value
desde = 'value="'
hasta = '">'
_,_,resto = i.partition(desde)
laid,_,_ = resto.partition(hasta)
#add them to a dict
basededatos[laid] = [opcion, laid]
#And this is where I'm lost and I need help
print(basededatos)
现在出现问题,我希望脚本创建所有可能组合的列表,并使用值创建每个组合的ID来创建ID,因此输出应如下所示:
g1h1i1: [1 Linea de perforación, Sin ennoblecimiento, plegado envolvente]
g1h1i2: [1 Linea de perforación, Sin ennoblecimiento, plegado en acordeón]
g1h1i3: [1 Linea de perforación, Sin ennoblecimiento, plegado en ventana]
g1h2i1: [1 Linea de perforación, barniz, plegado envolvente]
g1h2i2: [1 Linea de perforación, barniz, plegado plegado en acordeón]
g1h3i3: [1 Linea de perforación, barniz, plegado en ventana]
最终所有可能的组合。我尝试使用itertools并以某种方式设法冻结我的计算机(可能是由于内存不足或无限循环问题)所以现在我在这里问。
达到我想做的最佳方式是什么?
注意:有超过12个选项,这里仅复制/粘贴3个选项,但代码应该能够创建超过3个选择的所有组合。
答案 0 :(得分:0)
从您的观点来看,这可以实现您的目标:
from itertools import product
base={'g':[],'h':[],'i':[]}
for (key,value) in basededatos.items(): base[key[0]].append(value) # to split the fields.
products=product(*base.values()) #make all combinations
finaldict={ "".join([p[1] for p in t]) : [p[0] for p in t] for t in products }
# formatting in a dictionnary.
一些值:
In [263]: base
Out[263]:
{'g': [['1 Linea de perforación', 'g2'],
['4 Lineas de perforación', 'g5'],
['2 Lineas de perforación', 'g3'],
....,
'h': [['laminado', 'h3'], ['barniz UV', 'h2'], ['sin ennoblecimiento', 'h1']],
'i': [['plegado en ventana', 'i3'],
['plegado en acordéon', 'i2'],
....]}
In [265]: finaldict
Out[265]:
{'g1h3i2': ['sin perforacion', 'laminado', 'plegado en acordéon'],
'g7h2i1': ['6 Lineas de perforación', 'barniz UV', 'plegado envolvente'],
'g2h3i3': ['1 Linea de perforación', 'laminado', 'plegado en ventana'],....