使用sed编辑html

时间:2015-11-03 16:45:41

标签: html linux unix sed

在Linux中,执行以下命令下载" First Monday"文章:

wget -O first_monday.html http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/3156/2747

使用sed和正则表达式编辑first_monday.html,如下所示:

删除空/空白段落(如果有)。 (HTML段落起始标记为<p>,结束标记为</p>

<p>This is some text in a paragraph.</p>

如果在<p></p>

之间没有空格或标签,则段落为空

删除所有图像(在HTML中,图像使用<img>标记定义。例如:

<img src="html5.gif" alt="The official HTML5 Icon">   

生成的文件仍应是有效的HTML文件,可在标准Web浏览器中显示。 要获得答案,请复制/粘贴用于回答此问题的命令。例如,如果您使用类似于

的命令
sed -iback -e 's|<p>[[:space:]]*</p>||g' first_monday.html

然后您将粘贴该命令以及您在此字段的答案中使用的任何其他命令。

1 个答案:

答案 0 :(得分:0)

首先,您可以使用以下命令

删除空段落标记
        $parentId = $post['parrent_product'];
        $values = '';
        foreach ($post['simple_product_id'] as $id) {
            $values .= $id . ',';
        }
        $params = array(
            'product' => $parentId,
            'super_attribute' => array(
                132 => $values, //132 - super_attribute_code, $values - its a string with simple products(options) ids
            ),
            'qty' => $post['qty'],
        );
        $cart = Mage::getSingleton('checkout/cart');
        $product = new Mage_Catalog_Model_Product();
        $product->load($parentId);
        $cart->addProduct($product, $params);
        $cart->save();

接下来,您的图片代码也可以使用命令以相同方式删除,如下所示;

sed -i 's|<p>[[:space:]]*</p>||g' first_monday.html