我正在参加其中一个Code Golf比赛,其中文件越小越好。
我正在寻找一个程序或网站,它将取一个文件,删除所有空格(包括新行)并返回该文件的紧凑版本,而不是手动删除所有空格等。有什么想法吗?
答案 0 :(得分:8)
您可以使用:
sed 's/\s\s+/ /g' youfile > yourpackedfile`
你甚至可以用PHP做到这一点(生活多么奇妙):
$data = file_get_contents('foobar.php');
$data = preg_replace('/\s\s+/', ' ', $data);
file_put_contents('foobar2.php', $data);
您必须注意,这不会处理像$bar = ' asd aa a';
这样的字符串变量,这可能是一个问题,具体取决于您正在做什么。在线工具似乎正确处理了这个问题。
答案 1 :(得分:2)
$ tr -d ' \n' <oldfile >newfile
答案 2 :(得分:1)
在PowerShell(v2)中,可以使用以下小代码片段完成此操作:
(-join(gc my_file))-replace"\s"
或更长时间:
(-join (Get-Content my_file)) -replace "\s"
它将所有行连接在一起并删除所有空格和标签。
但是,对于某些语言,您可能不希望这样做。例如,在PowerShell中,除非在一行上放置多个语句,否则不需要分号,因此像
这样的代码while (1) {
"Hello World"
$x++
}
会变成
while(1){"HelloWorld"$x++}
天真地应用上述陈述时。它既改变了程序的含义,也改变了程序的语法正确性。在数值高尔夫解决方案中可能没有太多要注意但是线条连接在一起的问题仍然存在,遗憾的是。在每一行之间加一个分号实际上也没有用。
答案 3 :(得分:1)
这是一个可以为您完成工作的PHP函数:
function compress_php_src($src) {
// Whitespaces left and right from this signs can be ignored
static $IW = array(
T_CONCAT_EQUAL, // .=
T_DOUBLE_ARROW, // =>
T_BOOLEAN_AND, // &&
T_BOOLEAN_OR, // ||
T_IS_EQUAL, // ==
T_IS_NOT_EQUAL, // != or <>
T_IS_SMALLER_OR_EQUAL, // <=
T_IS_GREATER_OR_EQUAL, // >=
T_INC, // ++
T_DEC, // --
T_PLUS_EQUAL, // +=
T_MINUS_EQUAL, // -=
T_MUL_EQUAL, // *=
T_DIV_EQUAL, // /=
T_IS_IDENTICAL, // ===
T_IS_NOT_IDENTICAL, // !==
T_DOUBLE_COLON, // ::
T_PAAMAYIM_NEKUDOTAYIM, // ::
T_OBJECT_OPERATOR, // ->
T_DOLLAR_OPEN_CURLY_BRACES, // ${
T_AND_EQUAL, // &=
T_MOD_EQUAL, // %=
T_XOR_EQUAL, // ^=
T_OR_EQUAL, // |=
T_SL, // <<
T_SR, // >>
T_SL_EQUAL, // <<=
T_SR_EQUAL, // >>=
);
if(is_file($src)) {
if(!$src = file_get_contents($src)) {
return false;
}
}
$tokens = token_get_all($src);
$new = "";
$c = sizeof($tokens);
$iw = false; // Ignore whitespace
$ih = false; // In HEREDOC
$ls = ""; // Last sign
$ot = null; // Open tag
for($i = 0; $i < $c; $i++) {
$token = $tokens[$i];
if(is_array($token)) {
list($tn, $ts) = $token; // tokens: number, string, line
$tname = token_name($tn);
if($tn == T_INLINE_HTML) {
$new .= $ts;
$iw = false;
}
else {
if($tn == T_OPEN_TAG) {
if(strpos($ts, " ") || strpos($ts, "\n") || strpos($ts, "\t") || strpos($ts, "\r")) {
$ts = rtrim($ts);
}
$ts .= " ";
$new .= $ts;
$ot = T_OPEN_TAG;
$iw = true;
} elseif($tn == T_OPEN_TAG_WITH_ECHO) {
$new .= $ts;
$ot = T_OPEN_TAG_WITH_ECHO;
$iw = true;
} elseif($tn == T_CLOSE_TAG) {
if($ot == T_OPEN_TAG_WITH_ECHO) {
$new = rtrim($new, "; ");
} else {
$ts = " ".$ts;
}
$new .= $ts;
$ot = null;
$iw = false;
} elseif(in_array($tn, $IW)) {
$new .= $ts;
$iw = true;
} elseif($tn == T_CONSTANT_ENCAPSED_STRING
|| $tn == T_ENCAPSED_AND_WHITESPACE)
{
if($ts[0] == '"') {
$ts = addcslashes($ts, "\n\t\r");
}
$new .= $ts;
$iw = true;
} elseif($tn == T_WHITESPACE) {
$nt = @$tokens[$i+1];
if(!$iw && (!is_string($nt) || $nt == '$') && !in_array($nt[0], $IW)) {
$new .= " ";
}
$iw = false;
} elseif($tn == T_START_HEREDOC) {
$new .= "<<<S\n";
$iw = false;
$ih = true; // in HEREDOC
} elseif($tn == T_END_HEREDOC) {
$new .= "S;";
$iw = true;
$ih = false; // in HEREDOC
for($j = $i+1; $j < $c; $j++) {
if(is_string($tokens[$j]) && $tokens[$j] == ";") {
$i = $j;
break;
} else if($tokens[$j][0] == T_CLOSE_TAG) {
break;
}
}
} elseif($tn == T_COMMENT || $tn == T_DOC_COMMENT) {
$iw = true;
} else {
if(!$ih) {
$ts = strtolower($ts);
}
$new .= $ts;
$iw = false;
}
}
$ls = "";
}
else {
if(($token != ";" && $token != ":") || $ls != $token) {
$new .= $token;
$ls = $token;
}
$iw = true;
}
}
return $new;
}
// This is an example
$src = file_get_contents('foobar.php');
file_put_contents('foobar3.php',compress_php_src($src));
答案 4 :(得分:0)
如果您的代码编辑器程序支持regular expressions,您可以尝试:
Find this: [\r\n]{2,}
Replace with this: \n
Then Replace All
答案 5 :(得分:0)
Notepad++是一个非常好的编辑器,它有很多预定义的宏,修剪代码并删除它们之间的空白。
它可以做正则表达式,并且有很多功能可以帮助代码黑客或脚本小家伙。
答案 6 :(得分:0)
在其上运行php -w
!
php -w myfile.php
与正则表达式不同,它足够聪明,可以单独保留字符串,并且它也会删除注释。