是否有一个catchall函数适用于清理SQL注入和XSS攻击的用户输入,同时仍允许某些类型的html标记?
答案 0 :(得分:1125)
一种常见的误解是可以过滤用户输入。 PHP甚至还有一个(现已弃用的)“功能”,称为魔术引号,它建立在这个想法的基础之上。这是胡说八道。忘记过滤(或清理,或任何人称之为)。
为了避免出现问题,你应该做的很简单:每当你在国外代码中嵌入一个字符串时,你必须根据该语言的规则来逃避它。例如,如果在某些SQL目标MySql中嵌入字符串,则必须为此目的使用MySql函数转义字符串(mysqli_real_escape_string
)。 (或者,对于数据库,在可能的情况下使用预处理语句是更好的方法)
另一个例子是HTML:如果在HTML标记中嵌入字符串,则必须使用htmlspecialchars
对其进行转义。这意味着每个echo
或print
语句都应使用htmlspecialchars
。
第三个例子可能是shell命令:如果要将字符串(例如参数)嵌入到外部命令中,并使用exec
调用它们,则必须使用escapeshellcmd
和{{3 }}
依此类推......
仅情况下,您需要主动过滤数据,如果您接受预先格式化的输入。例如。如果您允许用户发布HTML标记,那么您计划在网站上显示该标记。但是,你应该不惜一切代价避免这种情况,因为无论你如何过滤它,它都将是一个潜在的安全漏洞。
答案 1 :(得分:198)
不要试图通过清理输入数据来阻止SQL注入。
相反,不允许在创建SQL代码时使用数据。使用使用绑定变量的Prepared Statements(即使用模板查询中的参数)。这是防止SQL注入的唯一方法。
有关阻止SQL注入的详细信息,请参阅我的网站http://bobby-tables.com/。
答案 2 :(得分:75)
没有。如果没有任何上下文,您就无法对数据进行一般过滤。有时您想要将SQL查询作为输入,有时您希望将HTML作为输入。
您需要过滤白名单上的输入 - 确保数据符合您期望的某些规格。然后,您需要在使用它之前将其转义,具体取决于您使用它的上下文。
转义SQL数据的过程 - 防止SQL注入 - 与转换(X)HTML数据的过程非常不同,以防止XSS。
答案 3 :(得分:47)
PHP现在有了一个新的漂亮的filter_input函数,例如,现在有一个内置的FILTER_VALIDATE_EMAIL类型可以让你找到“最终的电子邮件正则表达式”
我自己的过滤器类(使用javascript来突出显示错误的字段)可以由ajax请求或普通表单发布。 (见下面的例子)
/**
* Pork.FormValidator
* Validates arrays or properties by setting up simple arrays.
* Note that some of the regexes are for dutch input!
* Example:
*
* $validations = array('name' => 'anything','email' => 'email','alias' => 'anything','pwd'=>'anything','gsm' => 'phone','birthdate' => 'date');
* $required = array('name', 'email', 'alias', 'pwd');
* $sanatize = array('alias');
*
* $validator = new FormValidator($validations, $required, $sanatize);
*
* if($validator->validate($_POST))
* {
* $_POST = $validator->sanatize($_POST);
* // now do your saving, $_POST has been sanatized.
* die($validator->getScript()."<script type='text/javascript'>alert('saved changes');</script>");
* }
* else
* {
* die($validator->getScript());
* }
*
* To validate just one element:
* $validated = new FormValidator()->validate('blah@bla.', 'email');
*
* To sanatize just one element:
* $sanatized = new FormValidator()->sanatize('<b>blah</b>', 'string');
*
* @package pork
* @author SchizoDuckie
* @copyright SchizoDuckie 2008
* @version 1.0
* @access public
*/
class FormValidator
{
public static $regexes = Array(
'date' => "^[0-9]{1,2}[-/][0-9]{1,2}[-/][0-9]{4}\$",
'amount' => "^[-]?[0-9]+\$",
'number' => "^[-]?[0-9,]+\$",
'alfanum' => "^[0-9a-zA-Z ,.-_\\s\?\!]+\$",
'not_empty' => "[a-z0-9A-Z]+",
'words' => "^[A-Za-z]+[A-Za-z \\s]*\$",
'phone' => "^[0-9]{10,11}\$",
'zipcode' => "^[1-9][0-9]{3}[a-zA-Z]{2}\$",
'plate' => "^([0-9a-zA-Z]{2}[-]){2}[0-9a-zA-Z]{2}\$",
'price' => "^[0-9.,]*(([.,][-])|([.,][0-9]{2}))?\$",
'2digitopt' => "^\d+(\,\d{2})?\$",
'2digitforce' => "^\d+\,\d\d\$",
'anything' => "^[\d\D]{1,}\$"
);
private $validations, $sanatations, $mandatories, $errors, $corrects, $fields;
public function __construct($validations=array(), $mandatories = array(), $sanatations = array())
{
$this->validations = $validations;
$this->sanatations = $sanatations;
$this->mandatories = $mandatories;
$this->errors = array();
$this->corrects = array();
}
/**
* Validates an array of items (if needed) and returns true or false
*
*/
public function validate($items)
{
$this->fields = $items;
$havefailures = false;
foreach($items as $key=>$val)
{
if((strlen($val) == 0 || array_search($key, $this->validations) === false) && array_search($key, $this->mandatories) === false)
{
$this->corrects[] = $key;
continue;
}
$result = self::validateItem($val, $this->validations[$key]);
if($result === false) {
$havefailures = true;
$this->addError($key, $this->validations[$key]);
}
else
{
$this->corrects[] = $key;
}
}
return(!$havefailures);
}
/**
*
* Adds unvalidated class to thos elements that are not validated. Removes them from classes that are.
*/
public function getScript() {
if(!empty($this->errors))
{
$errors = array();
foreach($this->errors as $key=>$val) { $errors[] = "'INPUT[name={$key}]'"; }
$output = '$$('.implode(',', $errors).').addClass("unvalidated");';
$output .= "new FormValidator().showMessage();";
}
if(!empty($this->corrects))
{
$corrects = array();
foreach($this->corrects as $key) { $corrects[] = "'INPUT[name={$key}]'"; }
$output .= '$$('.implode(',', $corrects).').removeClass("unvalidated");';
}
$output = "<script type='text/javascript'>{$output} </script>";
return($output);
}
/**
*
* Sanatizes an array of items according to the $this->sanatations
* sanatations will be standard of type string, but can also be specified.
* For ease of use, this syntax is accepted:
* $sanatations = array('fieldname', 'otherfieldname'=>'float');
*/
public function sanatize($items)
{
foreach($items as $key=>$val)
{
if(array_search($key, $this->sanatations) === false && !array_key_exists($key, $this->sanatations)) continue;
$items[$key] = self::sanatizeItem($val, $this->validations[$key]);
}
return($items);
}
/**
*
* Adds an error to the errors array.
*/
private function addError($field, $type='string')
{
$this->errors[$field] = $type;
}
/**
*
* Sanatize a single var according to $type.
* Allows for static calling to allow simple sanatization
*/
public static function sanatizeItem($var, $type)
{
$flags = NULL;
switch($type)
{
case 'url':
$filter = FILTER_SANITIZE_URL;
break;
case 'int':
$filter = FILTER_SANITIZE_NUMBER_INT;
break;
case 'float':
$filter = FILTER_SANITIZE_NUMBER_FLOAT;
$flags = FILTER_FLAG_ALLOW_FRACTION | FILTER_FLAG_ALLOW_THOUSAND;
break;
case 'email':
$var = substr($var, 0, 254);
$filter = FILTER_SANITIZE_EMAIL;
break;
case 'string':
default:
$filter = FILTER_SANITIZE_STRING;
$flags = FILTER_FLAG_NO_ENCODE_QUOTES;
break;
}
$output = filter_var($var, $filter, $flags);
return($output);
}
/**
*
* Validates a single var according to $type.
* Allows for static calling to allow simple validation.
*
*/
public static function validateItem($var, $type)
{
if(array_key_exists($type, self::$regexes))
{
$returnval = filter_var($var, FILTER_VALIDATE_REGEXP, array("options"=> array("regexp"=>'!'.self::$regexes[$type].'!i'))) !== false;
return($returnval);
}
$filter = false;
switch($type)
{
case 'email':
$var = substr($var, 0, 254);
$filter = FILTER_VALIDATE_EMAIL;
break;
case 'int':
$filter = FILTER_VALIDATE_INT;
break;
case 'boolean':
$filter = FILTER_VALIDATE_BOOLEAN;
break;
case 'ip':
$filter = FILTER_VALIDATE_IP;
break;
case 'url':
$filter = FILTER_VALIDATE_URL;
break;
}
return ($filter === false) ? false : filter_var($var, $filter) !== false ? true : false;
}
}
当然,请记住,您还需要进行sql查询转义,具体取决于您使用的数据库类型(例如,mysql_real_escape_string()对于SQL Server无用)。您可能希望在适当的应用程序层(如ORM)自动处理此问题。另外,如上所述:输出到html使用其他php专用函数,如htmlspecialchars;)
真正允许带有类似剥离类和/或标记的HTML输入取决于其中一个专用的xss验证包。不要将自己的规则写成PARSE HTML!
答案 4 :(得分:43)
不,没有。
首先,SQL注入是一个输入过滤问题,XSS是一个输出转义问题 - 所以你甚至不能在代码生命周期中同时执行这两个操作。
基本经验法则
mysql_real_escape_string()
)strip_tags()
过滤掉不需要的HTML htmlspecialchars()
转义所有其他输出,并注意此处的第2和第3个参数。答案 5 :(得分:22)
要解决XSS问题,请查看HTML Purifier。它相当可配置,并且有良好的记录。
对于SQL注入攻击,请确保检查用户输入,然后通过mysql_real_escape_string()运行它。但是,该函数不会破坏所有注入攻击,因此在将数据转储到查询字符串之前检查数据非常重要。
更好的解决方案是使用预准备语句。 PDO library和mysqli扩展支持这些。
答案 6 :(得分:20)
PHP 5.2引入了 filter_var 函数。
它支持大量的SANITIZE,VALIDATE过滤器。
答案 7 :(得分:16)
在您拥有类似/mypage?id=53
的页面并且在WHERE子句中使用id的特定情况下,可以提供帮助的一个技巧是确保id绝对是一个整数,如下所示:
if (isset($_GET['id'])) {
$id = $_GET['id'];
settype($id, 'integer');
$result = mysql_query("SELECT * FROM mytable WHERE id = '$id'");
# now use the result
}
但当然只能删除一个特定的攻击,所以请阅读所有其他答案。 (是的,我知道上面的代码不是很好,但它显示了具体的防御。)
答案 8 :(得分:11)
使用PHP清理用户输入的方法:
$mysqli->set_charset("utf8");manual
$pdo = new PDO('mysql:host=localhost;dbname=testdb;charset=UTF8', $user, $password);manual
$pdo->exec("set names utf8");manual
$pdo = new PDO( "mysql:host=$host;dbname=$db", $user, $pass, array( PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION, PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8" ) );manual
[在PHP 5.5.0中弃用,在PHP 7.0.0中删除]。mysql_set_charset('utf8')
$stmt = $mysqli->prepare('SELECT * FROM test WHERE name = ? LIMIT 1');
$param = "' OR 1=1 /*";
$stmt->bind_param('s', $param);
$stmt->execute();
PDO::quote() - 在输入字符串周围放置引号(如果需要)并使用适合底层驱动程序的引用样式转义输入字符串中的特殊字符:
PDO Prepared Statements:vs MySQLi预处理语句支持更多数据库驱动程序和命名参数:
$pdo = new PDO('mysql:host=localhost;dbname=testdb;charset=UTF8', $user, $password);explicit set the character set
$pdo->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);disable emulating prepared statements to prevent fallback to emulating statements that MySQL can't prepare natively (to prevent injection)
$var = $pdo->quote("' OR 1=1 /*");not only escapes the literal, but also quotes it (in single-quote ' characters) $stmt = $pdo->query("SELECT * FROM test WHERE name = $var LIMIT 1");
$pdo = new PDO('mysql:host=localhost;dbname=testdb;charset=UTF8', $user, $password);explicit set the character set
$pdo->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);disable emulating prepared statements to prevent fallback to emulating statements that MySQL can't prepare natively (to prevent injection) $stmt = $pdo->prepare('SELECT * FROM test WHERE name = ? LIMIT 1'); $stmt->execute(["' OR 1=1 /*"]);
ctype_digit — Check for numeric character(s);使用Filter Function filter_var() - 过滤指定过滤器的变量:
$value = (int) $value;
$value = intval($value);
$var = filter_var('0755', FILTER_VALIDATE_INT, $options);
is_string() — Find whether the type of a variable is stringmore predefined filters
$email = filter_var($email, FILTER_SANITIZE_EMAIL);
$newstr = filter_var($str, FILTER_SANITIZE_STRING);
答案 9 :(得分:11)
您在这里描述的是两个不同的问题:
1)应始终假定用户输入不好。
使用预准备语句,或/和使用mysql_real_escape_string进行过滤绝对是必须的。 PHP还内置了filter_input,这是一个很好的起点。
2)这是一个很大的主题,它取决于输出数据的上下文。对于HTML,有像htmlpurifier这样的解决方案。 根据经验,总是逃避你输出的任何东西。
这两个问题都太大了,无法在一篇文章中介绍,但有很多帖子会详细介绍:
答案 10 :(得分:8)
如果您正在使用PostgreSQL,可以使用pg_escape_string()
来转义PHP的输入 $username = pg_escape_string($_POST['username']);
从文档(http://php.net/manual/es/function.pg-escape-string.php):
pg_escape_string()转义用于查询数据库的字符串。它以PostgreSQL格式返回一个没有引号的转义字符串。
答案 11 :(得分:6)
避免清理输入和转义数据时出错的最简单方法是使用PHP框架,如Symfony,Nette等,或者是该框架的一部分(模板引擎,数据库层,ORM)。
Twig或Latte等模板引擎默认情况下输出转义 - 如果您根据上下文(网页的HTML或Javascript部分)正确转义输出,则无需手动解决。
框架自动清理输入,你不应该直接使用$ _POST,$ _GET或$ _SESSION变量,而是通过路由,会话处理等机制。
对于数据库(模型)层,有像Doctrine这样的ORM框架或者像Nette Database这样的PDO包装器。
您可以在此处阅读更多相关信息 - What is a software framework?
答案 12 :(得分:4)
没有捕捉功能,因为有许多问题需要解决。
SQL注入 - 今天,通常情况下,每个PHP项目都应该使用prepared statements via PHP Data Objects (PDO)作为最佳实践,防止错误引用的错误以及全功能的注射解决方案。它也是最灵活的&amp;安全的方式来访问您的数据库。
查看(The only proper) PDO tutorial,了解您需要了解的有关PDO的所有信息。 (真诚地感谢顶级SO贡献者@YourCommonSense,关于这个主题的这个重要资源。)
XSS - 在...的路上消毒数据
HTML Purifier已经存在了很长时间,并且仍然在积极更新。您可以使用它来消毒恶意输入,同时仍然允许慷慨的&amp;可配置的标签白名单。适用于许多WYSIWYG编辑器,但对于某些用例可能会很重。
在其他情况下,我们根本不想接受HTML / Javascript,我发现这个简单的函数很有用(并且已经针对XSS进行了多次审核):
/* Prevent XSS input */
function sanitizeXSS () {
$_GET = filter_input_array(INPUT_GET, FILTER_SANITIZE_STRING);
$_POST = filter_input_array(INPUT_POST, FILTER_SANITIZE_STRING);
$_REQUEST = (array)$_POST + (array)$_GET + (array)$_REQUEST;
}
XSS - 在出路时清理数据...... 除非您在将数据添加到数据库之前保证数据已正确清理,否则在显示数据之前需要对其进行清理对于您的用户,我们可以利用这些有用的PHP函数:
echo
或print
以显示用户提供的值时,请使用htmlspecialchars
,除非数据已正确清理并且允许显示HTML。json_encode
是一种从PHP提供用户提供的值到Javascript的安全方法 您是使用exec()
或system()
函数调用外部shell命令,还是调用backtick
运算符?如果是这样,除了SQL之外注射剂XSS您可能还有一个额外的问题需要解决,用户在您的服务器上运行恶意命令。如果您想要转义整个命令OR escapeshellcmd
以逃避单个参数,则需要使用escapeshellarg
。
答案 13 :(得分:3)
只是想在输出转义的主题上添加它,如果你使用php DOMDocument来制作你的html输出,它将在正确的上下文中自动转义。属性(值=“”)和&lt; span&gt;的内部文本不平等。 为了安全抵御XSS,请阅读: OWASP XSS Prevention Cheat Sheet
答案 14 :(得分:3)
从不信任用户数据。
function clean_input($data) {
$data = trim($data);
$data = stripslashes($data);
$data = htmlspecialchars($data);
return $data;
}
trim()
函数从字符串的两侧删除空格和其他预定义字符。
stripslashes()
函数删除反斜杠
htmlspecialchars()
函数将一些预定义的字符转换为HTML实体。
预定义字符是:
& (ampersand) becomes &
" (double quote) becomes "
' (single quote) becomes '
< (less than) becomes <
> (greater than) becomes >
答案 15 :(得分:2)
您应用于数据以使其安全包含在SQL语句中的转换与您申请包含在HTML中的转换完全不同,与您申请包含在Javascript中的转换完全不同,与您申请包含的转换完全不同在LDIF中完全不同于你在CSS中包含的那些与你在电子邮件中包含的那些完全不同....
无论如何validate input - 决定是否接受它进行进一步处理或告诉用户这是不可接受的。但是,除非要离开PHP土地,否则不要对数据的表示进行任何更改。
很久以前,有人试图发明一种适用于转发数据的单一尺寸的机制,我们最终得到了&#34; magic_quotes&#34;它没有正确地逃避所有输出目标的数据,导致不同的安装需要不同的代码才能工作。
答案 16 :(得分:0)
使用此修剪空白并删除不可打印的字符
$data = trim(preg_replace('/[[:^print:]]/', '', $data));
答案 17 :(得分:0)
有过滤器扩展程序(howto-link,manual),它适用于所有GPC变量。但这并不是一件神奇的事情,你仍然需要使用它。
答案 18 :(得分:-1)
我可以看到php过滤器清理特殊特殊字符派上用场。
like:
$a=fliter_var($_POST['a'],FILTER_SANITIZE_SPECIAL_CHARS);
但是,按库存而言,我认为这可能会更好,因为查看c代码时,它仅过滤“'\ <>&和\ 0,因此我可以看到这是一种很好的清除方法。包含这些其他字符的源代码,例如/ {} []。;`可以在编码(enc [''])行上增强此功能:
void php_filter_special_chars(PHP_INPUT_FILTER_PARAM_DECL)
{
unsigned char enc[256] = {0};
php_filter_strip(value, flags);
/* encodes ' " < > & \0 to numerical entities */
enc['\''] = enc['"'] = enc['<'] = enc['>'] = enc['&'] = enc[0] = 1;
/* if strip low is not set, then we encode them as &#xx; */
memset(enc, 1, 32);
if (flags & FILTER_FLAG_ENCODE_HIGH) {
memset(enc + 127, 1, sizeof(enc) - 127);
}
php_filter_encode_html(value, enc);
}
答案 19 :(得分:-4)
使用PHP清理用户输入的最佳BASIC方法:
function sanitizeString($var)
{
$var = stripslashes($var);
$var = strip_tags($var);
$var = htmlentities($var);
return $var;
}
function sanitizeMySQL($connection, $var)
{
$var = $connection->real_escape_string($var);
$var = sanitizeString($var);
return $var;
}