我正在尝试为学校项目制作网络抓取工具。当我试图刮一些网站时,我收到以下错误:
字符串值不正确:'\ xC4 \ x82 \ xC5 \ xA4 \ xC3 ...'列 第1行的“内容”
表格内容的配置如下所示
CREATE TABLE IF NOT EXISTS scotchbox.content (
id INT(11) NOT NULL AUTO_INCREMENT,
url INT(11) NOT NULL,
content LONGTEXT CHARACTER SET 'utf8' NOT NULL,
content_raw LONGTEXT CHARACTER SET 'utf8' NOT NULL,
content_raw_hash VARCHAR(255) CHARACTER SET 'utf8' NOT NULL,
PRIMARY KEY (id),
INDEX idx_content__url (url ASC),
CONSTRAINT fk_content__url
FOREIGN KEY (url)
REFERENCES scotchbox.url (id))
ENGINE = InnoDB
AUTO_INCREMENT = 4
DEFAULT CHARACTER SET = utf8mb4;
任何人都可以告诉我需要更改/做什么才能让页面进入数据库吗?