我在读取某些图像的IPTC数据时遇到了一些麻烦,我之所以这样做,是因为我的客户端已经拥有IPTC数据中的所有关键字并且不想重新输入他们在网站上。
所以我创建了这个简单的脚本来读出它们:
$size = getimagesize($image, $info);
if(isset($info['APP13'])) {
$iptc = iptcparse($info['APP13']);
print '<pre>';
var_dump($iptc['2#025']);
print '</pre>';
}
这在大多数情况下都能很好地工作,但它在某些图像上有问题。
注意:未定义的索引:2#025
虽然我可以在photoshop中清楚地看到关键字。
是否有任何体面的小型库可以读取每张图片中的关键字?或者我在这里做错了什么?
答案 0 :(得分:1)
我发现IPTC几乎总是使用XMP格式嵌入为xml,并且通常不在APP13插槽中。有时您可以使用iptcparse($info['APP1'])
来获取IPTC信息,但是在没有第三方库的情况下获取IPTC信息的最可靠方法是简单地从相关xml字符串中搜索图像文件(我是从另一个答案中得到的,但是我找不到它,否则我会链接!):
关键字xml的格式始终为"<dc:subject>...<rdf:Seq><rdf:li>Keyword 1</rdf:li><rdf:li>Keyword 2</rdf:li>...<rdf:li>Keyword N</rdf:li></rdf:Seq>...</dc:subject>"
因此,您可以使用file_get_contents(get_attached_file($attachment_id))
以字符串形式获取文件,使用strpos()
查找每个开头(<rdf:li>
)和结尾(</rdf:li>
)XML标签,并使用substr()
抓住它们之间的关键字。
以下代码段适用于我对其进行测试的所有jpeg。它将使用从ID为$keys
的wordpress图像中获取的IPTC标签填充数组$attachment_id
:
$content = file_get_contents(get_attached_file($attachment_id));
// Look for xmp data: xml tag "dc:subject" is where keywords are stored
$xmp_data_start = strpos($content, '<dc:subject>') + 12;
// Only proceed if able to find dc:subject tag
if ($xmp_data_start != FALSE) {
$xmp_data_end = strpos($content, '</dc:subject>');
$xmp_data_length = $xmp_data_end - $xmp_data_start;
$xmp_data = substr($content, $xmp_data_start, $xmp_data_length);
// Look for tag "rdf:Seq" where individual keywords are listed
$key_data_start = strpos($xmp_data, '<rdf:Seq>') + 9;
// Only proceed if able to find rdf:Seq tag
if ($key_data_start != FALSE) {
$key_data_end = strpos($xmp_data, '</rdf:Seq>');
$key_data_length = $key_data_end - $key_data_start;
$key_data = substr($xmp_data, $key_data_start, $key_data_length);
// $ctr will track position of each <rdf:li> tag, starting with first
$ctr = strpos($key_data, '<rdf:li>');
// Initialize empty array to store keywords
$keys = Array();
// While loop stores each keyword and searches for next xml keyword tag
while($ctr != FALSE && $ctr < $key_data_length) {
// Skip past the tag to get the keyword itself
$key_begin = $ctr + 8;
// Keyword ends where closing tag begins
$key_end = strpos($key_data, '</rdf:li>', $key_begin);
// Make sure keyword has a closing tag
if ($key_end == FALSE) break;
// Make sure keyword is not too long (not sure what WP can handle)
$key_length = $key_end - $key_begin;
$key_length = (100 < $key_length ? 100 : $key_length);
// Add keyword to keyword array
array_push($keys, substr($key_data, $key_begin, $key_length));
// Find next keyword open tag
$ctr = strpos($key_data, '<rdf:li>', $key_end);
}
}
}
我在插件中实现了此功能,可以将IPTC关键字放入WP的“描述”字段which you can find here。
答案 1 :(得分:0)
ExifTool非常强大,如果你可以解决它(从PHP看起来像?)
答案 2 :(得分:0)
我见过很多奇怪的IPTC问题。可能你有2个APP13段。我注意到,由于某些原因,一些JPEG有多个IPTC块。使用多个照片编辑程序或一些手动文件操作可能会出现问题。
可能是PHP试图读取空的APP13甚至是嵌入的“缩略图元数据”。
段长度也可能有问题 - APP13或8BIM的长度标记字节可能有错误的值。
尝试使用HEX编辑器并“手动”检查文件。