将以空格分隔的值从PDF导出到Excel作为制表符分隔的值

时间:2014-04-27 01:24:10

标签: excel export-to-excel

每当我从PDF或网站复制表格式数据时,它通常会在Excel中显示为以空格分隔的值。将空格分隔的值粘贴到Excel中时,它们都会进入同一列。当我想从数据中创建一个表,对数据进行排序或基本上对数据执行任何操作时,这没有用。以下是一行数据的示例:

100 04/01 10:00 PM 555-555-5555 SOME PLACE,CA XA/VE/AE 1:00

这些数据在PDF中以表格形式组织,这意味着无论“位置”字段的长度如何,下一列中的值都是对齐的。例如,这就是它在PDF中的外观:

100 04/01 10:00 PM 555-555-5555 SOME PLACE,CA         XA/AE    1:00
100 04/01 10:00 PM 555-555-5555 SOME OTHER PLACE,CA   XA/VE/AE 1:00

是否有一种快速方法可以获取以空格分隔的值,这些值经常出现在制表符分隔的值中,以便轻松粘贴到Excel中?在复制那些将所有标签变为空格时,是否有一些我缺少的格式?是否有一个程序可以提取复制时似乎丢失的选项卡?

1 个答案:

答案 0 :(得分:1)

帕特里克,

(99%)PDF文件中没有标签。这是将标签文本绘制为PDF的众多方法,这使得无法将文本可靠地转换为列。

PDF文件中的大部分文字都是使用

绘制的

MoveTo(x,y); DrawText的( “你好”); MoveTo(x1,t1); DrawText(“Hello World”);

某些PDF会以这种方式单独绘制每个角色。其他人将“Hello W”和“orld”描绘为两个单独的单词。字符可以应用字符间距和字间距值以及缩放,旋转等。我已经看到了各种绘制文本的方法,这就是为什么需要一个可靠的PDF到文本库以获得最佳结果的原因。 Proportianal字体也会给你带来很多问题。

即。没有快速的方法可以从文本中获取列,而无需编写一些精美的代码。

安德鲁。