过滤从PDF

时间:2015-10-13 12:43:15

标签: sql-server

将文本从pdf复制到MS SQL Server时遇到问题。这个pdf包含一个查询,我想将其复制到我的MS SQL Server,但是当我这样做时,他会复制包含一些不可见符号的文本。

这是查询的第一部分,从我的PDF查看器中复制:

IF​O​BJECT_ID​(​'​trgAantalIU',​'​TR')​​I​S​N​OT​N​ULL
D​ROP​T​RIGGER​trgAantalIU;​ GO
CREATE​T​RIGGER​trgAantalIUO​N​bezettingsregel AFTER​U​PDATE
AS
BEGIN

当我在SQL Server中查看这个复制的查询时,它没有得到正确的语法高亮,我发现'B'和'E'之间有一个不可见的符号(它需要两个退格键来删除B而光标在'E'前面,这就是我知道的原因。)

我的问题是:如何删除这些隐形符号?我无法在MS SQL Server中找到一个选项来为我执行此操作。

我正在使用OS X 10.11,以及随附的“预览”应用程序作为pdf-viewer。 MS SQL在VM中运行(Parallels Desktop,最新版本)。

1 个答案:

答案 0 :(得分:1)

您可以执行一些操作来删除所有奇怪的字符。 到目前为止,摆脱所有这些不可见字符的最简单方法是使用另一个应用程序将文本粘贴到没有实际格式的情况下。

在Mac OS X上,您可以使用任何文本编辑器,并使用 Shift-Option-Cmd + v 将复制的部分粘贴到其中,以删除格式。

如果你在Windows上,你可以将代码复制/粘贴到记事本中,它将失去所有格式(同样适用于Linux下的mousepadleafpad)。

对于Windows,还有一个可以使用的应用程序称为“PureText”。

关于puretext的简短描述:

  

PureText仅从文本中删除丰富的格式。这包括字体,字体样式(粗体,斜体等),字体颜色,段落样式(左/右/中心对齐),边距,字符间距,项目符号,下标,上标,表格,图表,图片,嵌入对象等等。但是,它不会修改实际文本。它不会删除或修复换行符,回车符,制表符或其他空格。它不会修复自动换行或清理你的段落。如果将网页的源代码复制到剪贴板,则不会删除所有HTML标记。如果您从实际网页(而不是页面源)复制文本,它将删除格式。