C# 合并和拆分PDF文件-白红宇

C# 合并和拆分PDF文件

阅读量：615 次

发布时间：2019-03-13

本文共 7163 字，大约阅读时间需要 23 分钟。

一、合并和拆分PDF文件的方式

PDF文件使用了工业标准的压缩算法，易于传输与储存。它还是页独立的，一个PDF文件包含一个或多个“页“，可以单独处理各页，特别适合多处理器系统的工作。PDF文件结构主要可以分为四个部分：首部、文件体、交叉引用表、尾部。PDF操作类库非常多，如下图所示，常用的类库有：Spire.Pdf、iTextSharp。

二、使用 Spire.Pdf 合并和拆分PDF文件

使用 Nuget 添加Spire.Pdf 类库，然后添加如下代码：

1 ///  2         /// 合并PDF文件 3         /// 
 4         /// 待合并文件列表 5         /// 合并生成的文件名称 6         static void SpirePdfMerge(string[] files, string outFile) 7         { 8             var doc = Spire.Pdf.PdfDocument.MergeFiles(files); 9             doc.Save(outFile, FileFormat.PDF);10         }11 12         /// 13         /// 按每页拆分PDF文件14         /// 
15         /// 待拆分PDF文件名称16         static void SpirePdfSplit(string inFile)17         {18             var doc = new Spire.Pdf.PdfDocument(inFile);19             doc.Split("SpirePdf_拆分-{0}.pdf");20             doc.Close();21         }

三、使用 iTextSharp 合并和拆分PDF文件

使用 Spire.Pdf 操作PDF文件，简单高效，但生成的PDF文件带有水印，即使使用破解版在第一页还是有水印，我们可以使用 iTextSharp 类库，该类库生成的PDF无水印，具体使用如下：

1 ///  2         /// 合并PDF文件 3         /// 
 4         /// 待合并文件列表 5         /// 合并生成的文件名称 6         static void iTextSharpPdfMerge(List
   
     inFiles, String outFile) 7         { 8             using (var stream = new FileStream(outFile, FileMode.Create)) 9             {10                 using (var doc = new Document())11                 {12                     using (var pdf = new PdfCopy(doc, stream))13                     {14                         doc.Open();15                         inFiles.ForEach(file =>16                         {17                             var reader = new PdfReader(file);18                             for (int i = 0; i < reader.NumberOfPages; i++)19                             {20                                 var page = pdf.GetImportedPage(reader, i + 1);21                                 pdf.AddPage(page);22                             }23                             pdf.FreeReader(reader);24                             reader.Close();25                         });26                     }27                 }28             }29         }30 31         /// 
    32         /// 按每页拆分PDF文件33         /// 
34         /// 
    待拆分PDF文件名称35         static void iTextSharpPdfSplit(string inFile)36         {37             using (var reader = new PdfReader(inFile))38             {39                 // 注意起始页是从1开始的40                 for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++)41                 {42                     using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i)))43                     {44                         var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create));45                         sourceDocument.Open();46                         var importedPage = pdfCopyProvider.GetImportedPage(reader, i);47                         pdfCopyProvider.AddPage(importedPage);48                     }49                 }50             }51         }

四、测试结果

完整代码如下：

1 using Spire.Pdf;  2 using System;  3 using System.Collections.Generic;  4 using System.IO;  5 using System.Linq;  6 using System.Net.Mime;  7 using System.Text;  8 using System.Threading.Tasks;  9 using iTextSharp.text; 10 using iTextSharp.text.pdf; 11 using PdfDocument = iTextSharp.text.pdf.PdfDocument; 12  13 namespace Pdf 14 { 15     class Program 16     { 17         static void Main(string[] args) 18         { 19             try 20             { 21                 SpirePdfMerge(Directory.GetFiles("Merge"), "SpirePdfMerge.pdf"); 22                 Console.WriteLine("使用 Spire.Pdf 合并文件完成..."); 23  24                 SpirePdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\1.pdf"); 25                 Console.WriteLine("使用 Spire.Pdf 拆分文件完成..."); 26  27                 iTextSharpPdfMerge(Directory.GetFiles("Merge").ToList(), "iTextSharpPdfMerge.pdf"); 28                 Console.WriteLine("使用 iTextSharp 合并文件完成..."); 29  30                 iTextSharpPdfSplit($"{AppDomain.CurrentDomain.BaseDirectory}Split\\2.pdf"); 31                 Console.WriteLine("使用 iTextSharp 拆分文件完成..."); 32  33             } 34             catch (Exception e) 35             { 36                 Console.WriteLine(e); 37             } 38             finally 39             { 40                 Console.ReadKey(); 41             } 42         } 43  44         #region Spire.Pdf 45  46         ///  47         /// 合并PDF文件 48         /// 
 49         /// 待合并文件列表 50         /// 合并生成的文件名称 51         static void SpirePdfMerge(string[] files, string outFile) 52         { 53             var doc = Spire.Pdf.PdfDocument.MergeFiles(files); 54             doc.Save(outFile, FileFormat.PDF); 55         } 56  57         ///  58         /// 按每页拆分PDF文件 59         /// 
 60         /// 待拆分PDF文件名称 61         static void SpirePdfSplit(string inFile) 62         { 63             var doc = new Spire.Pdf.PdfDocument(inFile); 64             doc.Split("SpirePdf_拆分-{0}.pdf"); 65             doc.Close(); 66         } 67  68         #endregion 69  70         #region iTextSharp.text.pdf 71  72         ///  73         /// 合并PDF文件 74         /// 
 75         /// 待合并文件列表 76         /// 合并生成的文件名称 77         static void iTextSharpPdfMerge(List
   
     inFiles, String outFile) 78         { 79             using (var stream = new FileStream(outFile, FileMode.Create)) 80             { 81                 using (var doc = new Document()) 82                 { 83                     using (var pdf = new PdfCopy(doc, stream)) 84                     { 85                         doc.Open(); 86                         inFiles.ForEach(file => 87                         { 88                             var reader = new PdfReader(file); 89                             for (int i = 0; i < reader.NumberOfPages; i++) 90                             { 91                                 var page = pdf.GetImportedPage(reader, i + 1); 92                                 pdf.AddPage(page); 93                             } 94                             pdf.FreeReader(reader); 95                             reader.Close(); 96                         }); 97                     } 98                 } 99             }100         }101 102         /// 
    103         /// 按每页拆分PDF文件104         /// 
105         /// 
    待拆分PDF文件名称106         static void iTextSharpPdfSplit(string inFile)107         {108             using (var reader = new PdfReader(inFile))109             {110                 // 注意起始页是从1开始的111                 for (int i = 1; i <= new PdfReader(inFile).NumberOfPages; i++)112                 {113                     using (var sourceDocument = new Document(reader.GetPageSizeWithRotation(i)))114                     {115                         var pdfCopyProvider = new PdfCopy(sourceDocument, new System.IO.FileStream($"iTextSharp_拆分_{i}.pdf", System.IO.FileMode.Create));116                         sourceDocument.Open();117                         var importedPage = pdfCopyProvider.GetImportedPage(reader, i);118                         pdfCopyProvider.AddPage(importedPage);119                     }120                 }121             }122         }123 124         #endregion125 126     }127 }

测试效果如下图所示：

转载地址：http://zcqaz.baihongyu.com/

你可能感兴趣的文章