日本xxxx18视频在线观看-日本xxxx1819-日本xxxwww在线观看-日本xxx-日本xx-日本www在线视频

LOGO OA教程 ERP教程 模切知識交流 PMS教程 CRM教程 開發文檔 其他文檔  
 
網站管理員

【C#】利用免費PdfPig庫讀取PDF并提取表格內容保存為TXT文本文件代碼

admin
2025年2月20日 16:38 本文熱度 1088

如果你需要完全免費的 PDF 處理庫,可以考慮PdfPig方案:

  • 特點:PdfPig 是一個開源的 .NET 庫,專注于讀取 PDF 文件內容(包括文本、表格等)。

  • 許可證:Apache 2.0 許可證,完全免費,可用于商業項目。

  • GitHub 地址https://github.com/UglyToad/PdfPig

  • 適用場景:適合提取 PDF 中的文本和表格數據。

以下是一個使用 PdfPig 提取 PDF 表格并保存為 Excel 的示例代碼:

(1) 安裝 NuGet 包

Install-Package PdfPig

(2) 示例代碼

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using UglyToad.PdfPig;
using UglyToad.PdfPig.Content;
using OfficeOpenXml;
class Program
{
    static void Main(string[] args)
    {
        string pdfPath = "input.pdf";
        string excelPath = "output.xlsx";
        // 提取 PDF 中的表格數據
        var tableData = ExtractTableFromPdf(pdfPath);
        // 將表格數據保存為 Excel 文件
        SaveTableToText(tableData, excelPath);
        Console.WriteLine("PDF 表格已成功轉換為 Excel 文件。");
    }


    static List<List<string>> ExtractTableFromPdf(string pdfPath)
    {
        var tableData = new List<List<string>>();
        using (var pdfDocument = PdfDocument.Open(pdfPath))
        {
            foreach (var page in pdfDocument.GetPages())
            {
                var words = page.GetWords(); // 獲取頁面中的單詞
                var lines = words.GroupBy(w => w.BoundingBox.Bottom) // 按行分組
                                  .OrderByDescending(g => g.Key);
                foreach (var line in lines)
                {
                    var columns = line.OrderBy(w => w.BoundingBox.Left) // 按列排序
                                      .Select(w => w.Text)
                                      .ToList();
                    tableData.Add(columns);
                }
            }
        }
        return tableData;
    }


    static void SaveTableToText(List<List<string>> tableData, string excelPath)
    {
        for (int i = 0; i < tableData.Count; i++)
        {
            string tmpStr="";
            for (int j = 0; j < tableData[i].Count; j++)
            {
                tmpStr = tmpStr + "|" + tableData[i][j];
            }
            Console.WriteLine("----------------------");
            Console.WriteLine(tmpStr);
        }
    }
}

(3) 代碼說明

  • ExtractTableFromPdf:使用 PdfPig 提取 PDF 中的文本,并按行和列組織成表格數據。

  • SaveTableToExcel:使用 EPPlus 將表格數據保存為 Excel 文件。


效果說明:

下面是原始PDF文件樣式:

 下面是解碼結果:

 



總結

  • 如果你需要完全免費的解決方案,推薦使用 PdfPig。

  • 如果你需要更強大的功能,并且可以接受商業許可,可以選擇 iTextSharp 或 iText 7。


該文章在 2025/2/20 16:43:20 編輯過
關鍵字查詢
相關文章
點晴ERP是一款針對中小制造業的專業生產管理軟件系統,系統成熟度和易用性得到了國內大量中小企業的青睞。
點晴PMS碼頭管理系統主要針對港口碼頭集裝箱與散貨日常運作、調度、堆場、車隊、財務費用、相關報表等業務管理,結合碼頭的業務特點,圍繞調度、堆場作業而開發的。集技術的先進性、管理的有效性于一體,是物流碼頭及其他港口類企業的高效ERP管理信息系統。
點晴WMS倉儲管理系統提供了貨物產品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質期管理,貨位管理,庫位管理,生產管理,WMS管理系統,標簽打印,條形碼,二維碼管理,批號管理軟件。
點晴免費OA是一款軟件和通用服務都免費,不限功能、不限時間、不限用戶的免費OA協同辦公管理系統。
Copyright 2010-2025 ClickSun All Rights Reserved

主站蜘蛛池模板: 欧美高清性xxxxhd | 欧美精品中文字幕亚洲专区 | 日本播放器大片免费 | 欧美日韩国产va另类试看 | 国产亚洲人成在线v网站 | 精品国产欧美精品v | 日韩国标 | 欧美精品v日韩精品v国产 | 国产精品一级国产精品片 | 国产小呦泬泬99 | 日本按摩强伦姧在线观看 | 欧美在线激情视频 | 免费午夜色激情视频网站 | 亚洲国产欧美国产第一区二 | 网友分享日韩欧美一区 | 国产精品俺来也在线观看 | 日本视频一区在线播放 | 国产午夜三级在线播放 | 国产精品综合久成人 | 国产最新在线一区二区 | 国产区一二三区%20第一页 | 日韩精品免费一线在线观看 | 精品网站在线观看影片 | 国产熟女乱子视频正在播放 | 欧美日韩视频免 | 被几个男的一起添好舒服 | 99久免费精品视频在线观78 | 精品一区二区三区三区 | 国产又色又爽又刺激在线播放 | 日韩大片在线观看入口 | 国产国内精品在线观看 | 欧美日韩精品一区二区在 | 欧美日韩国产另类激情一区 | 日本一区视频在线观看 | 床戏视频| 国产香蕉在线观看 | 国产一卡2卡3卡4卡网站免费 | 欧美、另类亚洲日本一区二区 | 日本韩国欧 | 99re6国产精品免费播放 | 99re66热这里只有精 |