首页

文章

用c#如何提取pdf里的表格

发布网友 发布时间:2022-04-19 18:18

我来回答

4个回答

热心网友 时间:2023-02-03 08:31

添加spire.pdf.dll为引用,使用下面的代码即可提取pdf中所有表格数据到txt文档:

using System.IO;

using System.Text;

using Spire.Pdf;

using Spire.Pdf.Utilities;


namespace ExtractPdfTable

{

    class Program

    {

        static void Main(string[] args)

        {

            //Create a PdfDocument object

            PdfDocument doc = new PdfDocument();

            //Load the sample PDF file

            doc.LoadFromFile(@"C:\Users\Administrator\Desktop\Table.pdf");

            //Create a StringBuilder object

            StringBuilder builder = new StringBuilder();

            //Initialize an instance of PdfTableExtractor class

            PdfTableExtractor extractor = new PdfTableExtractor(doc);

            //Declare a PdfTable array 

            PdfTable[] tableList = null;

            int tableNum = 1;

            //Loop through the pages 

            for (int pageIndex = 0; pageIndex < doc.Pages.Count; pageIndex++)

            {

                //Extract tables from a specific page

                tableList = extractor.ExtractTable(pageIndex);

                //Determine if the table list is null

                if (tableList != null && tableList.Length > 0)

                {

                    //Loop through the table in the list

                    foreach (PdfTable table in tableList)

                    {

                        builder.Append("Table " + tableNum);

                        builder.Append("\r\n");

                        //Get row number and column number of a certain table

                        int row = table.GetRowCount();

                        int column = table.GetColumnCount();

                        //Loop though the row and colunm 

                        for (int i = 0; i < row; i++)

                        {

                            for (int j = 0; j < column; j++)

                            {

                                //Get text from the specific cell

                                string text = table.GetText(i, j);

                                //Add text to the string builder

                                builder.Append(text + " ");

                            }

                            builder.Append("\r\n");                    

                        }

                        builder.Append("\r\n");

                        tableNum += 1;

                    }

                }

            }

            //Write to a .txt file

            File.WriteAllText("Table.txt", builder.ToString());

        }

    }

}

热心网友 时间:2023-02-03 09:49

直接用xunjiePDF编辑器就可以提取
把PDF文件打开,在找到提取页面,
表格在那页就提取那页,提取之后就可以使用了

热心网友 时间:2023-02-03 11:23

只能提取文件的页面,是编辑PDF文件表格,办公有 迅捷 PD F编辑器就可以了,在最近文件哪里去操作,具体过程就不说了,自己去试试吧。

热心网友 时间:2023-02-03 13:15

有的私信我
逆水寒手游庄园怎么邀请好友同住 逆水寒手游 逆水寒不同区可以一起组队吗? 逆水寒手游 逆水寒怎么进入好友世界? 逆水寒手游 逆水寒怎么去别人的庄园? 使用puppeteer实现将htmll转成pdf 内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档 【译】将HTML转为PDF的几种实现方案 变形金刚08动画怎么样 变形金刚08动画的问题 变形金刚08动画日语版剧情介绍 高分!换显卡nvidia控制面板被我卸了,重新安装显卡驱动后没了nvidia控... 我的nvidia控制面板被卸载了 怎么找回啊 卸载后 这个画面看着很奇怪_百 ... 李卓彬工作简历 林少明工作简历 广东工业职业技术学院怎么样 郑德涛任职简历 唐新桂个人简历 土地入股的定义 ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 万里挑一算彩礼还是见面礼 绿萝扦插多少天后发芽 绿萝扦插多久发芽 扦插绿萝多久发芽 炖牛排骨的做法和配料 网络诈骗定罪标准揭秘 “流水不争先”是什么意思? mc中钻石装备怎么做 为什么我的MC里的钻石块是这样的?我想要那种。是不是版本的问题?如果是... 带“偷儿”的诗句 “君不见巴丘古城如培塿”的出处是哪里 带“奈何”的诗句大全(229句) 里翁行()拼音版、注音及读音 带“不虑”的诗句 “鲁肃当年万人守”的出处是哪里 无尘防尘棚 进出口报关流程,越详细越好。谢谢大家指教。 双线桥不是看化合价升多少就标多少的吗?为什么CL2+2KI=2KCL+I2中I失... 出师表高锰酸钾有画面了吗 2021年幼儿园新学期致家长一封信 电脑屏幕一条黑线怎么办? 销售代理商销售代理商的特点 西门子冰箱出现报警的情况怎么处理? pdf里的表格怎么提取 西门子冰箱报警灯一直亮着,冷冻室会冷,冷藏室不会... 怎么才能快速把pdf格式的图纸中的材料表导出来啊(... 西门子冰箱频繁报警,报警字样一直显示,冷冻室不... 如何从pdf中提取表格数据 西门子冰箱 一直警报 红灯一直亮着 这是什么故障? PDF文档中提取一个表格 西门子冰箱负18度显示报警怎么办? pdf怎么提取表格 急.. 西门子冰箱首次开机 冷藏室显示报警 如何将pdf里面的表格导出来 西门子冰箱突然显示报警是什么意思 西门子冰箱冷冻报警一直响怎么回事 西门子冰箱一直在报警怎么处理? 西门子冰箱冷藏室温都显示16度,还一直报警是咋回事? 西门子的冰箱报警,怎么处理? 西门子冰箱报警一直响怎么解除? 西门子冰箱报警灯亮怎么解除? 西门子冰箱冷冻报警一直响怎么回事? 西门子冰箱频繁报警,报警字样一直显示,不制冷,... pdf里的表格怎么提取到word 西门子冰箱冷冻室报警怎么解决 西门子冰箱冷冻报警是怎么回事? 如何提取PDF文档中的表格并转换为Excel文件 如何完整复制pdf中的表格? PDF里的表格怎么快速提取 怎么提取pdf中的表格转换成excel 怎么把pdf里面的表格导出来 如何提取pdf中的数据将pdf转换成excel 怎么从pdf文件中导出可编辑的表格 微信如何提取pdf文件表格 新鲜墨鱼怎么处理干净 新鲜的墨鱼怎么处理?怎么烹饪? 新鲜的墨鱼怎么做 新鲜墨鱼家常做法大全家常 鲜墨鱼的最简单做法 怎样清洗新鲜墨鱼 墨鱼做法处理方法有哪些 新鲜的墨鱼怎么处理?怎么烹饪?
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com