- [DEVEXPRESS] Đặt mật khẩu và bỏ mật khẩu tập tin file PDF
- [C#] Thêm ứng dụng vào Taskbar sử dụng SharpShell DeskBand
- [C#] Hướng dẫn thêm text vào hình ảnh icon winform
- [C#] Chia sẽ tổng hợp source code đồ án về Csharp
- [C#] Hướng dẫn viết ứng dụng quay màn hình video winform, Screen Recorder
- [C#] Hướng dẫn sử dụng thư viện Input Simulator để làm việc với Keyboard, Mouse Virtual
- [DEVEXPRESS] Hướng dẫn tích Filter Contain khi click chuột phải vào cell selection trên Gridview
- [C#] Tra cứu mã số thuế cá nhân bằng CMND hoặc CCCD
- [C#] Convert hình ảnh image thành Blurhash sử dụng trong loading image winform
- [POWERSHELL] Script sao lưu backup và nén database sqlserver
- [C#] Giới thiệu thư viện Autofac Dependency Injection
- [C#] Hướng dẫn tạo Windows Services đơn giản Winform
- [C#] Một click chuột điều khiển máy tính từ xa sử dụng Ultraviewer
- Hướng dẫn đóng gói phần mềm sử dụng Powershell biên dịch script thành file exe
- [C#] Hướng dẫn sử dụng Task Dialog trên NET 5
- [C#] Hướng dẫn xem lịch sử các trang web đã truy cập trên Chrome Browser
- [C#] Hướng dẫn lấy thông tin Your ID và Password của Ultraviewer Winform
- [C#] Hướng dẫn lấy thông tin Your ID và Password của Teamviewer Winform
- [C#] Hướng dẫn build code động xuất file exe trên Winform
- [C#] Điều khiển ứng dụng từ xa và rất xa với Telegram Bot Winform
[C#] Hướng dẫn chuyển đổi file PDF sang Microsoft Word
Xin chào các bạn, bài viết hôm nay mình sẻ hướng dẫn các bạn cách chuyển đổi file PDF sang định dạng văn bản Microsoft Word trong lập trình C# winform.
[C#] Convert PDF to MS Word Winform
Để convert file PDF sang Word trong bài viết này mình sẽ sử dụng 2 thư viện: PDFBox và Docx
Hai thư viện này các bạn có thể dễ dàng import vào project từ Nuget.
Dưới đây là file PDF demo:
Và dưới đây là kết quả sau khi convert sang văn bản TEXT:
Full source code convert pdf to word c#:
using org.apache.pdfbox.pdmodel;
using org.apache.pdfbox.util;
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Diagnostics;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using Xceed.Words.NET;
namespace PdfToRtf
{
public partial class Form1 : Form
{
public Form1()
{
InitializeComponent();
}
private void button1_Click(object sender, EventArgs e)
{
var dlg = new OpenFileDialog();
if (dlg.ShowDialog() == DialogResult.OK) {
textBox1.Text = dlg.FileName;
PDDocument doc = PDDocument.load(dlg.FileName);
PDFTextStripper stripper = new PDFTextStripper();
richTextBox1.Text = (stripper.getText(doc));
var name_doc = Path.GetFileNameWithoutExtension(dlg.FileName) + ".docx";
var worddoc = DocX.Create(name_doc);
worddoc.InsertParagraph(richTextBox1.Text);
worddoc.Save();
Process.Start(name_doc);
}
}
}
}
Thanks for watching!