- [C#] Hướng dẫn tạo mã thanh toán VietQR Pay không sử dụng API trên winform
- [C#] Hướng Dẫn Tạo Windows Service Đơn Giản Bằng Topshelf
- [C#] Chia sẻ source code đọc dữ liệu từ Google Sheet trên winform
- [C#] Chia sẻ source code tạo mã QR MOMO đa năng Winform
- [C#] Chia sẻ source code phần mềm lên lịch tự động chạy ứng dụng Scheduler Task Winform
- [Phần mềm] Tải và cài đặt phần mềm Sublime Text 4180 full version
- [C#] Hướng dẫn download file từ Minio Server Winform
- [C#] Hướng dẫn đăng nhập zalo login sử dụng API v4 trên winform
- [SOFTWARE] Phần mềm gởi tin nhắn Zalo Marketing Pro giá rẻ mềm nhất thị trường
- [C#] Việt hóa Text Button trên MessageBox Dialog Winform
- [DEVEXPRESS] Chia sẻ code các tạo report in nhiều hóa đơn trên XtraReport C#
- [POWER AUTOMATE] Hướng dẫn gởi tin nhắn zalo từ file Excel - No code
- [C#] Chia sẻ code lock và unlock user trong domain Window
- [DEVEXPRESS] Vẽ Biểu Đồ Stock Chứng Khoán - Công Cụ Thiết Yếu Cho Nhà Đầu Tư trên Winform
- [C#] Hướng dẫn bảo mật ứng dụng 2FA (Multi-factor Authentication) trên Winform
- [C#] Hướng dẫn convert HTML code sang PDF File trên NetCore 7 Winform
- [C#] Hướng dẫn viết ứng dụng chat với Gemini AI Google Winform
- Hướng dẫn khóa file bằng nhiều process id, không cho xóa tập tin
- Hướng dẫn cách tạo Product Id cho ứng dụng phần mềm XXXXX-XXXXX-XXXXX-XXXXX
- [SQLSERVER] Hướng dẫn tạo script sql từ ứng dụng Sqlserver management Studio
[C#] Hướng dẫn sử dụng thư viện ScrapySharp Web Scraping
Xin chào các bạn bài viết hôm nay, mình sẻ giới thiệu các bạn sử dụng thư ScrapySharp Web Scraping, dùng để lấy dữ liệu từ Website truy xuất qua thẻ CssQuery.
[C#] ScrapySharp Web Scraping
Khi các bạn download code html từ website về, sau đó các bạn muốn đọc dữ liệu từng thẻ Html element để sử dụng.
Bình thường nếu các bạn không sử dụng thư viện nào, các bạn sẽ dùng Regular Expression để phân tích cú pháp HTML.
Tuy nhiên, các bạn có thể thư viện HTMLAglityPack hoặc ScrapySharp để lấy đọc dữ liệu từng thẻ HTML một cách nhanh chóng với chỉ vài dòng code.
Ở bài viết này, mình sẻ demo lấy đọc dữ liệu từ các thẻ UL, LI ở website hình bên dưới.
Các bạn, truy cập vào link bên dưới vào bấm phím F12 trên Chrome để mở Developer tool lên, để xem cấu trúc như hình bên dưới
Bây giờ mình sẽ tiến hành lấy dữ liệu trên về ứng dụng Winform.
Đầu tiên, các bạn cài cho mình thư viện ScrapySharp từ Nuget Console
PM> Install-Package ScrapySharp -Version 3.0.0
Thư viện hiện tại khi mình đang viết bài này là 3.0.0
Source code Web Scraping C#:
private void button1_Click(object sender, EventArgs e)
{
var web = new HtmlWeb();
var url = "https://tipidpc.com/catalog.php?cat=0&sec=s";
if (web.Load(url) is HtmlAgilityPack.HtmlDocument document)
{
var nodes = document.DocumentNode.CssSelect("#item-search-results li").ToList();
foreach (var node in nodes)
{
richTextBox1.Text += "Selling: " + node.CssSelect("h2 a").Single().InnerText + Environment.NewLine;
}
}
}
Ở đoạn code trên, các bạn thấy mình sử dụng hàm CssSelect
vào các truyền vào giống jquery selector css trên website để đọc dữ liệu.
Dưới đây là kết quả khi chạy ứng dụng lên:
Thanks for watching!