- [C#] Hướng dẫn viết ứng dụng theo dõi máy in bao nhiêu trang (Monitor Printer)
- [C#] Lấy thông tin cấu hình máy tính xuất ra text file winform
- [C#] Chia sẽ class Install, Uninstall, Start và Stop Services Winform
- [C#] Tìm kiếm tập tin file nhanh chóng trên Winform sử dụng thư viện FastSearchLibrary
- [C#] Giới thiệu thư viện Fluent FTP Awesome dùng để làm việc với FTP
- [C#] Sử dụng thư viện Mini Profiler Integrations ghi log thực hiện các câu lệnh SQL
- [DEVEXPRESS] Thiết kế Dropdown ButtonBarItem trên Form Ribbon
- [C#] Lưu trạng thái các control trên Winform vào Registry Windows
- [C#] Ứng dụng ví dụ Simple Observer Pattern tăng giảm số lượng trên winform
- [C#] Hướng dẫn lấy thời gian thực server time trên winform
- [DEVEXPRESS] Hướng dẫn bật tính năng Scroll Pixcel in Touch trên GridView
- [DEVEXPRESS] Hướng dẫn sử dụng TileBar viết ứng dụng duyệt hình ảnh Winform
- [DEVEXPRESS] Tô màu border TextEdit trên Winform
- [C#] Lấy dữ liệu từ Console Write hiển thị lên textbox Winform
- [C#] Hiển thị Progress bar trên Window Console
- [C#] Di chuyển control Runtime và lưu layout trên winform
- [SQLSERVER] Sử dụng hàm NULL IF
- [C#] Chia sẽ source code mã đi tuần bằng giao diện Winform
- [C#] Flash Window in Taskbar Winform
- Download và Giải nén tập tin File sử dụng Powershell
[C#] Hướng dẫn sử dụng thư viện ScrapySharp Web Scraping
Xin chào các bạn bài viết hôm nay, mình sẻ giới thiệu các bạn sử dụng thư ScrapySharp Web Scraping, dùng để lấy dữ liệu từ Website truy xuất qua thẻ CssQuery.
[C#] ScrapySharp Web Scraping
Khi các bạn download code html từ website về, sau đó các bạn muốn đọc dữ liệu từng thẻ Html element để sử dụng.
Bình thường nếu các bạn không sử dụng thư viện nào, các bạn sẽ dùng Regular Expression để phân tích cú pháp HTML.
Tuy nhiên, các bạn có thể thư viện HTMLAglityPack hoặc ScrapySharp để lấy đọc dữ liệu từng thẻ HTML một cách nhanh chóng với chỉ vài dòng code.
Ở bài viết này, mình sẻ demo lấy đọc dữ liệu từ các thẻ UL, LI ở website hình bên dưới.

Các bạn, truy cập vào link bên dưới vào bấm phím F12 trên Chrome để mở Developer tool lên, để xem cấu trúc như hình bên dưới
Bây giờ mình sẽ tiến hành lấy dữ liệu trên về ứng dụng Winform.
Đầu tiên, các bạn cài cho mình thư viện ScrapySharp từ Nuget Console
PM> Install-Package ScrapySharp -Version 3.0.0
Thư viện hiện tại khi mình đang viết bài này là 3.0.0
Source code Web Scraping C#:
private void button1_Click(object sender, EventArgs e)
{
var web = new HtmlWeb();
var url = "https://tipidpc.com/catalog.php?cat=0&sec=s";
if (web.Load(url) is HtmlAgilityPack.HtmlDocument document)
{
var nodes = document.DocumentNode.CssSelect("#item-search-results li").ToList();
foreach (var node in nodes)
{
richTextBox1.Text += "Selling: " + node.CssSelect("h2 a").Single().InnerText + Environment.NewLine;
}
}
}
Ở đoạn code trên, các bạn thấy mình sử dụng hàm CssSelect
vào các truyền vào giống jquery selector css trên website để đọc dữ liệu.
Dưới đây là kết quả khi chạy ứng dụng lên:
Thanks for watching!