Cách lấy toàn bộ dữ liệu của Blogspot

Dữ liệu hay data là những bài viết hoặc trang trong Blogspot. Chúng ta có thể hoàn toàn lấy được nguồn dữ liệu bất cứ trang Blogpot nào nhờ vào 1 tính năng mà blogspot cung cấp đó là  RSS - ATOM.

Cách lấy toàn bộ dữ liệu cua blogspot
Cách lấy toàn bộ dữ liệu của blogpsot

BƯỚC 1: Xác định số lượng bài viết của trang cần lấy dữ liệu bằng đoạn code bên dưới

<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Omiviet.com báo website này có: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="https://sureapk-msdesignbd.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>

Thay địa chỉ  nguondulieu.blogspot.com bằng đường link của blog bạn muốn lấy dữ liệu . Copy đoạn mã đó và nhập vào bảng kiểm tra html : TẠI ĐÂY

Sau khi kiểm tra bạn sẽ thấy hiện ra "Tổng số bài" của blogspot đó. Việc xác định tổng số bài viết này để ta biết lấy dữ liệu từ bài bao nhiêu đến bao nhiêu. Vì thông thường Blogspot chỉ cho Import tối đa 500 bài.


BƯỚC 2: Lấy dữ liệu về máy bằng cách Copy đường link dưới:

https://sureapk-msdesignbd.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y

Lưu ý:

diachi.blogspot.com : đường link blog mà bạn muốn lấy dữ liệu
X: Bài bắt đầu lấy (Lấy từ bài đầu tiên thì X là 1)
Y: Tổng số bài sẽ lấy tính từ X (Tổng số bài không vượt quá 500)

VÍ DỤ : Bạn muốn lấy bài từ 1 blog bất kỳ, ví dụ ở đây tôi muốn lấy 10 bài đầu tiên từ https://sureapk-msdesignbd.blogspot.com thì tôi sẽ nhập link như sau:

https://sureapk-msdesignbd.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=10

Nếu muốn lấy thêm 20 bài nữa thì bạn chỉ việc thay chỉ số cho phù hợp như sau:

https://sureapk-msdesignbd.blogspot.com/atom.xml?redirect=false&start-index=11&max-results=20


Cách tải data về máy tính :

Cách 1: Sử dụng trình duyệt Google Chrome, Firefox hoặc trình duyệt khác

Paste đường link đó vào trình duyệt. Chờ load xong thì click chuột phải chọn "Lưu thành hoặc Save". File tải về sẻ được lưu dưới định dạng XML


Cách 2: Sử dụng phần mềm Internet Download Manager hoặc phần mềm khác tương đương

Mở IDM lên --->  Ấn "Add URL" ----> Paste link trên vào rồi chọn "OK"


Cuối cùng ấn "Start Download" để tải file

---------------------------------------------------------------------------------------------------------

Cách nhập dữ liệu đã Tải về vào trang Blogpost


 Nhập dữ liệu (Import data) vào Blog của bạn

Đăng nhập Blog ~> Cài đặt ~> Khác ~> Ấn Nhập Blog


Chọn file .xml vừa tải về để import lên blog của bạn ~> Ấn Nhập blog


Chú ý: Khi import xong nên đăng lấy lệ một vài bài để xóa bỏ Mã Capcha, tránh việc import quá nhiều bài cùng một lúc sẽ bị google cho là spam.
Các bạn cũng không nên import quá nhiều bài của cùng 1 blog cùng 1 lúc (khoảng 4000 bài ~.~), vì làm vậy thì blog của bạn sẽ rất dễ bị xóa. Nên lấy data của nhiều blog, mỗi blog khoảng vài chục bài sẽ tốt hơn.

Post a Comment

Previous Post Next Post

Labels Max-Results No.

Boxed(True/False)