Dữ liệu hay data là những bài viết hoặc trang trong Blogspot. Chúng ta có thể hoàn toàn lấy được nguồn dữ liệu bất cứ trang Blogpot nào nhờ vào 1 tính năng mà blogspot cung cấp đó là RSS - ATOM.
Thay địa chỉ nguondulieu.blogspot.com bằng đường link của blog bạn muốn lấy dữ liệu . Copy đoạn mã đó và nhập vào bảng kiểm tra html : TẠI ĐÂY
Sau khi kiểm tra bạn sẽ thấy hiện ra "Tổng số bài" của blogspot đó. Việc xác định tổng số bài viết này để ta biết lấy dữ liệu từ bài bao nhiêu đến bao nhiêu. Vì thông thường Blogspot chỉ cho Import tối đa 500 bài.
BƯỚC 2: Lấy dữ liệu về máy bằng cách Copy đường link dưới:
Lưu ý:
diachi.blogspot.com : đường link blog mà bạn muốn lấy dữ liệu
X: Bài bắt đầu lấy (Lấy từ bài đầu tiên thì X là 1)
Y: Tổng số bài sẽ lấy tính từ X (Tổng số bài không vượt quá 500)
VÍ DỤ : Bạn muốn lấy bài từ 1 blog bất kỳ, ví dụ ở đây tôi muốn lấy 10 bài đầu tiên từ https://sureapk-msdesignbd.blogspot.com thì tôi sẽ nhập link như sau:
https://sureapk-msdesignbd.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=10
Nếu muốn lấy thêm 20 bài nữa thì bạn chỉ việc thay chỉ số cho phù hợp như sau:
Cách lấy toàn bộ dữ liệu của blogpsot |
BƯỚC 1: Xác định số lượng bài viết của trang cần lấy dữ liệu bằng đoạn code bên dưới
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Omiviet.com báo website này có: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="https://sureapk-msdesignbd.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
Sau khi kiểm tra bạn sẽ thấy hiện ra "Tổng số bài" của blogspot đó. Việc xác định tổng số bài viết này để ta biết lấy dữ liệu từ bài bao nhiêu đến bao nhiêu. Vì thông thường Blogspot chỉ cho Import tối đa 500 bài.
BƯỚC 2: Lấy dữ liệu về máy bằng cách Copy đường link dưới:
https://sureapk-msdesignbd.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y
diachi.blogspot.com : đường link blog mà bạn muốn lấy dữ liệu
X: Bài bắt đầu lấy (Lấy từ bài đầu tiên thì X là 1)
Y: Tổng số bài sẽ lấy tính từ X (Tổng số bài không vượt quá 500)
VÍ DỤ : Bạn muốn lấy bài từ 1 blog bất kỳ, ví dụ ở đây tôi muốn lấy 10 bài đầu tiên từ https://sureapk-msdesignbd.blogspot.com thì tôi sẽ nhập link như sau:
https://sureapk-msdesignbd.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=10
Nếu muốn lấy thêm 20 bài nữa thì bạn chỉ việc thay chỉ số cho phù hợp như sau:
https://sureapk-msdesignbd.blogspot.com/atom.xml?redirect=false&start-index=11&max-results=20
Paste đường link đó vào trình duyệt. Chờ load xong thì click chuột phải chọn "Lưu thành hoặc Save". File tải về sẻ được lưu dưới định dạng XML
Cách 2: Sử dụng phần mềm Internet Download Manager hoặc phần mềm khác tương đương
Mở IDM lên ---> Ấn "Add URL" ----> Paste link trên vào rồi chọn "OK"
Cuối cùng ấn "Start Download" để tải file
---------------------------------------------------------------------------------------------------------
Nhập dữ liệu (Import data) vào Blog của bạn
Đăng nhập Blog ~> Cài đặt ~> Khác ~> Ấn Nhập Blog
Cách tải data về máy tính :
Cách 1: Sử dụng trình duyệt Google Chrome, Firefox hoặc trình duyệt khácPaste đường link đó vào trình duyệt. Chờ load xong thì click chuột phải chọn "Lưu thành hoặc Save". File tải về sẻ được lưu dưới định dạng XML
Cách 2: Sử dụng phần mềm Internet Download Manager hoặc phần mềm khác tương đương
Mở IDM lên ---> Ấn "Add URL" ----> Paste link trên vào rồi chọn "OK"
Cuối cùng ấn "Start Download" để tải file
---------------------------------------------------------------------------------------------------------
Cách nhập dữ liệu đã Tải về vào trang Blogpost
Nhập dữ liệu (Import data) vào Blog của bạn
Đăng nhập Blog ~> Cài đặt ~> Khác ~> Ấn Nhập Blog
Chú ý: Khi import xong nên đăng lấy lệ một vài bài để xóa bỏ Mã Capcha, tránh việc import quá nhiều bài cùng một lúc sẽ bị google cho là spam.
Các bạn cũng không nên import quá nhiều bài của cùng 1 blog cùng 1 lúc (khoảng 4000 bài ~.~), vì làm vậy thì blog của bạn sẽ rất dễ bị xóa. Nên lấy data của nhiều blog, mỗi blog khoảng vài chục bài sẽ tốt hơn.
Các bạn cũng không nên import quá nhiều bài của cùng 1 blog cùng 1 lúc (khoảng 4000 bài ~.~), vì làm vậy thì blog của bạn sẽ rất dễ bị xóa. Nên lấy data của nhiều blog, mỗi blog khoảng vài chục bài sẽ tốt hơn.