chia sẻ:

Tạo và gửi Sơ đồ trang web

25/03/2011 11:38 | Quảng bá website - SEO

Nhìn chung, có hai loại sơ đồ trang web. Loại sơ đồ trang web thứ nhất là trang HTML liệt kê các trang trên trang web của bạn - thường theo mục - và được sử dụng để giúp người dùng tìm thông tin họ cần.

Sơ đồ trang web XML - thường được gọi là Sơ đồ trang web, với chữ S viết hoa - là một cách thức để bạn cung cấp thông tin trang web của bạn cho Google. Đây là loại Sơ đồ trang web mà chúng tôi sẽ thảo luận trong bài viết này.

Theo nghĩa đơn giản nhất, Sơ đồ trang web là một danh sách các trang trên trang web của bạn. Tạo và gửi Sơ đồ trang web giúp đảm bảo rằng Google hiểu rõ tất cả các trang trên trang web của bạn, bao gồm các URL có thể không thể phát hiện được do quy trình thu thập dữ liệu thông thường của Google.

Sơ đồ trang web đặc biệt hữu ích nếu:

  • Trang web của bạn có nội dung động.
  • Trang web của bạn có các trang mà Googlebot không dễ phát hiện trong quá trình thu thập dữ liệu - ví dụ: các trang được hỗ trợ AJAX hoặc Flash giàu tính năng.
  • Trang web của bạn mới và có một số liên kết đến trang web này. (Googlebot thu thập dữ liệu của bạn bằng cách theo dõi các liên kết từ trang này đến trang khác, vì vậy nếu trang web của bạn không được liên kết đúng, chúng tôi khó theo dõi trang web của bạn.)
  • Trang web của bạn có lưu trữ số lượng lớn các trang nội dung không được liên kết đúng với nhau hoặc không được liên kết với trang nào.

Bạn cũng có thể sử dụng Sơ đồ trang web để cung cấp cho Google các thông tin bổ sung về các trang của bạn, bao gồm:

  • Tần suất thay đổi của các trang trên trang web của bạn. Ví dụ: bạn có cập nhật trang sản phẩm của bạn mỗi ngày, nhưng cập nhật trang Giới thiệu về tôi chỉ mỗi tháng một lần.
  • Ngày mỗi trang được sửa đổi lần cuối.
  • Tầm quan trọng tương đối của các trang trên trang web của bạn. Ví dụ: trang chủ của bạn có thể có tầm quan trọng tương đối là 1.0, trang danh mục có tầm quan trọng là 0.8 và mục nhập blog cá nhân hoặc sản phẩm có tầm quan trọng là 0.5. Sự ưu tiên này chỉ cho thấy tầm quan trọng của các URL cụ thể trong tương quan với các URL khác trên trang web của bạn và không ảnh hưởng đến thứ hạng các trang của bạn trong kết quả tìm kiếm.

Sơ đồ trang web cung cấp các thông tin bổ sung về trang web của bạn cho Google, bổ sung cho các phương pháp thu thập dữ liệu web thông thường của chúng tôi. Chúng tôi hi vọng chúng sẽ giúp chúng tôi thu thập nhiều dữ liệu hơn về trang web của bạn và theo cách thức kịp thời hơn, nhưng chúng tôi không thể đảm bảo rằng các URL trong Sơ đồ trang web của bạn sẽ được thêm vào chỉ mục của Google. Các trang web không bao giờ bị phạt vì gửi Sơ đồ trang web.

Google tuân thủ Giao thức Sơ đồ trang web 0.9 như được xác định bởi sitemaps.org. Giao thức Sơ đồ trang web là một phương ngữ XML để tóm tắt thông tin Sơ đồ trang web có liên quan đến các trình thu thập dữ liệu web. Vì vậy, các Sơ đồ trang web do Google tạo sử dụng Giao thức Sơ đồ trang web 0.9 tương thích với các công cụ tìm kiếm khác áp dụng tiêu chuẩn của sitemaps.org.

Trong khi Sơ đồ trang web chuẩn hoạt động đối với hầu hết các trang web, bạn cũng có thể tạo và gửi các Sơ đồ trang web chuẩn đối với một số loại nội dung nhất định. Những định dạng Sơ đồ trang web này là đặc trưng của Google và không được sử dụng bởi các công cụ tìm kiếm khác. Định dạng Sơ đồ trang web bao gồm:

  • Sơ đồ trang web Video
  • Sơ đồ trang web di động
  • Sơ đồ trang web Tin tức
  • Sơ đồ trang web Tìm kiếm Mã
  • Sơ đồ trang web Geo

 

Tạo Sơ đồ trang web

Sử dụng nguồn cấp dữ liệu RSS / Atom như một Sơ đồ trang web

Google chấp nhận nguồn cấp dữ liệu RSS (Dịch vụ cung cấp thông tin Cực kỳ Đơn giản) 2.0 và Atom 1.0. Nếu bạn có blog có nguồn cấp dữ liệu RSS hoặc Atom, bạn có thể gửi URL của nguồn cấp dữ liệu dưới dạng một Sơ đồ trang web. Hầu hết các phần mềm tạo blog tạo cho bạn nguốn cấp dữ liệu. Nếu trang web của bạn không có nguồn cấp dữ liệu, bạn có thể sử dụng Feedburner để tạo và xuất bản nguồn cấp dữ liệu. Lưu ý rằng nguồn cấp dữ liệu chỉ có thể cung cấp thông tin về các URL gần đây.

Tạo Sơ đồ trang web dựa trên tệp văn bản

Sơ đồ trang web nên chứa danh sách các URL trang web của bạn - tối đa 50.000 URL. Nếu bạn có trang web lớn với nhiều hơn 50.000 URL, bạn nên tạo nhiều Sơ đồ trang web và gửi tệp chỉ mục Sơ đồ trang web.

Bạn có thể cung cấp cho Google tệp văn bản đơn giản chứa một URL trong mỗi dòng. Ví dụ:

http://www.example.com/file1.html
http://www.example.com/file2.html

Để có kết quả tốt nhất, hãy làm theo các nguyên tắc sau:

  1. Bạn phải chỉ định đầy đủ các URL vì Google cố gắng thu thập dữ liệu về chúng chính xác như được cung cấp.
  2. Mỗi tệp văn bản có thể chứa tối đa 50.000 URL. Nếu trang web của bạn chứa hơn 50.000 URL, bạn có thể chia danh sách thành nhiều tệp văn bản và thêm từng tệp riêng.
  3. Tệp văn bản phải sử dụng mã UTF-8. Bạn có thể chỉ định mã này khi bạn lưu tệp (ví dụ: trong Notepad, mã này được liệt kê trong trình đơn Mã hoá của hộp thoại Lưu Dưới dạng).
  4. Tệp văn bản không nên chứa nội dung nào ngoài danh sách các URL.
  5. Tệp văn bản không nên chứa thông tin đầu trang hoặc chân trang.
  6. Bạn có thể đặt bất kỳ tên nào mà bạn muốn cho tệp văn bản. Google khuyến nghị cung cấp cho tệp phần mở rộng .txt để xác định đó là tệp văn bản (ví dụ: sodotrangweb.txt).

Bạn phải tải tệp văn bản lên máy chủ của mình. Sau khi bạn tạo tệp này, bạn có thể gửi tệp dưới dạng Sơ đồ trang web. Mặc dù quá trình này hoàn toàn thủ công nhưng nó là quá trình đơn giản nhất và có thể là tốt nhất nếu bạn không quen với việc tạo tập lệnh hoặc quản lý máy chủ web của mình.

Nếu bạn có nhiều trang web, bạn có thể đơn giản hoá quá trình tạo và gửi Sơ đồ trang web bằng cách tạo một hoặc nhiều Sơ đồ trang web chứa URL cho tất cả các trang web đã được xác minh của bạn và lưu Sơ đồ trang web đến một vị trí. Tất cả các trang web phải được xác minh trong Công cụ Quản trị Trang web.