Trang category (danh mục) và archive (lưu trữ) có thể vừa đem lại giá trị, vừa tiềm ẩn nhiều mối nguy hại về SEO. Vậy có nên noindex hai loại trang này? Chúng ta sẽ cùng Đào Tạo SEO Á Âu giải đáp câu hỏi trên thông qua bài viết sau.
Định nghĩa trang category và archive
Trang category là bất kỳ page nào chứa hoặc link tới những page khác trên website, bất kể là sản phẩm, sub-category hay bài viết. Tương tự, trang archive thường có liên quan đến blog content và được tạo tự động bởi một số nền tảng.
Minh họa category page (Nguồn ảnh: Internet)
Tùy vào nền tảng, đội ngũ phát triển web và thậm chí là gu cá nhân mà trang category có nhiều tên gọi khác nhau, ví dụ:
• Category page
• Collections (Shopify)
• PLP – Product listing page (Salesforce Commerce Cloud)
Ví dụ, blog Cloudfare (sử dụng nền tảng Ghost) dùng cụm “tags” có chức năng tương tự category.
Một số website với sản phẩm chính là content thì sẽ có nhiều phân loại và phân cấp category. Đối với website thương mại điện tử sở hữu các blog thì category sẽ tồn tại với nhiều chức năng khác nhau.
Xác định vấn đề liên quan đến trang category
Phần lớn vấn đề xoay quanh trang category và ảnh hưởng của chúng lên hiệu suất SEO đều phân thành hai dạng: tác động đến thứ hạng và tình trạng crawl/index bloat.
Crawl/index bloat
Theo định nghĩa của VictoriousSEO, crawl/index bloat là hiện tượng quá nhiều page trên website được index/crawl trong bộ máy tìm kiếm, dẫn tới dư thừa số lượng page kém chất lượng được index.
Thực tế không hề tồn tại mối quan hệ 1:1 nào cho thấy nếu content của bạn có thể index thì Google sẽ đầu tư nguồn lực vào việc index chúng. Khi quét các trang với tần suất khác nhau, Google sẽ quyết định không index trang nào dựa trên nhiều nguyên nhân, bao gồm vấn đề về kỹ thuật hoặc không tìm thấy giá trị nào trong content của các HTML cụ thể. Tuy nhiên, không index không có nghĩa Google không quét các trang này và internal được tìm thấy.
Khi sở hữu website với hàng nghìn sản phẩm, ắt hẳn bạn sẽ muốn Google tập trung quét các nội dung thương mại hơn là nội dung phi thương mại (ví dụ các trang phân vào category blog). Tuy nhiên, bộ máy tìm kiếm vẫn có khả năng phát hiện ra rằng loại content hỗ trợ này đóng vai trò quan trọng trong các đường dẫn khi quét category (category crawl path).
Cảnh giác hiện tượng internal cannibalization
Internal cannibalization là hiện tượng “ăn thịt” nội bộ. Trang category là cơ hội nhưng cũng là nguy cơ gây tranh chấp thứ hạng giữa các cụm từ. Bạn có thể phát hiện tình trạng này bằng các URL mà bộ máy tìm kiếm trả về cho các truy vấn cụ thể thông qua công cụ như Google Search Console.
(Nguồn ảnh: Internet)
Ví dụ, website của bạn cung cấp dịch vụ industrial window cleaning, dĩ nhiên bạn muốn các trang chứa nội dung thương mại trên website sẽ xếp hạng cho những truy vấn như “industrial window cleaning”, “window cleaning for offices”, “window cleaning for businesses”…
Với những truy vấn này, người dùng có khuynh hướng tìm kiếm và sử dụng dịch vụ, chứ không phải thông tin về phương hướng phát triển của một công ty kinh doanh loại hình industrial window cleaning.
Vậy chuyện gì sẽ xảy ra nếu những page được phân vào category blog lại được Google ưu tiên hiển thị, thay vì các content thương mại?
Suy nghĩ đầu tiên của bạn ắt hẳn là tìm cách khiến trang category này không được index hoặc xếp hạng. Tuy nhiên lời khuyên là hãy đánh giá những trang thương mại tạo khách hàng tiềm năng (commercial lead generation page) mà bạn muốn xếp hạng cho các truy vấn trên và so sánh chúng với các kết quả mà Google lựa chọn để xếp hạng. Liệu content của bạn có đạt hiệu quả tương đương hay chưa khi xét về giá trị người dùng?
Noindex trang category bằng cách nào?
Nếu trang category không cung cấp đường dẫn khi quét nội bộ tới content cũ thì nên noindex những trang này. Từ khi Google ngưng cho phép noindex bằng robot.txt vào tháng 9/2019 (dù không 100%) thì lựa chọn noindex còn lại của bạn sẽ là:
• Noindex bằng meta robot tag ở cấp trang
• Noindex bằng HTTP response x-robot tag
(Nguồn ảnh: Internet)
Ngoài ra còn có một vài phương pháp khác như:
• Xóa bỏ unique content
• Giảm độ dài blog excerpt và snippet
• Chặn category page trong file robot.txt
Google vẫn sẽ quét các trang category khi bạn liên kết nội bộ giữa chúng, tuy nhiên với tần suất thấp hơn và đa phần dành thời gian cho robot.txt directive.
Hành động noindex cũng tiềm ẩn nhiều nguy cơ. Vào tháng 1/2018, Google đã xác nhận sẽ đánh giá một trang là 404 nếu noindex quá lâu.
Bên cạnh đó, nếu category có ít hơn 5 post thì nên có noindex tag. Bằng cách này, bạn có thể giúp những category nổi trội hơn được index và loại bỏ những trang ít nổi bật hơn.
Có nên noindex trang category và archive?
Câu trả lời là “Có” nếu các trang này gây ảnh hưởng không tốt đến thứ hạng. Trong trường hợp Google ưu tiên cho bài blog có vị trí cao hơn trang thương mại trên trang 1 thì sẽ gây ra tình trạng xáo trộn mục tiêu tìm kiếm đối với truy vấn. Khi đó, việc bạn cần làm là tập trung tối ưu cho các nội dung thương mại.
Ý kiến của bạn