Hotline : 0888 35 3335

seo-1-300x94-1-231x72-5

Hà Nội, Sài Gòn, Đà Nẵng

Blog

Hướng dẫn cơ bản để ẩn trang web khỏi lập chỉ mục

Lập chỉ mục các trang của trang web là những gì bắt đầu quá trình tối ưu hóa công cụ tìm kiếm. Việc cho phép các bot công cụ truy cập vào nội dung của bạn có nghĩa là các trang của bạn đã sẵn sàng cho khách truy cập và bạn muốn chúng hiển thị trong SERPs, vì vậy, việc lập chỉ mục tổng thể nghe có vẻ là một lợi ích to lớn ngay từ cái nhìn đầu tiên.

Tuy nhiên, tốt hơn hết, nên tránh xa một số loại trang nhất định khỏi SERPs. Có nghĩa là bạn cần ẩn chúng khỏi việc lập chỉ mục. Trong bài đăng này, tôi sẽ hướng dẫn bạn các loại nội dung cần ẩn khỏi công cụ tìm kiếm và chỉ cho bạn cách thực hiện.

Các trang được ẩn khỏi tìm kiếm

Hãy bắt tay vào công việc kinh doanh mà không cần phải làm gì thêm. Dưới đây là danh sách các trang bạn nên ẩn khỏi công cụ tìm kiếm để không hiển thị chúng trong SERPs.

Bảo vệ nội dung khỏi lưu lượng truy cập tìm kiếm trực tiếp là điều bắt buộc khi một trang lưu giữ thông tin cá nhân. Đây là các trang có thông tin chi tiết bí mật về công ty, thông tin về sản phẩm alpha, thông tin hồ sơ người dùng, thư từ riêng tư, dữ liệu thanh toán, v.v. Vì nội dung riêng tư nên được ẩn với bất kỳ ai khác nhưng chủ sở hữu dữ liệu, Google (hoặc bất kỳ công cụ tìm kiếm nào) không nên ‘ không làm cho những trang này hiển thị với nhiều đối tượng hơn.

Trong trường hợp biểu mẫu đăng nhập không được đặt trên trang chủ mà là một trang riêng biệt, bạn không cần thực sự hiển thị trang này trong SERPs. Những trang như vậy không mang lại bất kỳ giá trị bổ sung nào cho người dùng, có thể được coi là nội dung mỏng .

Đây là những trang mà người dùng nhìn thấy sau một hành động thành công trên một trang web, có thể là mua hàng, đăng ký hoặc bất kỳ thứ gì khác. Các trang này cũng có thể có nội dung mỏng và không mang lại ít hoặc không có giá trị bổ sung cho người tìm kiếm.

Nội dung trên loại trang này trùng lặp với nội dung của các trang chính trên trang web của bạn, có nghĩa là các trang này sẽ được coi là toàn bộ nội dung trùng lặp nếu được thu thập thông tin và lập chỉ mục.

  Chiến dịch tiếp cận email thành công trong sáu bước

Đây là vấn đề phổ biến đối với các trang web thương mại điện tử lớn có nhiều sản phẩm chỉ khác nhau về kích thước hoặc màu sắc. Google có thể không phân biệt được sự khác biệt giữa những thứ này và coi chúng là bản sao nội dung.

Khi người dùng truy cập trang web của bạn từ SERPs, họ mong đợi sẽ nhấp vào liên kết của bạn và tìm câu trả lời cho truy vấn của họ. Không phải là một SERP nội bộ khác với một loạt các liên kết. Vì vậy, nếu các SERP nội bộ của bạn được lập chỉ mục, chúng có khả năng không mang lại gì ngoài thời gian trên trang thấp và tỷ lệ thoát cao.

Nếu blog của bạn có tất cả các bài đăng được viết bởi một tác giả, thì trang tiểu sử của tác giả đó là một bản sao hoàn toàn của trang chủ blog.

Giống như các trang đăng nhập, các biểu mẫu đăng ký thường không có gì khác ngoài biểu mẫu để nhập dữ liệu của bạn để đăng ký. Do đó, trang a) trống, b) không mang lại giá trị gì cho người dùng. Đó là lý do tại sao bạn phải hạn chế các công cụ tìm kiếm kéo chúng vào SERP.

Nguyên tắc chung: các trang đang trong quá trình phát triển phải tránh xa trình thu thập thông tin của công cụ tìm kiếm cho đến khi chúng hoàn toàn sẵn sàng cho khách truy cập.

Các trang phản chiếu là các bản sao giống hệt nhau của các trang của bạn trên một máy chủ / vị trí riêng biệt. Chúng sẽ được coi là bản sao kỹ thuật nếu được thu thập thông tin và lập chỉ mục.

Ưu đãi đặc biệt và các trang quảng cáo chỉ được hiển thị cho người dùng sau khi họ hoàn thành bất kỳ hành động đặc biệt nào hoặc trong một khoảng thời gian nhất định (ưu đãi đặc biệt, sự kiện, v.v.). Sau khi sự kiện kết thúc, mọi người không cần phải xem những trang này, kể cả các công cụ tìm kiếm.

Cách ẩn trang khỏi tìm kiếm

Và bây giờ câu hỏi đặt ra là: làm thế nào để ẩn tất cả các trang được đề cập ở trên khỏi các trình thu thập dữ liệu khó chịu và giữ cho phần còn lại của trang web của bạn hiển thị theo cách mà nó nên làm?

  Cách lấy các đoạn trích nổi bật: Bốn mẹo tối ưu hóa

Khi bạn thiết lập các hướng dẫn cho công cụ tìm kiếm, bạn có hai tùy chọn. Bạn có thể hạn chế thu thập thông tin hoặc bạn có thể hạn chế lập chỉ mục một trang. < / p>

Có thể, cách đơn giản và trực tiếp nhất để hạn chế trình thu thập thông tin của công cụ tìm kiếm truy cập các trang của bạn là tạo tệp robots.txt. Tệp Robots.txt cho phép bạn chủ động loại bỏ tất cả nội dung không mong muốn khỏi kết quả tìm kiếm. Với tệp này, bạn có thể hạn chế quyền truy cập vào một trang, toàn bộ thư mục hoặc thậm chí một hình ảnh hoặc tệp.

Thủ tục này khá dễ dàng. Bạn chỉ cần tạo tệp .txt có các trường sau:

Lưu ý rằng một số trình thu thập thông tin (ví dụ: Google) cũng hỗ trợ một trường bổ sung có tên là Cho phép: . Như tên của nó, Cho phép: cho phép bạn liệt kê rõ ràng các tệp / thư mục có thể được thu thập thông tin.

Dưới đây là một số ví dụ cơ bản về tệp robots.txt được giải thích.

* trong dòng Tác nhân người dùng có nghĩa là tất cả các bot của công cụ tìm kiếm được hướng dẫn không thu thập thông tin bất kỳ trang nào trên trang web của bạn, điều này được chỉ ra bởi / < / em>. Rất có thể, đó là điều bạn muốn tránh, nhưng bây giờ bạn đã có ý tưởng.

Bằng ví dụ trên, bạn hạn chế bot Hình ảnh của Google thu thập thông tin hình ảnh của bạn trong thư mục đã chọn.

Bạn có thể tìm thêm hướng dẫn về cách