Là một seoer lam sao de seo tu khoa lên top google ? là mục tiêu và là điều mà tất mọi người đều phải quan tâm.
Website được index trong cơ sở dữ liệu của Google là một trong những tiêu chí hàng đầu trong quá trình SEO và đây là một phần không thể thiếu của bộ máy tìm kiếm.
Khi website của bạn bị mất index hoặc không được index điều này quả thực sẽ rất là xấu với bất kỳ một website nào và cả với những người đang làm SEO cho website đó.
Để khắc phục tình trạng này thì điều đầu tiên các bạn phải nắm bắt được những nguyên nhân gây ra tình trạng tệ hại này và ngay sau đây tôi sẽ tổng hợp những nguyên nhân phổ biến nhất, các bạn có thể rà soát qua những nguyên nhân này từ trên xuống dưới và khắc phục tình trạng tệ hại này một cách nhanh nhất.
1. Trang web của bạn đã được lập chỉ mục tên miền theo www hoặc không www
Về mặt kỹ thuật tên miền có chứa www là một tên miền phụ, vì vậy một tên miền có chứa www và không có chứa www la hai đường dẫn không giống nhau. Do đó hãy chắc chắn rằng bạn đã thêm cả hai thông số domain này vào trong tài khoản Google Webmaster Tool của bạn, để đảm bảo một điều rằng là chúng được lập chỉ mục cả hai. Hãy chắc chắn là bạn đã thiết lập tên miền ưu thích và xác minh quyền sở hữu của cả hai domain có www và không có www.
2. Google không tìm thấy website của bạn.
Đầy là hiện tượng thường xảy ra với những website mới và với việc này thì thường chúng ta sẽ phải giành thời gian để Google cập nhật và rà soát dữ liệu. Nhưng nếu Google vẫn không index nội dung cho website của bạn, thì điều đâu tiên bạn phải kiểm tra đó chính là bạn đã tạo sitemap cho website chưa và đã khai báo với google chưa, nếu như bạn đã làm hai việc này rồi thì bạn phải kiểm tra lại file sitemap được tạo ra và gửi lên để khai báo với google có gặp trục trặc gì không, nó có hoạt động không ( tất cả việc này chúng ta thao tác trong Google webmaster tool ) .
Quá trình này có thể sẽ phải mất 10 – 15 phút để google cập nhật, sau khi cập nhật thành công thì bạn tiếp tục làm như vậy với một đường link khác. Ngoài ra thì bạn có thể sử dụng công cụ Submit URL cá nhân theo đường link sau :google.com/webmasters/tools/submit-url, và chèn url vào ô tương ứng, nhập mã capcha và bấm vào gửi yêu cầu . Với công cụ này thì một tuần bạn có thể gửi 500 đường link lên trên này.
3. Trang web bị chặn bot truy cập với file robots.txt
Một vấn đề khác rất quan trọng đó chính là website của bạn bị chặn sự truy cập của Boot Google bởi những dòng lệnh trong file robot.txt, để giải quyết vấn đề này thì bạn có thể sửa lại những dòng lệnh hoặc ngoài thì bạn có thể xóa file này đi. Hãy tìm hiểu thêm về robot.txt tại đây
4. Website của bạn đã có một sitemap.xml chưa ?
Mỗi một trang web nên có một sitemap.xml và đây chính là bản sơ đồ, giúp Google boot có thể truy cập một cách dễ dàng và cũng giúp Google tuân theo và lập chỉ mục trang web của bạn. Bạn có thể đọc thêm về chính sách sơ đồ trang web của Google. Và cách tạo ra sitemap một cách dễ dàng. Phân này rất quan trọng, bạn nên rà soát kỹ và xem xét lại việc gửi sitemap.xml cho Google một cách nhanh chóng và chuẩn chỉ nhất.
5. website của bạn có bị lỗi thu thập thông tin ?
Trong một số trường hợp thì Google sẽ không thể lập chỉ mục cho website của bạn, bởi vì Google boot không thể thu thập được dữ liệu thông tin trên website của bạn, mặc dù Google Boot vẫn nhìn thấy dữ liệu của chúng ta.
Để khắc phục điều này thì đầu tiên các bạn phải vào Google Webmaster Tool → chọn website của bạn → click vào mục “thu thập dữ liệu “→ “ lỗi thu thập dữ liêu “, trong mục này sẽ thông kê cho các bạn thấy được toàn bộ đường link bị lỗi.
Để khắc phục điều này thì bạn nên click trực tiếp vào từng link, sau đó click vào tìm nạp như Google, sẽ giúp cho đường link bị lỗi của bạn được index trên cơ sở dữ liệu của Google.
6. Website của bạn có rất nhiều nội dung trùng lặp.
Quá nhiều nội dung trung lặp trên một website có thể sẽ gây nhầm lẫn cho công cụ tìm kiếm và sẽ gây ra tình trạng Google Boot sẽ bỏ lập chỉ mục cho website của bạn ( vì đây được xem nội dung rác, khiến cho Google Boot không index nội dung nữa ). Để khắc phục tình trạng này thì chúng ta phải sửa lại nội dung, làm mới nội dung để thoát khỏi tình trạng bị trùng lặp nội dung, ngoài ra thì các bạn có thể dùng redirect 301 để chuyển hướng những bài viết kém chất lượng sang những bài viết chất lượng, việc này sẽ làm giảm thiểu việc trùng lặp nội. Các bạn có thể dùng công cụ kiểm tra trùng lặp nội dung cho webstite, hiệu quả và nhanh chóng.
7. Bạn đã bỏ chế độ riêng tư trên website chưa ?
Trong wordpress có tính năng bảo mật theo chế độ riêng tư, đây là tính năng giúp chúng ta có quá trình xây dựng nội dung mà không index khi chưa có cấu trúc hoàn chỉnh, nhưng nếu bạn không nhớ về việc này thì sẽ khiến cho website không thể index nội dung. Để bỏ chế độ này bạn vào phần quản trị → settings → reading → Search Engine Visibility, các bạn bỏ chọn ở phần này đi nhé.
8. Website của bạn bị chặn index bởi .htaccess
Tập tin .htaccess là một phần sự tồn tại của trang web, trong mỗi website luôn luôn có tồn tại file này, các tập tin .htaccess được viết bằng apache và thực sự rất hữu và tiện dụng bởi nó có thể cho chặn index bất kỳ một danh mục nào, ngoài còn rất nhiều tính năng khác. Đây cũng là một phần để bạn phải kiểm tra và rà soát nếu như website gặp vấn đề noindex.
9. Website của bạn có noindex trong meta tag.
Để website nói không với các robot thì chỉ cần website của bạn có chèn thẻ meta noindex, thông thường sẽ như thế này :
<meta name =”robot” content = “ noindex, nofollow”>
Trong một số trường hợp các bạn có thể chèn vào web để thực hiện một số công việc khác nhau, nhưng vô tình chúng ta quên điều này thì sẽ khiên cho nội dung của website sẽ không được index bởi đã chặn Google boot lấy thông tin trên website của các bạn.Xóa bỏ dòng mã này website của bạn sẽ trở lại bình thường.
10 . Các đoạn mã AJAX/ JavaScript
Google không đánh giá cao những website có chứa và sử dụng các đoạn ngôn ngữ Ajax và JavaScript, để hiểu hơn về vấn đề này các bạn có thê đọc tại đây và Google sẽ không thể index được nội dung qua những đoạn mã này
11. Tốc độ load trang của bạn quá lâu.
Google không thích một website nào có thời gian load quá lâu, vì khi Google Boot truy vấn vào website của các bạn nhưng mất quá nhiều thời gian để có thể truy cập vào site để lấy thông tin, google boot sẽ rời bỏ website của các bạn và như thế sẽ không thể index được nội dung, các bạn nên kiểm tra lại tốc độ của hosting, domain và mức độ tối ưu của hệ thông code của website.
12. Hosting của bạn có vấn đề.
Hosting là phần là các bạn cần phải kiểm tra xem tốc độ của hosting, ngoài ra có những đơn vị cung cấp hosting ngăn chặn sự truy cập của Google Boot. Điều này sẽ khiến cho website của bạn không được Google index nội dung. Bạn cần phải kiểm tra băng thông của hosting để giải quyết vấn đề tốc độ của website và ngoài ra yêu cầu bên đơn vị cung cấp kiểm tra cũng như loại bỏ tính năng ngặn chặn sự truy cập của Google Boot.
13 . Website của bạn đột nhiên bị mất index hoàn toàn.
Đây thực sự là một điều rất là tệ hại, vì rất có thể website của bạn đang bị dính hình phạt của các thuật toán, nếu như các bạn có một trang web với lịch sử là website đen ( điều này bạn hoàn toàn không biết ) nó cũng sẽ tác động tới việc ngăn chặn index nội dung trên web của các bạn.
Nếu như website của bạn đột nhiên giảm tất cả các chỉ số, thì điều đầu tiên là phải kiểm tra lại những thông báo trong Google Webmaster Tools, tiếp đến là rà soát lại như tỉ lệ anchor text trỏ về website, lượng backlink… để có thể tìm ra nguyên nhân chính. Và tiếp đó là bạn phải thực sự nỗ lực làm việc chăm chỉ hơn, để có thể giúp cho website index trở lại.
Kết luận : Tất cả thông số chi tiết và cụ thể thì là bạn đang có kết hoạch làm SEO tốt hơn, với vấn đề website không được index hay như đột nhiên không được index thì các bạn nên tìm ra nguyên nhân chính xác, để có được kinh nghiệm cho chính bản thân và có cách sử lý nhanh nhất nếu như gặp phải trường hợp tương tự sau này.
Website được index trong cơ sở dữ liệu của Google là một trong những tiêu chí hàng đầu trong quá trình SEO và đây là một phần không thể thiếu của bộ máy tìm kiếm.
Khi website của bạn bị mất index hoặc không được index điều này quả thực sẽ rất là xấu với bất kỳ một website nào và cả với những người đang làm SEO cho website đó.
Để khắc phục tình trạng này thì điều đầu tiên các bạn phải nắm bắt được những nguyên nhân gây ra tình trạng tệ hại này và ngay sau đây tôi sẽ tổng hợp những nguyên nhân phổ biến nhất, các bạn có thể rà soát qua những nguyên nhân này từ trên xuống dưới và khắc phục tình trạng tệ hại này một cách nhanh nhất.
1. Trang web của bạn đã được lập chỉ mục tên miền theo www hoặc không www
Về mặt kỹ thuật tên miền có chứa www là một tên miền phụ, vì vậy một tên miền có chứa www và không có chứa www la hai đường dẫn không giống nhau. Do đó hãy chắc chắn rằng bạn đã thêm cả hai thông số domain này vào trong tài khoản Google Webmaster Tool của bạn, để đảm bảo một điều rằng là chúng được lập chỉ mục cả hai. Hãy chắc chắn là bạn đã thiết lập tên miền ưu thích và xác minh quyền sở hữu của cả hai domain có www và không có www.
2. Google không tìm thấy website của bạn.
Đầy là hiện tượng thường xảy ra với những website mới và với việc này thì thường chúng ta sẽ phải giành thời gian để Google cập nhật và rà soát dữ liệu. Nhưng nếu Google vẫn không index nội dung cho website của bạn, thì điều đâu tiên bạn phải kiểm tra đó chính là bạn đã tạo sitemap cho website chưa và đã khai báo với google chưa, nếu như bạn đã làm hai việc này rồi thì bạn phải kiểm tra lại file sitemap được tạo ra và gửi lên để khai báo với google có gặp trục trặc gì không, nó có hoạt động không ( tất cả việc này chúng ta thao tác trong Google webmaster tool ) .
Quá trình này có thể sẽ phải mất 10 – 15 phút để google cập nhật, sau khi cập nhật thành công thì bạn tiếp tục làm như vậy với một đường link khác. Ngoài ra thì bạn có thể sử dụng công cụ Submit URL cá nhân theo đường link sau :google.com/webmasters/tools/submit-url, và chèn url vào ô tương ứng, nhập mã capcha và bấm vào gửi yêu cầu . Với công cụ này thì một tuần bạn có thể gửi 500 đường link lên trên này.
3. Trang web bị chặn bot truy cập với file robots.txt
Một vấn đề khác rất quan trọng đó chính là website của bạn bị chặn sự truy cập của Boot Google bởi những dòng lệnh trong file robot.txt, để giải quyết vấn đề này thì bạn có thể sửa lại những dòng lệnh hoặc ngoài thì bạn có thể xóa file này đi. Hãy tìm hiểu thêm về robot.txt tại đây
4. Website của bạn đã có một sitemap.xml chưa ?
Mỗi một trang web nên có một sitemap.xml và đây chính là bản sơ đồ, giúp Google boot có thể truy cập một cách dễ dàng và cũng giúp Google tuân theo và lập chỉ mục trang web của bạn. Bạn có thể đọc thêm về chính sách sơ đồ trang web của Google. Và cách tạo ra sitemap một cách dễ dàng. Phân này rất quan trọng, bạn nên rà soát kỹ và xem xét lại việc gửi sitemap.xml cho Google một cách nhanh chóng và chuẩn chỉ nhất.
5. website của bạn có bị lỗi thu thập thông tin ?
Trong một số trường hợp thì Google sẽ không thể lập chỉ mục cho website của bạn, bởi vì Google boot không thể thu thập được dữ liệu thông tin trên website của bạn, mặc dù Google Boot vẫn nhìn thấy dữ liệu của chúng ta.
Để khắc phục điều này thì đầu tiên các bạn phải vào Google Webmaster Tool → chọn website của bạn → click vào mục “thu thập dữ liệu “→ “ lỗi thu thập dữ liêu “, trong mục này sẽ thông kê cho các bạn thấy được toàn bộ đường link bị lỗi.
Để khắc phục điều này thì bạn nên click trực tiếp vào từng link, sau đó click vào tìm nạp như Google, sẽ giúp cho đường link bị lỗi của bạn được index trên cơ sở dữ liệu của Google.
6. Website của bạn có rất nhiều nội dung trùng lặp.
Quá nhiều nội dung trung lặp trên một website có thể sẽ gây nhầm lẫn cho công cụ tìm kiếm và sẽ gây ra tình trạng Google Boot sẽ bỏ lập chỉ mục cho website của bạn ( vì đây được xem nội dung rác, khiến cho Google Boot không index nội dung nữa ). Để khắc phục tình trạng này thì chúng ta phải sửa lại nội dung, làm mới nội dung để thoát khỏi tình trạng bị trùng lặp nội dung, ngoài ra thì các bạn có thể dùng redirect 301 để chuyển hướng những bài viết kém chất lượng sang những bài viết chất lượng, việc này sẽ làm giảm thiểu việc trùng lặp nội. Các bạn có thể dùng công cụ kiểm tra trùng lặp nội dung cho webstite, hiệu quả và nhanh chóng.
7. Bạn đã bỏ chế độ riêng tư trên website chưa ?
Trong wordpress có tính năng bảo mật theo chế độ riêng tư, đây là tính năng giúp chúng ta có quá trình xây dựng nội dung mà không index khi chưa có cấu trúc hoàn chỉnh, nhưng nếu bạn không nhớ về việc này thì sẽ khiến cho website không thể index nội dung. Để bỏ chế độ này bạn vào phần quản trị → settings → reading → Search Engine Visibility, các bạn bỏ chọn ở phần này đi nhé.
8. Website của bạn bị chặn index bởi .htaccess
Tập tin .htaccess là một phần sự tồn tại của trang web, trong mỗi website luôn luôn có tồn tại file này, các tập tin .htaccess được viết bằng apache và thực sự rất hữu và tiện dụng bởi nó có thể cho chặn index bất kỳ một danh mục nào, ngoài còn rất nhiều tính năng khác. Đây cũng là một phần để bạn phải kiểm tra và rà soát nếu như website gặp vấn đề noindex.
9. Website của bạn có noindex trong meta tag.
Để website nói không với các robot thì chỉ cần website của bạn có chèn thẻ meta noindex, thông thường sẽ như thế này :
<meta name =”robot” content = “ noindex, nofollow”>
Trong một số trường hợp các bạn có thể chèn vào web để thực hiện một số công việc khác nhau, nhưng vô tình chúng ta quên điều này thì sẽ khiên cho nội dung của website sẽ không được index bởi đã chặn Google boot lấy thông tin trên website của các bạn.Xóa bỏ dòng mã này website của bạn sẽ trở lại bình thường.
10 . Các đoạn mã AJAX/ JavaScript
Google không đánh giá cao những website có chứa và sử dụng các đoạn ngôn ngữ Ajax và JavaScript, để hiểu hơn về vấn đề này các bạn có thê đọc tại đây và Google sẽ không thể index được nội dung qua những đoạn mã này
11. Tốc độ load trang của bạn quá lâu.
Google không thích một website nào có thời gian load quá lâu, vì khi Google Boot truy vấn vào website của các bạn nhưng mất quá nhiều thời gian để có thể truy cập vào site để lấy thông tin, google boot sẽ rời bỏ website của các bạn và như thế sẽ không thể index được nội dung, các bạn nên kiểm tra lại tốc độ của hosting, domain và mức độ tối ưu của hệ thông code của website.
12. Hosting của bạn có vấn đề.
Hosting là phần là các bạn cần phải kiểm tra xem tốc độ của hosting, ngoài ra có những đơn vị cung cấp hosting ngăn chặn sự truy cập của Google Boot. Điều này sẽ khiến cho website của bạn không được Google index nội dung. Bạn cần phải kiểm tra băng thông của hosting để giải quyết vấn đề tốc độ của website và ngoài ra yêu cầu bên đơn vị cung cấp kiểm tra cũng như loại bỏ tính năng ngặn chặn sự truy cập của Google Boot.
13 . Website của bạn đột nhiên bị mất index hoàn toàn.
Đây thực sự là một điều rất là tệ hại, vì rất có thể website của bạn đang bị dính hình phạt của các thuật toán, nếu như các bạn có một trang web với lịch sử là website đen ( điều này bạn hoàn toàn không biết ) nó cũng sẽ tác động tới việc ngăn chặn index nội dung trên web của các bạn.
Nếu như website của bạn đột nhiên giảm tất cả các chỉ số, thì điều đầu tiên là phải kiểm tra lại những thông báo trong Google Webmaster Tools, tiếp đến là rà soát lại như tỉ lệ anchor text trỏ về website, lượng backlink… để có thể tìm ra nguyên nhân chính. Và tiếp đó là bạn phải thực sự nỗ lực làm việc chăm chỉ hơn, để có thể giúp cho website index trở lại.
Kết luận : Tất cả thông số chi tiết và cụ thể thì là bạn đang có kết hoạch làm SEO tốt hơn, với vấn đề website không được index hay như đột nhiên không được index thì các bạn nên tìm ra nguyên nhân chính xác, để có được kinh nghiệm cho chính bản thân và có cách sử lý nhanh nhất nếu như gặp phải trường hợp tương tự sau này.