Trang web của tôi hoàn toàn biến mất khỏi Google: Bây giờ thì sao?

Google đã được biết đến là tàn nhẫn với một số vi phạm của họ và các hình phạt liên quan. Đó là một thứ cần được đưa vào hộp cát hoặc được đẩy xuống trang hai, ba hoặc sâu hơn trong tìm kiếm. Chỉ cần truy cập Google, gõ “site: www.myurl.com” là đủ và chẳng nhận được gì.

Khi điều đó xảy ra, điều đó có nghĩa là bạn đã bị xóa hoàn toàn khỏi chỉ mục tìm kiếm. Ồ, Google vẫn có dữ liệu về dữ liệu trang web của bạn được lập chỉ mục và lưu, họ vừa lấy dữ liệu đó từ chỉ mục trực tiếp. Họ nói rằng “bạn đã làm sai điều gì đó và chúng tôi sẽ xóa bạn khỏi kết quả tìm kiếm cho đến khi bạn khắc phục được sự cố”.

Có một số lý do tại sao điều này có thể xảy ra và một loạt các bước bạn có thể thực hiện để khắc phục tình trạng này. Đây là một quy trình bạn có thể sử dụng để khôi phục, lý tưởng là nhanh chóng. Nếu bạn giỏi, bạn có thể vượt qua điều này và khôi phục thứ hạng trong vòng 12 giờ.

Bước 1: Kiểm tra những gì còn thiếu

Khi thứ hạng của bạn giảm, bạn có một số giải thích phải làm và sự hoảng sợ rằng kết quả có thể ném logic ra khỏi cửa sổ trong cuộc tranh giành để khắc phục sự cố. Điều đầu tiên bạn muốn làm là sử dụng công cụ kiểm tra xếp hạng trên toàn bộ trang của bạn và / hoặc Tìm kiếm Trang web của Google (bằng cách đưa trang web: www.yoururl.com vào công cụ tìm kiếm) để xem những gì xuất hiện và không xuất hiện.

Trang web được lập chỉ mục

Có ba kết quả có thể xảy ra ở đây.

Tất cả các trang của bạn đều hiển thị trong một tìm kiếm trang web, nhưng có thứ hạng cực kỳ thấp. Điều này không nằm trong phạm vi của bài viết này; thay vào đó, bạn nên xem xét việc phục hồi sau các hình phạt như Panda và Penguin. Một số trang của bạn tồn tại, nhưng những trang khác thì không. Điều này có nghĩa là đã xảy ra sự cố với việc lựa chọn trang đó. Nếu bạn muốn khắc phục sự cố, bạn sẽ cần phải kiểm tra các trang đó để xem tại sao chúng bị xóa khỏi chỉ mục. Không có trang nào của bạn tồn tại trong tìm kiếm trang web. Điều này có nghĩa là toàn bộ trang web của bạn đã bị loại bỏ và là một hình phạt nghiêm trọng hơn nhiều. Tuy nhiên, nó có thể là một lỗi đơn giản và nó có thể dễ dàng sửa chữa.

Bước 2: Tìm kiếm sự cố NoIndex

Thuộc tính noindex là một thẻ meta có thể xuất hiện ở hai vị trí khác nhau theo cách khiến một trang bị xóa khỏi kết quả tìm kiếm của Google. Đầu tiên là trong phần dữ liệu meta cho một trang nhất định. Nếu bạn phát hiện ra rằng chỉ một số trang nhất định đã bị xóa khỏi chỉ mục, đây sẽ là điều bạn có thể muốn kiểm tra trước tiên. Điều này đặc biệt đúng nếu bạn đang chỉnh sửa hoặc thay đổi các trang đó ngay trước khi quá trình xóa diễn ra. Bạn sẽ tìm thấy thẻ trong phần đầu của trang. Nó sẽ trông giống như thế này.

Có thể có nhiều dữ liệu hơn; nó không quan trọng. Nếu tên là rô-bốt và nội dung là ngăn lập chỉ mục, bạn đang yêu cầu rô-bốt tìm kiếm – như trình thu thập dữ liệu web của Google – không lập chỉ mục trang. Lần tới khi Google nhìn thấy trang đó và đọc dữ liệu đó, nó sẽ nói “ồ chủ sở hữu trang web không muốn trang này được lập chỉ mục, tốt hơn là tôi nên xóa nó khỏi kết quả tìm kiếm.”

Vấn đề Noindex

Nếu bạn tìm thấy chỉ thị meta này trong tiêu đề của trang không còn được lập chỉ mục, xin chúc mừng; bạn đã tìm thấy vấn đề. Tất cả những gì bạn cần làm là xóa thẻ noindex. Nếu bạn muốn, bạn có thể gửi một ping đến trang thông qua các công cụ quản trị trang web của Google hoặc gửi một sơ đồ trang web mới liệt kê ngày thay đổi của trang đó là rất gần đây. Dù bằng cách nào, Google sẽ sớm phát hiện ra rằng lệnh này không còn được áp dụng nữa và sẽ vui vẻ lập chỉ mục lại trang. Lý tưởng nhất là sẽ không bị mất thứ hạng khi trang web được khôi phục lại chỉ mục.

Vị trí khác mà bạn có thể tìm thấy lệnh noindex là trong tệp robots.txt của bạn. Lý tưởng nhất là bạn sẽ tìm thấy tệp này trong thư mục gốc của mình. Có thể có các tệp robots.txt thư mục con, nhưng nếu có, bạn nên xóa chúng và hợp nhất chúng vào robots.txt trang web chính của mình.

Tệp robots.txt là một tệp văn bản đơn giản có một số thông tin và chỉ thị cơ bản cho rô bốt công cụ tìm kiếm. Nếu bạn thấy một dòng giống như “Disallow: /” thì bạn đang cấm các bot của công cụ tìm kiếm thu thập dữ liệu trang web của mình. / Là ký tự vi phạm. Nếu bạn xóa nó, mọi thứ sẽ được khôi phục. Nếu bạn thay đổi Disallow thành Allow, điều tương tự cũng xảy ra. Nếu bạn xóa toàn bộ dòng – hoặc toàn bộ tệp, nếu không có nội dung nhập nào khác trong đó – mọi thứ sẽ được cho phép.

Thông thường, lỗi này xuất hiện khi bạn đang cố gắng cải tạo trang web và bạn đang kiểm tra nó trong môi trường trực tiếp. Bạn có thể không cho phép lập chỉ mục các tệp trong trường hợp bất kỳ ai phát hiện ra chúng, vì vậy bạn không phải lo lắng về việc mọi người đang cố gắng sử dụng trang web thử nghiệm của bạn. Đây không phải là cách lý tưởng để làm điều này, nhưng tôi đã thấy nó xảy ra.

Rất may, bạn có thể dễ dàng phân tích tệp robots.txt của mình bằng công cụ như công cụ này do SEOBook cung cấp. Google cũng cung cấp một cái mà bạn có thể tìm thấy ở đây, giả sử bạn có trang web của mình được liệt kê trong các công cụ quản trị trang web.

Nói về các công cụ quản trị trang web…

Bước 3: Kiểm tra Dữ liệu Công cụ Quản trị Trang web

Có hai mục chính bạn muốn kiểm tra trong Công cụ quản trị trang web của Google. Đầu tiên là phần thao tác thủ công. Đây là nơi bạn sẽ thấy các hình phạt của Google đối với bạn, điều đó không theo thuật toán. Các thao tác thủ công có xu hướng bị xóa hoàn toàn hoặc không có gì, trong khi các hình phạt theo thuật toán là các hình phạt làm giảm thứ hạng tìm kiếm của bạn nhưng không xóa bạn hoàn toàn. Nếu bạn có bất kỳ thao tác thủ công nào tại chỗ, bạn sẽ có thể xem chúng là gì và bạn sẽ có thể làm việc để loại bỏ chúng.

Hình phạt hành động thủ công

Điều thứ hai bạn nên kiểm tra là tính năng loại bỏ URL. Bạn có thể tìm thấy điều này trong trình đơn “chỉ mục của Google”> “xóa URL”. Nếu bạn có một trang đang được lập chỉ mục và bạn không muốn nó giống như vậy – giống như một trang hệ thống hoặc một cái gì đó tương tự – bạn có thể yêu cầu xóa nó khỏi chỉ mục tại đây. Điều này giúp bạn ẩn các tệp quan trọng hoặc giảm thiểu khả năng truy cập của các cửa hậu vào trang web của bạn. Lý tưởng nhất, tất cả những gì bạn sẽ thấy ở đây là “không có yêu cầu xóa URL”. Nếu bạn thấy bất kỳ điều gì khác, có thể bằng cách nào đó bạn đã yêu cầu hủy lập chỉ mục của một số trang nhất định trên trang web của mình. Hãy hủy bỏ những yêu cầu đó và bạn sẽ có thể tiếp tục.

Bước 4: Kiểm tra thời gian ngừng hoạt động của máy chủ

Khi máy chủ không phản hồi, Google không thể thu thập dữ liệu trang. Nó cố gắng, và tất cả những gì nó nhận được là hết thời gian. Nếu điều này xảy ra, Google thường sẽ xóa trang khỏi chỉ mục và thu thập thông tin tiếp theo. Vì trang tiếp theo có thể là một trang khác trên trang web của bạn, nó sẽ xác định rằng toàn bộ trang web của bạn bị thiếu. Đối với Google, không có sự khác biệt nào giữa một trang bị thiếu trên 404, một trang bị thiếu toàn bộ hoặc một máy chủ không phản hồi. Tất cả đều dẫn đến việc trang web không còn khả dụng để truy cập và điều đó có nghĩa là tất cả chúng đều có thể dẫn đến việc trang của bạn bị xóa khỏi chỉ mục.

Thời gian ngừng hoạt động của máy chủ trong GWT

Lý do cho điều này là đơn giản và tạm thời; Google muốn cung cấp kết quả tốt nhất, vì vậy nếu kết quả không tải thì đó không phải là kết quả tốt nhất. Nó sẽ bị xóa cho đến khi nó được phát hiện là đang tải lại. Rất may, Google biết rằng thời gian ngừng hoạt động có thể xảy ra và họ sẽ không mất vài tuần để liên hệ lại với bạn. Thông thường, khi một trang không phản hồi, họ sẽ quay lại để kiểm tra và lập chỉ mục lại trong vòng một ngày. Chỉ khi có một cuộc đình công thứ hai hoặc thứ ba, họ mới nghiêm túc hơn về việc phớt lờ bạn.

Thật không may, trừ khi máy chủ lưu trữ web của bạn đã xuất bản bản ghi thời gian hoạt động, không có cách nào tốt để theo dõi phản hồi của máy chủ khi xem xét lại. Bạn phải đăng ký trang web của mình trong một số loại dịch vụ giám sát, chẳng hạn như Pingdom. Pingdom thật tuyệt và đó là điều tôi khuyên bạn nên theo dõi thời gian hoạt động của máy chủ.

Bước 5: Kiểm tra lỗi chuẩn hóa

Đây là một lỗi có thể đã xảy ra nếu bằng cách nào đó bạn đang thực hiện chuẩn hóa và có một số dây bị cắt.

Hợp chuẩn hóa là một công cụ quan trọng để duy trì sự ngang bằng của URL trên toàn bộ trang web của bạn, cũng như giảm thiểu các hình phạt về nội dung trùng lặp có thể xảy ra khi bạn tạo nội dung động thông qua một cái gì đó như tìm kiếm sản phẩm.

Ý tưởng là đơn giản; trong bất kỳ trang nào có thể bị trùng lặp, bạn thêm thẻ chuẩn vào dữ liệu meta trỏ đến phiên bản thực của trang. Vì vậy, ví dụ: trang web của bạn có thể là www.example.com. Bạn có thể thêm chuẩn hóa để bất cứ khi nào bất kỳ ai truy cập https://www.example.com, họ đều được chuyển hướng đến phiên bản phù hợp. Điều này giảm thiểu các trường hợp mà cả hai được tính là các URL khác nhau và chia rẽ sức mạnh xếp hạng trang của bạn.

Hành động tương tự cũng được sử dụng khi bạn tạo URL động. Mỗi URL duy nhất được tính là một trang khác nhau, vì vậy Google có thể thấy 1.000 trang khác nhau mà tất cả đều chia sẻ nội dung giống hệt nhau. Bạn chuẩn hóa nó để Google hiểu rằng tất cả chúng đều trên cùng một trang, chỉ với các URL động lạ.

Vấn đề xảy ra khi bạn chỉ định sai URL khi bạn thêm chuẩn hóa. Nếu tất cả các thẻ chuẩn của bạn đang trỏ đến một URL không tồn tại hoặc đó không phải là trang web của bạn, thì về cơ bản, nó sẽ xóa trang web của bạn khỏi xếp hạng và cung cấp tất cả nguồn liên kết của bạn cho trang web cho biết đó là nguồn ban đầu. Điều này rất hiếm khi trở thành một vấn đề thực sự, nhưng nó là một thứ đáng để kiểm tra.

Bước 6: Kiểm tra các dấu hiệu tấn công

Bây giờ, đến thời điểm này, bạn có thể đã thấy các dấu hiệu bị tấn công nếu có. Bạn có thể có hoạt động lạ trong nhật ký truy cập máy chủ của mình. Bạn có thể có mã bị xáo trộn kỳ lạ trong pates của mình. Bạn có thể có các trang hoàn toàn mới mà bạn không nhớ là đã tạo.

Trong mọi trường hợp, có rất nhiều cách khác nhau mà một trang web có thể bị tấn công. Ai đó có thể đã thêm trang và để trang web của bạn một mình; trang web chính vẫn ổn, nhưng các trang bổ sung được sử dụng trong thư rác, điều này khiến bạn bị Gmail và do đó hoàn toàn bị Google đưa vào danh sách đen. Bạn có thể bị thay thế trang chủ của mình bằng một trang spam. Bạn có thể đã thay thế các trang con. Bạn có thể đã thêm các liên kết phù hợp với màu văn bản trắng trên trắng vào trang chủ của mình hoặc vào các trang quan trọng khác, đánh cắp thứ hạng trang từ trang của bạn và đưa nó cho kẻ gửi thư rác. Bạn có thể đang cung cấp các bản tải xuống độc hại hoặc chuyển hướng người dùng vào một chuỗi thư rác.

Trang web bị tấn công mã lạ

Tất cả những điều này đều là dấu hiệu cho thấy trang web của bạn đang bị xâm nhập bởi một thế lực bên ngoài, đây là điều mà Google thực sự không thích. Trang web của bạn chứa đầy mã độc là lý do chắc chắn để Google xóa bạn khỏi chỉ mục. Bạn sẽ có thể khôi phục xếp hạng của mình, nhưng có thể mất một khoảng thời gian vì Google muốn đảm bảo rằng điều đó sẽ không xảy ra nữa.

Con đường để phục hồi sau hack không phải là một con đường dễ dàng. Bạn cần thay đổi tên và mật khẩu của mình cho bất kỳ tài khoản nào được liên kết với máy chủ lưu trữ web của bạn, bao gồm mạng xã hội, email, thông tin đăng nhập web khác và bất kỳ tài khoản nào khác sử dụng thông tin tương tự. Đồng thời, bạn sẽ cần kiểm tra để đảm bảo rằng bạn không gửi email khôi phục mật khẩu đến một địa chỉ khôi phục khác. Một số tin tặc đưa thông tin giả của họ vào để nếu bạn cố gắng đặt lại, họ cũng có thể đặt lại.

Chỉ khi trang web của bạn được bảo mật, bạn mới có thể bắt đầu sửa chữa nó. Lý tưởng nhất là bạn sẽ có một bản sao lưu gần đây và sẽ không mất nhiều hoặc bất cứ thứ gì từ các bản cập nhật gần đây của bạn. Khôi phục bản sao lưu đó và dữ liệu của bạn sẽ được khôi phục. Sau đó, bạn sẽ phải ping Google để cho họ biết rằng quá trình khôi phục của bạn đã kết thúc.

Thật không may, điều này sẽ mất một thời gian và có nghĩa là Google sẽ không khôi phục xếp hạng của bạn ngay lập tức. May mắn thay, đó là một lỗi có thể khắc phục được và bạn có thể sửa lỗi này trước một thời gian dài.

Bạn có thể đọc thêm về các yêu cầu bổ sung / xem xét lại tại đây, tại blog của Matt Cutts. Anh ấy cũng có một liên kết đến tài liệu chính thức. Đó là một bài đăng cũ, nhưng nó vẫn còn phù hợp, bởi vì quá trình này hầu như không thay đổi.

Nếu bạn đã xem qua tất cả những điều này và vẫn không thể xác định lý do tại sao trang web của bạn bị xóa, bạn có thể liên hệ với bộ phận hỗ trợ của Google. Họ có thể xem xét trang web của bạn và kiểm tra xem trang web đó có bị ảnh hưởng bởi hình phạt nhẹ hay hình thức tạm giữ nào đó hay không. Nếu điều đó vẫn không giúp được gì, trang web của bạn đã rơi vào tình trạng lấp lửng và cách duy nhất để thoát ra là đi du lịch đến nhà hiền triết vĩ đại của ngọn núi, người có thể cho bạn trí tuệ bất lão của ông ấy.

Trả lời

Email của bạn sẽ không được hiển thị công khai.