Всем привет дорогие друзья! Недавно, неделю назад, я столкнулся с такой проблемой, на одном сайте, что у меня выпали все страницы из индекса поисковый системы Яндекс. Если честно, я подумал что был наложен какой-то , хотя до этого момента, все страницы попали в индекс очень быстро и сидели там 1,5 месяца отлично.
За эти полтора месяца я только и писал статьи, а больше ничего противозаконного не делал. Поэтому мне было обидно, что так со мной поступил Яндекс. Естественно, что я не хотел это все дело оставлять и как можно быстрее вернуть страницы в индекс. Я проверил свой сайт на сервисе и выявил, что мне там пишет: Отсутствует сохраненная копия в Яндексе!
Если честно, то я не понял ничего, почему копия сайта там отсутствует. Я начал искать проблему и наткнулся на один сайт, где у него была похожая проблема, то есть, тоже отсутствовала сохраненная копия сайта в поисковой системе Яндекс. Но у него страницы из-за этого не выпали, а просто просели позиции.
Я все равно надеялся, что при помощи его сайта решу проблему. Оказывается, у него отсутствовала копия в Яндексе из-за того, что на его страницах сайта присутствовал тег noarchive , который был автоматически включен при использовании плагина WordPress – Robots Meta. В настройках этого плагина была включена опция запрета делать копию в поисковых системах, то есть, прописывался тег для страниц – noarchive .
На моем сайте не был установлен данный плагин, но я все равно проверил все страницы на наличие данного тега, причем не только страницы, но и файл robots.txt. В итоге я так ничего и не нашел. То есть, данный вариант для меня отпадал, на моем ресурсе не присутствовало такого тега.
Мне ничего не оставалось, как обратиться в службу технической поддержки поисковой системы Яндекс и выяснить причину (см. как ):
В вебмастере Яндекса, для сайта ********** отображается, что в индексе 57 страниц, а на самом деле 1 страница. На сервисе xtool проверяю его и мне выдает сообщение: Отсутствует сохранённая копия в Яндексе!
Я проверил свой сайт на наличие тега noarchive и нигде его не было. Скажите, почему сайт 49 дней был полностью в индексе, а сейчас только одна главная страница сайта?
Через 1 сутки мне пришел ответ от Яндекса:
В настоящее время невозможно выяснить, что спровоцировало исключение страниц Вашего сайта, так как подобная информация не хранится. В ближайшее время Ваш сайт должен начать индексироваться и затем сможет появиться в поиске. Скорее всего, это произойдет в течение двух недель. Пожалуйста, дождитесь окончания указанного срока.
То есть, у меня еще была надежда на то, что мой сайт будет проиндексирован нормально, что это какое-то недоразумение и страницы выпали из-за какой-то ошибки, ведь надежда умирает последней.
В итоге, весь следующий день я наблюдал, как мой сайт «штормило», то есть, то в индексе была 1 страница, то 8, то 57 и так каждый день, цифры менялись. Но сегодня произошел апдейт и сейчас страницы все снова в индексе, чему я очень рад. Так что, если у Вас возникла такая проблема, то причины могут быть следующими:
- На сайте присутсвует тег noarchive
- Тег noarchive прописан в robots.txt
- Временные проблемы с сервисами или поисковыми системами
В общем, если у Вас возникла такая ситуация, то не стоит сразу паниковать, посмотрите все возможные причины, сделайте те моменты, которые проделал я, а затем уже делайте выводы. Удачи Вам дорогие друзья и до новых встреч!
Слово кэш можно услышать довольно часто в разных сферах ИТ, сегодня же мы будем разбираться с кэшем страниц сайта. Сам термин означает сохранение поисковыми системами копий страниц от определенного числа, как правило от последнего посещения роботом сайта. Вы можете в любой момент найти и использовать копию (кэш) страницы для своих потребностей.
Это довольно таки хорошо, что поисковики сохраняют на некоторое время страницы на своих серверах и дают нам шанс воспользоваться этим. На хранение кэшированных страниц выделяется много ресурсов и денег, но свою помощь они окупают, так как нам все равно необходимо заходить на их поисковые системы.
Для чего нужен кэш (копии) страниц
Бывают разные ситуации при работе с сайтами.
Как всегда работы у Вас много, а времени мало и внимательности на все не хватает. Бывают случаи, когда ведутся работы с сайтом, предположим изменение дизайна или мелкие правки по шаблону, тексту. И в один момент понимаете, что где-то допустили ошибку и пропал текст или исчезла часть дизайна сайта. Ну бывает такое и каждый наверное с таким имел дело.
На данный момент, бэкапов у Вас нету, у тоже и не помните как выглядело все изначально. В этом случае помочь сможет копия страницы, которую можно найти в кэше как Яндекса, так и в Гугла, посмотреть как было изначально и поправить.
Или второй случай , Вы изменили немного текст, для того, что бы повысить и хотите посмотреть обновилась страница на которой внесли изменения или нет. Проверить можно с помощью страницы, которая находится в кэше, для этого ищем данную страницу и смотрим на результат.
Так же бывает ситуация, когда сайт не доступен, по той или иной причине, а вам необходимо на него зайти. В этом случае может помочь копия страницы которую можно найти ниже перечисленными способами.
В общем я думаю, стало ясно, что пользоваться кэшем страниц нужно и полезно.
Как найти страницу в кэше Google, Yandex
Для начала давайте рассмотрим как искать в поисковой системе Google.
Способ №1.
Вы заходите на страницу поисковой системы и прописываете адрес страницы которую хотите найти и посмотреть копию. Я возьму для примера наш сайт:
Прописываем название страницы, сайта в поисковую строку, нажимаем “Enter” и видим , где отображается страница которую вы искали. Смотрим на сниппет и там де УРЛ (адрес) с права от него есть не большая стрелочка вниз, нажимаем на нее и у нас появляется пункт “Сохранённая копия”. Нажимаем на него и нас перекинет на копию страницу от определенного числа.
Способ №2.
Способ можно назвать полуавтоматическим, так как необходимо скопировать адрес, что находится ниже и вместо site.ru подставить домен своего сайта. В результате Вы получите туже самую копию страницы.
http://webcache.googleusercontent.com/search?q=cache:site.ru
Способ №3.
Можно просматривать кэш с помощью плагинов для браузеров или онлайн сервисов. Я использую для этих целей .
Здесь можно посмотреть когда последний раз заходил робот на ресурс, соответственно и копия страницы будет за это число.
Теперь рассмотрим как искать кэш в поисковой системе Яндекс.
Способ №1.
Способ такой же как и для системы Google. Заходим на страницу поисковой системы и прописываете адрес страницы которую хотите найти и посмотреть копию. Снова возьму для примера наш сайт и пропишу:
Прописываем название страницы, сайта в поисковую строку, нажимаем “Enter” и видим поисковую выдачу, где отображается страница которую вы искали. Смотрим на сниппет и там де с права от него есть не большая стрелочка вниз, нажимаем на нее и у нас появляется пункт “Сохранённая копия”. Нажимаем на него и нас перекинет на копию страницу от определенного числа.
Способ №2.
Используем дополнительные плагины для браузеров. Читайте немного выше всё так же как и для Google.
Если страница не находится в , то большая вероятность того, что ее нету и в кэше. Если страница была ранее в индексе, то возможно она сохранилась в нем.
Как очистить кэш в Yandex, Google
Бывает необходимо убрать страницу из кэша Яндекса или Гугла или вообще скрыть страницу которая ранее индексировалась и кешировалась от посторонних глаз. Для этого необходимо дождаться пока поисковая система сама выкинет данную страницу естественным путем если Вы ее предварительно удалили. Можно запретить индексировать страницу в файле или использовать тег:
Только смотрите аккуратно с тегом, не поставьте его в общий шаблон сайта ибо будет запрет на кэширование всего сайта. Для этих целей лучше всего используйте дополнительные плагины или программистов которые ранее занимались такой работой.
Теперь давайте посмотрим как средствами поисковой системы Google и Яндекс можно очистить кэш (очистить, удалить страницу).
Очистить кэш страницы в Google
Поисковая система Google к этому вопросу подошла с правильной стороны и создала такой инструмент как «Удалить URL-адреса » в Webmaster Tools. Что бы им воспользоваться необходимо зайти в инструменты вебмастера по адресу:
www.google.com/webmasters/
Очистить кэш страницы в Google Webmaster
Для того, что бы очистить кеш или удалить полностью страницу (а так же можно сразу удалить и очистить кэш вместе), необходимо нажать на кнопку «Временно скрыть » и ввести url адрес страницы которую необходимо очистить и нажать кнопку «Продолжить «.
Теперь в данном окне при нажатии на список «Тип запроса » можно увидеть несколько способов удаления и очистки как страницы с индекса гугла так и очистки кєша.
- Если Вам необходимо полностью удалить страницу и cache, то используем первый способ.
- Если необходимо просто очистить его, то используем второй способ. Как правило для нашего примера нужно использовать именно его. Страница остается в индексе, но кэш удаляется и при следующем приходе робота, она снова появится там.
- Если необходимо временно скрыть, то используем третий способ. Используется в том случае когда не успевают наполнятся страницы качественным контентом. В данном случае скрыть ее на некоторое время будет лучше.
Как только выбираете один из способов, в данном случае 2й, нажимаем на кнопку «Отправить запрос «.
После нажатия получаем страницу, где можно увидеть, что данная страница добавлена на удаление из кэша и находится в статуже «Ожидание «. Теперь остается только ждать. Как правило данная процедура занимает от нескольких минут до нескольких часов.
Если Вы не правильно указали страницу и хотите сделать отмену, то можно нажать на кнопку «Отмена «.
После того как вы через некоторое время зайдете в инструмент «Удалить URL-адреса», можно будет увидеть статус «Выполнено». Это означает, что робот Гугл зашел на страницу и очистил ее историю.
Очистить (удалить) страницу в Yandex
У поисковой системы Яндекс есть похожий инструмент в инструментах для вебмастеров, но здесь есть одно «НО». Очистки кэша как такового нету, можно целиком удалить страницу из индекса ПС и при этом удалится вся ее история.
Для того, что бы воспользоваться данным инструментом необходимо зайти в Yandex webmaster по ссылке:
webmaster.yandex.ua/delurl.xml
и в строку ввести необходимый урл.
Поисковая система исключит данный адрес через некоторое время «АП». Как правило у Яндекса на это уходит пару ней, поэтому необходимо будет подождать.
Если у Вас есть вопросы задавайте их в комментариях, мы всегда на связи!
Иногда владельцам сайтов требуется оперативно обновить страницу сайта или ее сохраненную копию. Это может быть необходимо в том случае, если на странице опубликована неверная или устаревшая информация, и ее нужно убрать из поиска, либо заменить на более свежую. Бывает и так, что контактная информация организации изменилась, и необходимо оперативно обновить эти данные в сохраненной копии.
Для этого в Яндекс.Вебмастере появился новый инструмент – «Переиндексирование». С помощью него можно существенно ускорить процесс обновления отдельных страниц и их сохраненных копий.
Для обновления необходимо добавить адреса устаревших страниц и передать их для приоритетного обхода поисковому роботу. Они будут исключены из поиска на несколько часов, после чего в поиске появятся уже обновленные версии.
В течение суток можно добавить на переиндексацию пять страниц, так как инструмент предназначен для экстренных случаев, когда нужно быстро переиндексировать ограниченное число страниц и обновить устаревшую информацию.
21 октября работа инструмента была временно приостановлена по техническим причинам.
","contentType":"text/html"},"proposedBody":{"source":"Как известно, робот Яндекса периодически обходит сайты интернета и отслеживает изменения, произошедшие на страницах, то есть проводит переиндексирование. Информация в интернете обновляется с такой скоростью, что ни одна поисковая система не в состоянии мгновенно индексировать все содержимое. Робот может переиндексировать часто обновляемые документы несколько раз в день, а редко обновляемые – реже. При этом для каждой страницы в поиске Яндекса создается ее сохраненная копия.
Иногда владельцам сайтов требуется оперативно обновить страницу сайта или ее сохраненную копию. Это может быть необходимо в том случае, если на странице опубликована неверная или устаревшая информация, и ее нужно убрать из поиска, либо заменить на более свежую. Бывает и так, что контактная информация организации изменилась, и необходимо оперативно обновить эти данные в сохраненной копии.
Для этого в Яндекс.Вебмастере появился новый инструмент – «Переиндексирование». С помощью него можно существенно ускорить процесс обновления отдельных страниц и их сохраненных копий.
Для обновления необходимо добавить адреса устаревших страниц и передать их для приоритетного обхода поисковому роботу. Они будут исключены из поиска на несколько часов, после чего в поиске появятся уже обновленные версии.
В течение суток можно добавить на переиндексацию пять страниц, так как инструмент предназначен для экстренных случаев, когда нужно быстро переиндексировать ограниченное число страниц и обновить устаревшую информацию.
21 октября работа инструмента была временно приостановлена по техническим причинам.
","html":"Как известно, робот Яндекса периодически обходит сайты интернета и отслеживает изменения, произошедшие на страницах, то есть проводит переиндексирование. Информация в интернете обновляется с такой скоростью, что ни одна поисковая система не в состоянии мгновенно индексировать все содержимое. Робот может переиндексировать часто обновляемые документы несколько раз в день, а редко обновляемые – реже. При этом для каждой страницы в поиске Яндекса создается ее сохраненная копия.
Иногда владельцам сайтов требуется оперативно обновить страницу сайта или ее сохраненную копию. Это может быть необходимо в том случае, если на странице опубликована неверная или устаревшая информация, и ее нужно убрать из поиска, либо заменить на более свежую. Бывает и так, что контактная информация организации изменилась, и необходимо оперативно обновить эти данные в сохраненной копии.
Для этого в Яндекс.Вебмастере появился новый инструмент – «Переиндексирование». С помощью него можно существенно ускорить процесс обновления отдельных страниц и их сохраненных копий.
Для обновления необходимо добавить адреса устаревших страниц и передать их для приоритетного обхода поисковому роботу. Они будут исключены из поиска на несколько часов, после чего в поиске появятся уже обновленные версии.
В течение суток можно добавить на переиндексацию пять страниц, так как инструмент предназначен для экстренных случаев, когда нужно быстро переиндексировать ограниченное число страниц и обновить устаревшую информацию.
21 октября работа инструмента была временно приостановлена по техническим причинам.
","contentType":"text/html"},"authorId":"30364427","slug":"8841","canEdit":false,"canComment":false,"isBanned":false,"canPublish":false,"viewType":"old","isDraft":false,"isOnModeration":false,"isSubscriber":false,"commentsCount":76,"modificationDate":"Thu Jan 01 1970 03:00:00 GMT+0000 (Coordinated Universal Time)","showPreview":true,"approvedPreview":{"source":"Как известно, робот Яндекса периодически обходит сайты интернета и отслеживает изменения, произошедшие на страницах, то есть проводит переиндексирование. Информация в интернете обновляется с такой скоростью, что ни одна поисковая система не в состоянии мгновенно индексировать все содержимое. Робот может переиндексировать часто обновляемые документы несколько раз в день, а редко обновляемые – реже. При этом для каждой страницы в поиске Яндекса создается ее сохраненная копия.
Иногда владельцам сайтов требуется оперативно обновить страницу сайта или ее сохраненную копию. Это может быть необходимо в том случае, если на странице опубликована неверная или устаревшая информация, и ее нужно убрать из поиска, либо заменить на более свежую. Бывает и так, что контактная информация организации изменилась, и необходимо оперативно обновить эти данные в сохраненной копии.
Для этого в Яндекс.Вебмастере появился новый инструмент – «Переиндексирование». С помощью него можно существенно ускорить процесс обновления отдельных страниц и их сохраненных копий.
Для обновления необходимо добавить адреса устаревших страниц и передать их для приоритетного обхода поисковому роботу. Они будут исключены из поиска на несколько часов, после чего в поиске появятся уже обновленные версии.
В течение суток можно добавить на переиндексацию пять страниц, так как инструмент предназначен для экстренных случаев, когда нужно быстро переиндексировать ограниченное число страниц и обновить устаревшую информацию.
21 октября работа инструмента была временно приостановлена по техническим причинам.
","html":"Как известно, робот Яндекса периодически обходит сайты интернета и отслеживает изменения, произошедшие на страницах, то есть проводит переиндексирование. Информация в интернете обновляется с такой скоростью, что ни одна поисковая система не в состоянии мгновенно индексировать все содержимое. Робот может переиндексировать часто обновляемые документы несколько раз в день, а редко обновляемые – реже. При этом для каждой страницы в поиске Яндекса создается ее сохраненная копия. ","contentType":"text/html"},"proposedPreview":{"source":"Как известно, робот Яндекса периодически обходит сайты интернета и отслеживает изменения, произошедшие на страницах, то есть проводит переиндексирование. Информация в интернете обновляется с такой скоростью, что ни одна поисковая система не в состоянии мгновенно индексировать все содержимое. Робот может переиндексировать часто обновляемые документы несколько раз в день, а редко обновляемые – реже. При этом для каждой страницы в поиске Яндекса создается ее сохраненная копия.
Иногда владельцам сайтов требуется оперативно обновить страницу сайта или ее сохраненную копию. Это может быть необходимо в том случае, если на странице опубликована неверная или устаревшая информация, и ее нужно убрать из поиска, либо заменить на более свежую. Бывает и так, что контактная информация организации изменилась, и необходимо оперативно обновить эти данные в сохраненной копии.
Для этого в Яндекс.Вебмастере появился новый инструмент – «Переиндексирование». С помощью него можно существенно ускорить процесс обновления отдельных страниц и их сохраненных копий.
Для обновления необходимо добавить адреса устаревших страниц и передать их для приоритетного обхода поисковому роботу. Они будут исключены из поиска на несколько часов, после чего в поиске появятся уже обновленные версии.
В течение суток можно добавить на переиндексацию пять страниц, так как инструмент предназначен для экстренных случаев, когда нужно быстро переиндексировать ограниченное число страниц и обновить устаревшую информацию.
21 октября работа инструмента была временно приостановлена по техническим причинам.
","html":"Как известно, робот Яндекса периодически обходит сайты интернета и отслеживает изменения, произошедшие на страницах, то есть проводит переиндексирование. Информация в интернете обновляется с такой скоростью, что ни одна поисковая система не в состоянии мгновенно индексировать все содержимое. Робот может переиндексировать часто обновляемые документы несколько раз в день, а редко обновляемые – реже. При этом для каждой страницы в поиске Яндекса создается ее сохраненная копия. ","contentType":"text/html"},"titleImage":null,"tags":[{"displayName":"Я.Вебмастер","slug":"ya-vebmaster","categoryId":"4875257","url":"/blog??tag=ya-vebmaster"}],"isModerator":false,"publishCount":1,"commentsEnabled":true,"url":"/blog/8841","urlTemplate":"/blog/%slug%","fullBlogUrl":"https://webmaster.yandex.ru/blog","addCommentUrl":"/blog/createComment/webmaster/8841","updateCommentUrl":"/blog/updateComment/webmaster/8841","addCommentWithCaptcha":"/blog/createWithCaptcha/webmaster/8841","changeCaptchaUrl":"/blog/api/captcha/new","putImageUrl":"/blog/image/put","urlBlog":"/blog","urlEditPost":"/blog/569df477cb28c8a50611b734/edit","urlSlug":"/blog/post/generateSlug","urlPublishPost":"/blog/569df477cb28c8a50611b734/publish","urlUnpublishPost":"/blog/569df477cb28c8a50611b734/unpublish","urlRemovePost":"/blog/569df477cb28c8a50611b734/removePost","urlDraft":"/blog/8841/draft","urlDraftTemplate":"/blog/%slug%/draft","urlRemoveDraft":"/blog/569df477cb28c8a50611b734/removeDraft","urlTagSuggest":"/blog/api/suggest/webmaster","urlAfterDelete":"/blog","isAuthor":false,"subscribeUrl":"/blog/api/subscribe/569df477cb28c8a50611b734","unsubscribeUrl":"/blog/api/unsubscribe/569df477cb28c8a50611b734","urlEditPostPage":"/blog/569df477cb28c8a50611b734/edit","urlForTranslate":"/blog/post/translate","urlRelateIssue":"/blog/post/updateIssue","urlUpdateTranslate":"/blog/post/updateTranslate","urlLoadTranslate":"/blog/post/loadTranslate","urlTranslationStatus":"/blog/8841/translationInfo","urlRelatedArticles":"/blog/api/relatedArticles/webmaster/8841","author":{"id":"30364427","uid":{"value":"30364427","lite":false,"hosted":false},"aliases":{},"login":"webmaster","display_name":{"name":"webmaster","avatar":{"default":"0/0-0","empty":true}},"address":"[email protected]","defaultAvatar":"0/0-0","imageSrc":"https://avatars.mds.yandex.net/get-yapic/0/0-0/islands-middle","isYandexStaff":false},"originalModificationDate":"1970-01-01T00:00:00.000Z","socialImage":{"orig":{"fullPath":"https://avatars.mds.yandex.net/get-yablogs/51778/file_1461153249801/orig"}}}}}">
Инструмент для обновления сохраненной копии в Яндекс.Вебмастере
Пост в архиве.
Как известно, робот Яндекса периодически обходит сайты интернета и отслеживает изменения, произошедшие на страницах, то есть проводит переиндексирование. Информация в интернете обновляется с такой скоростью, что ни одна поисковая система не в состоянии мгновенно индексировать все содержимое. Робот может переиндексировать часто обновляемые документы несколько раз в день, а редко обновляемые – реже. При этом для каждой страницы в поиске Яндекса создается ее сохраненная копия.
Иногда владельцам сайтов требуется оперативно обновить страницу сайта или ее сохраненную копию. Это может быть необходимо в том случае, если на странице опубликована неверная или устаревшая информация, и ее нужно убрать из поиска, либо заменить на более свежую. Бывает и так, что контактная информация организации изменилась, и необходимо оперативно обновить эти данные в сохраненной копии.
Для этого в Яндекс.Вебмастере появился новый инструмент – «Переиндексирование». С помощью него можно существенно ускорить процесс обновления отдельных страниц и их сохраненных копий.
Для обновления необходимо добавить адреса устаревших страниц и передать их для приоритетного обхода поисковому роботу. Они будут исключены из поиска на несколько часов, после чего в поиске появятся уже обновленные версии.
В течение суток можно добавить на переиндексацию пять страниц, так как инструмент предназначен для экстренных случаев, когда нужно быстро переиндексировать ограниченное число страниц и обновить устаревшую информацию.
21 октября работа инструмента была временно приостановлена по техническим причинам.
Представьте ситуацию: вы создаете сайт. Нанимаете веб-мастера или делаете его сами, потратив на это много денег и личного времени. Размещаете свое детище на хостинге и любовно заполняете его информацией, не задумываясь о том, что нужно сохранить копию сайта, чтобы не потерять данные.
В один день, не очень для вас прекрасный, вы заходите на свой сайт, а он не работает. Вы начинаете узнавать, в чем дело, и, о ужас, сгорел дата-центр или полетел хостинг. А может, к вам забрался вирус и уничтожил данные. Потеря информации на сайте сравнима с потерей информации на компьютере. Так как же сохранить копию сайта?
Разберемся сначала с определением. Процесс архивирования веб-сайтов — это сохранение текущей версии страницы или сайта в архиве для последующей работы с ним. Для данных целей используется специализированное программное обеспечение. Крупнейшей компанией в мире является Internet Archive, о которой мы поговорим ниже.
Для частного архива вы можете воспользоваться офлайн-браузерами, которые были специально созданы для работы в офлайн-режиме. Они помогут создать локальные копии отдельных веб-страниц или сайтов целиком. К ним, например, относятся:
- Кросс-платформенный HTTrack-браузер, который поддерживает 29 мировых языков и способен возобновлять прерванные закачки, обновлять зеркало сайта.
- Условно бесплатный Offline Explorer, который позволяет скачивать не только файлы или страницы, но и целые сайты из Интернета по протоколам FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
- Free Download Manager. Он интегрируется со всеми браузерами, имеет встроенный FTP, поддерживает протокол BitTorrent, может создавать torrent-файлы, перехватывать ссылки из буфера обмена.
- Teleport Pro с закрытым исходным кодом для Windows. Программа позволяет скачивать сайты целиком.
- Свободная консольная неинтерактивная программа для загрузки файлов и сайтов из Интернета Wget. Программа поддерживает протоколы HTTPS, HTTP, FTP, а также может работать через HTTP прокси-сервер. Подходит для Linux.
Создание резервной копии на хостинге
Можно настроить сайта на вашем хостинг-провайдере. Для этого вам нужно зайти в админпанель, в раздел создания резервных копий. У каждого хостинга своя админпанель, и тяжело сказать, где именно у вашего размещается этот раздел. Если не можете разобраться, напишите в техническую поддержку.
Создание резервной копии плагинами
Если ваш сайт размещается на CMS-платформе, такой как, например, WordPress, вы можете сохранить копию сайта, установив плагин wp-db-backup (ru.wordpress.org/plugins/wp-db-backup/) или похожие на него. Правильно настроив плагин, вы будете получать бэкап сайта каждый день или каждую неделю, как пожелаете.
Как сохранить копию сайта на компьютер
На компьютер можно сохранить сайт, используя FTP-клиент. Если вы пользуетесь программой FileZilla, то создайте на своем компьютере папку "Бэкап" (имя папки может быть любым). Подключитесь к серверу через FTP-клиент и простым перетаскиванием сделайте полный бэкап сайта в папку "Бэкап".
Кроме этого, можно воспользоваться сервисом Site2ZIP (сайт в архив), программой для скачивания WinHTTrack WebSite Copier. Как посмотреть сохраненную копию сайта? Для этого нужно открыть папку, в которой был сохранен сайт, и кликнуть на файл index.html.
Интернет-архив
В Сан-Фарнциско в 1996 году Брюстер Кейл основал некоммерческую организацию "Архив Интернета". Он собирает копии всех веб-страниц, аудио- и видеозаписи, графические файлы и программы. Здесь очень долго хранятся архивы собранного материала и имеется к своим базам бесплатный доступ для всех желающих.
Если вы задаетесь вопросом о том, как открыть сохраненную копию сайта, то перейдите по адресу archive.org/web/ и в соответствующем поле введите адрес сайта или страницы. В конце 2012 года размер Интернет-архива составлял 10 петабайт - это 10 000 терабайт! А к середине 2016 года в нем накопилось 502 млрд копий веб-страниц.
поисковыми системами
Сохраненная копия сайта Google — это не что иное, как кэш страниц сайта, который был сделан поисковой системой. Любой пользователь в любой момент может использовать для своих нужд копию страницы. Сохранение их на серверах поисковых систем занимает много ресурсов, и для этого выделяется немало денег, но такая помощь окупает себя, так как мы все равно заходим на поисковые системы. Правда, этот способ подходит только для существующих сайтов или для тех, которые были удалены недавно. Если же это произошло достаточно давно, то поисковая система стирает данные.
Специализированный поисковик
Кроме того, что вы можете вручную искать кэшированные страницы в Google или "Яндексе", вы можете воспользоваться специализированным поисковиком cachedview.com. У него есть аналог: cachedpages.com.
Если вы хотите сохранить копию сайта или его отдельной страницы, вы можете сделать это самостоятельно и бесплатно на сайте archive.is. Кроме этого, там есть и глобальный поиск по версиям, которые были когда-либо сохранены пользователем.
Создание веб-архива в национальных библиотеках
На сегодняшний день перед национальными библиотеками стоит задача создания архивов интернет-документов, которые являются частью научного, культурного и исторического наследия человечества. Но это очень проблематично.
Проведенные исследования выявили, что количество веб-документов в Сети растет экспоненциально, и в среднем документ живет от одного до четырех месяцев. В качестве единицы учета архива веб-документов удобнее всего использовать веб-сайт. Процесс создания фонда состоит в создании копии или "зеркала" сайта. Так как информация на нем изменяется со временем, библиотеке нужно создавать зеркала одного и того же веб-сайта с определенной периодичностью.
Так, в Швеции 60 000 сайтов, что в 20 раз превышает количество традиционных печатных изданий. Экземпляры печатных документов в библиотеке Швеции занимают 1,7 км полок в год. Веб-архив занял бы 25 км полок! Сейчас их архив содержит 138 млн файлов общим весом 4,5 гигабайта.
Интернет растет каждый день. Есть множество компаний и сайтов, которые заботятся о том, чтобы сохранять копии веб-страниц в своих архивах. Но не стоит полагаться только на них. Делайте своевременные бэкапы, и вы не потеряете свой сайт никогда.
Существует настоящая, реальная машина времени, в которой можно ненадолго вернуться в прошлое и увидеть, например, как выглядел тот или иной сайт несколько лет назад. Думаете, никому не нужны копии сайтов многолетней давности? Ошибаетесь! Для очень многих людей сервис по архивированию информации весьма полезен.
Во-первых, это просто интересно! Из чистого любопытства и от избытка свободного времени можно посмотреть, как выглядел любимый, популярный ресурс на заре его рождения.
Во-вторых, далеко не все владельцы сайтов ведут свои архивы. Знать место, где можно найти информацию, которая была на сайте в какой-то момент, а потом пропала, не просто полезно, а очень важно.
В-третьих, само по себе сравнение является важнейшим методом анализа, который позволяет оценить ход и результаты нашей деятельности. Кстати, при проведении анализа веб-ресурса очень эффективно использовать ряд методов сравнения.
Поэтому наличие уникальнейшего архива веб-страниц интернета позволяет нам получить доступ к огромному количеству аудио-, видео- и текстовых материалов. По утверждению разработчиков, «интернет-архив» хранит больше материалов, чем любая библиотека мира. Мы попали в правильное место!
Что нужно, чтобы найти копии сайтов интернета
Для того, чтобы отправиться в прошлое, нужно перейти на сайт archive.org и воспользоваться поисковой строкой.
Простой поиск в архиве сохраненных сайтов выдает нам ссылки на все сохраненные копии запрашиваемой страницы.
Из этого видно, что сайт сайт был создан в 2012 году (Кстати, важно отметить, с помощью практически идеального хостинга Спринтхост — рекомендую!). Переключаясь на нужный нам год, можно увидеть даты, выделенные кружочками, это и есть даты сохранения копии сайта. Например, в 2015 году, пока можно будет увидеть только одну копию от 7 февраля.
Конечно, это потрясающий ресурс! Ведь здесь индексируются и архивируются все сайты интернета! Это не только скриншоты… Имея в руках такой инструмент, можно восстановить массу потерянной со временем информации.
Надо заметить, что, безусловно все восстановить однозначно не получится, так как если на страницах сайта используются элементы Java Script, или скрипты или графика взяты со стороннего сервера, то на восстановление такой информации рассчитывать не придется. Поэтому к сохранению данных своего сайта нужно относиться с особенным вниманием, несмотря ни на что.
Пользуясь случаем, я сделала скриншоты и восстановила в памяти, как выглядел мой сайт, начиная с 2012 года. Любопытно посмотреть))
Сайт буквально недавно «родился»)) Январь 2012.. .
Проходит время, и хочется что-то изменить… Конец 2012-го.
Наверное, пора уже что-то менять. 2013-й. Это тема, которая и сегодня установлена на моем сайте.
К смене темы отношусь с осторожностью, так как помню последний «переезд», после которого несколько месяцев восстанавливала посещаемость сайта. Как-то не очень удачно получилось.
Надеюсь, что и моим читателям эта замечательная интернет-библиотека — «машина времени» сможет помочь перемещаться во времени, когда они этого захотят. Посмотрите, как выглядели раньше некоторые сайты, еще во времена своего зарождения. Какими раньше были google или яндекс, можно увидеть только на archive.org, аналогов у этого ресурса нет. Приятного путешествия, друзья!