ЖЖ: И старое никто не помянет
Dec. 23rd, 2015 09:53 pmОбнаружил, что гугл не находит моих старых ЖЖшных записей... Обнаружил случайно: пытался найти что-то из старых записей по ключевым словам.
Обрыв поисковой памяти наступает где-то на ~200 записей в прошлое...
Вот прямо сейчас если зайти на страницу http://shaplov.livejournal.com/?skip=215 пост про ИНИОН еще находится (пруф), двустишие про винды уже нет (пруф).
Ну и соответственно все что раньше -- не находится. А все что позже -- находится.
Мне искренне лень копаться с исследованием поисковых настроек на ЖЖ, но есть серьезное подозрение, что виноват в такой амнезии вовсе не гугл. Ему это совершенно не интересно. А вот ЖЖ, точнее его нынешним российским владельцем такое забвение старого может быть очень даже на руку...
Короче други, имейте в виду, все что вы написали год и более назад -- уже вычеркнуто из мировой базы знаний... Так или иначе.
Обрыв поисковой памяти наступает где-то на ~200 записей в прошлое...
Вот прямо сейчас если зайти на страницу http://shaplov.livejournal.com/?skip=215 пост про ИНИОН еще находится (пруф), двустишие про винды уже нет (пруф).
Ну и соответственно все что раньше -- не находится. А все что позже -- находится.
Мне искренне лень копаться с исследованием поисковых настроек на ЖЖ, но есть серьезное подозрение, что виноват в такой амнезии вовсе не гугл. Ему это совершенно не интересно. А вот ЖЖ, точнее его нынешним российским владельцем такое забвение старого может быть очень даже на руку...
Короче други, имейте в виду, все что вы написали год и более назад -- уже вычеркнуто из мировой базы знаний... Так или иначе.
no subject
Date: 2015-12-23 07:11 pm (UTC)no subject
Date: 2015-12-23 07:28 pm (UTC)При том, что владельцы имеют весьма большую власть над тем, что именно будет исследовано поисковым ботом.
Я при поиске указывал весьма жесткий "скоп" и тут вопрос не в том, "выше или ниже", а в том, проиндексировано или нет. Если вдруг паче чаянья гугл не проиндексировал эти записи по своей инициативе, то ему как поисковику крышка в течении ближайших пяти лет. Как только народ прочухает, что гугл не все ищет. Они вряд-ли станут резать курицу несущую золотые яйца...
no subject
Date: 2015-12-23 07:45 pm (UTC)Записи старые ЖЖ отдает только в рамках календаря (архива), а индексация этих страниц запрещена в robots.txt.
В общем, как с ленты уползло, так и пропало.
no subject
Date: 2015-12-23 07:58 pm (UTC)no subject
Date: 2015-12-23 08:07 pm (UTC)no subject
Date: 2015-12-23 08:22 pm (UTC)2) В данном случае нерелевантно, поскольку в качестве примера явно указан пост из примерно середины архива, достижимого по ссылкам «Previous 20».
no subject
Date: 2015-12-24 04:45 am (UTC)2) В данном случае если вы хотите выяснить что там и как, нужно выполнять запросы, указывая тот же User-Agent, что у GoogleBot и с отключенным javascript. Я вот попробовал wget-ом вытянутю указанную в посте страничку, получил кучу каких-то CSS-ов и скриптов, в которых ни слово ИНИОН, ни слово "винды" не встречалось.
Контент ЖЖ ajax-ом подгружает.
no subject
Date: 2015-12-23 07:47 pm (UTC)no subject
Date: 2015-12-23 08:28 pm (UTC)