Про архивы и поиск.

Я не видел ни одного удобного поисковика по собственному жж. Новомодные www.ljseek.com и blogs.yandex.ru ищут среди новых записей, в старых путаются и выдают всякую чушь. По крайней мере мне не удалось заставить ни один из них найти, к примеру, вот этот пост.

Чтобы искать и не теряться, я не удаляю комментарии на почте. Их набралось уже больше 30000 и поиск Thunderbird’а не справляется, умирает и много думает.

Найденное решение проблемы называется ljArchive. Небольшой клиент скачивает весь ваш жж (без картинок, только html) с комментариями, загоняет всё в свою внутреннюю базу, зажимает в zip и хранит, где скажете. При запуске база автоматически обновляется.

Выходит, что за 4 года жизни этого журнала было написано около 15Мб текста. Пусть треть этого html, выходит, что мы с вами, ребята, напечатали около 51200 страниц текста, это объём второго издания БСЭ.

Комментарии

 

26 комментариев

  1. у меня тоже все комменты, но когда озаботился всё оказалось плохо — комменты в виде хтмл и Бат по ним не ищет :(

  2. у меня тоже все комменты, но когда озаботился всё оказалось плохо — комменты в виде хтмл и Бат по ним не ищет :(

Добавить комментарий прямо сейчас