nataraj: (Default)
[personal profile] nataraj
У них даже xml внутри книжек не валидный!
Ладно бы схеме не соответсвовал. Это я еще могу понять... Но он просто НЕ ВАЛИДНЫЙ!

Date: 2007-12-18 02:43 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Начал писать индексатор lib.rus.ec'а

Разворачивать mysql -- я счел не правильным решением, и решил что лучше по старинке парсить html'ки.

Видимо парсить сразу буду lib6.rus.ec, чтобы потом не мучатся с переходом... А шестерку из url'ов убрать будет не сложно.

Однако возни ряд вопросов:

> поиск - /booksearch?ask=..., как и был

А как он был? Там можно запросить все книги по заданному жанру и формату?

Я помню, что на текущей версии ты рассказывал про http://lib.rus.ec/download?genre=sf_humor&type=fb2&avtor=all
Но только во-первых его на lib6 просто нету, а во вторых с ним будут небольшие проблемы по нахождению ссылки на страницу автора...

Profile

nataraj: (Default)
Swami Dhyan Nataraj

July 2024

S M T W T F S
 123456
789 10111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 20th, 2026 04:34 pm
Powered by Dreamwidth Studios