nataraj: (Default)
[personal profile] nataraj
Походу писать парсеры разных сайтов -- мой крест...

В этот раз меня фштырило выгрызти из ru.wiktionary.org французско-русский словарь. Поскольку нормальных опенсорсных нет совсем, а на оном сайте он как минимум не пуст, и главное опенсорсен.

В результате обозрел полную разруху в области опенсорсного словарестроения и получил таки первые результаты: http://lj.shaplov.ru/2010/wiktionary-fr-ru/2010-07-26

Там еще копать и копать, но жить уже можно... Потестирую его на очередной главе гарри поттера.

Date: 2010-07-26 06:44 pm (UTC)
From: [identity profile] maravan.livejournal.com
http://download.wikimedia.org/frwiktionary/20100623/
http://download.wikimedia.org/ruwiktionary/20100629/
не спасут отца русской демократии?

Date: 2010-07-26 07:42 pm (UTC)
ext_613079: Default userpic (Default)
From: [identity profile] shaplov.livejournal.com
Не спасут от чего?
От постоянных запросов к серверу? Так есть MediaWiki::API которая, если осилить прочитать мануал про егойный нюанс работы с юникодом то оно удобнее чем архив, мне ведь далеко не все страницы нужны...

А вот из каждой отдельной страницы нужный контент выгрызать таки придется...

БТВ, а откуда информация? Где эти ссылки честным людям дают?

Date: 2010-07-26 07:59 pm (UTC)
From: [identity profile] maravan.livejournal.com
Ну так по моему проще один раз взять XML-ник и преобразовывать его куда хошь и как хошь.

А ссылки , не поверишь - в гугле.

Profile

nataraj: (Default)
Swami Dhyan Nataraj

July 2024

S M T W T F S
 123456
789 10111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 20th, 2026 05:49 am
Powered by Dreamwidth Studios