Словарная тема...
Jul. 26th, 2010 04:21 pmПоходу писать парсеры разных сайтов -- мой крест...
В этот раз меня фштырило выгрызти из ru.wiktionary.org французско-русский словарь. Поскольку нормальных опенсорсных нет совсем, а на оном сайте он как минимум не пуст, и главное опенсорсен.
В результате обозрел полную разруху в области опенсорсного словарестроения и получил таки первые результаты: http://lj.shaplov.ru/2010/wiktionary-fr-ru/2010-07-26
Там еще копать и копать, но жить уже можно... Потестирую его на очередной главе гарри поттера.
В этот раз меня фштырило выгрызти из ru.wiktionary.org французско-русский словарь. Поскольку нормальных опенсорсных нет совсем, а на оном сайте он как минимум не пуст, и главное опенсорсен.
В результате обозрел полную разруху в области опенсорсного словарестроения и получил таки первые результаты: http://lj.shaplov.ru/2010/wiktionary-fr-ru/2010-07-26
Там еще копать и копать, но жить уже можно... Потестирую его на очередной главе гарри поттера.
no subject
Date: 2010-07-26 06:44 pm (UTC)http://download.wikimedia.org/ruwiktionary/20100629/
не спасут отца русской демократии?
no subject
Date: 2010-07-26 07:42 pm (UTC)От постоянных запросов к серверу? Так есть MediaWiki::API которая, если осилить прочитать мануал про егойный нюанс работы с юникодом то оно удобнее чем архив, мне ведь далеко не все страницы нужны...
А вот из каждой отдельной страницы нужный контент выгрызать таки придется...
БТВ, а откуда информация? Где эти ссылки честным людям дают?
no subject
Date: 2010-07-26 07:59 pm (UTC)А ссылки , не поверишь - в гугле.