nataraj: (Бритый небритый)
[personal profile] nataraj
В продолжении к
http://aywen.livejournal.com/138452.html?thread=1502420#t1502420

Полез смотреть на флибусте, как добыть количество скачиваний для переводных PublickDomain произведений, и обнаружил, что там оказывается уже лежат переводы XIX века от Шерлока Холмса...

Которые уже тоже PD.

По идее такие вещи не плохо бы экспортировать за пределы флибусты, и сделать полностью легальную библиотеку.

Интересно ли это кому-нибудь кроме меня? Потому как я смогу лишь эпизодически уделять внимание технической части, и договориться о чем-то с Сильвером и компанией...

А работа по вычленению PD таки не маленькая... А по последующей верификации -- вообще адова.

Date: 2013-02-23 07:28 am (UTC)
From: [identity profile] aywen.livejournal.com
Мне интересно, как ты понимаешь. Но вот с возможностью уделять внимание всё очень плохо.
Edited Date: 2013-02-23 08:28 am (UTC)

Date: 2013-02-23 08:20 am (UTC)
From: [identity profile] stiver-rus.livejournal.com
Думали над этим вопросом, давно уже. Отдельная библиотека не обязательна (закачать к Мошкову можно, например, если приспичит), но флажок какой-нибудь проставить было бы разумно. Алгоритм примерно такой:
1) Выдрать списки книг с заведомо public domain ресурсов, типа Гутенберга или СИ. Выдирать придется парсерами страниц скорее всего.
2) Флибуста отдает каталог в csv. Сравнить списки скриптом по каким-то гибким критериям (с учетом автора, различных написаний и т.п. На этом либгеновцы собаку съели)
3) По результату пройтись человеческими глазом (надо, деваться некуда)

>>Интересно ли это кому-нибудь кроме меня? Потому как я смогу лишь эпизодически уделять внимание технической части,

Да, знакомая песня :)) К нам по десятку человек в неделю стучится с разными идеями. И все как один "сам я делать не могу и не буду, но может кто-то заинтересуется и сделает". Не сделает.

Date: 2013-02-23 08:28 am (UTC)
vitus_wagner: My photo 2005 (white)
From: [personal profile] vitus_wagner
У Мошкова, блин, софт тоже скоро копирайтной защиты лишится. Ни форматов нормальных, ни каталогизации. Всё на уровне того "какой был интернет до появления коммерческих ISP".

Date: 2013-02-23 08:56 am (UTC)
ext_613079: Default userpic (Бритый небритый)
From: [identity profile] shaplov.livejournal.com


Да, знакомая песня :)) К нам по десятку человек в неделю стучится с разными идеями. И все как один "сам я делать не могу и не буду, но может кто-то заинтересуется и сделает". Не сделает.

Не, я могу "нанять" знакомого php программиста, чтобы он вкрутил в код флибусты отдельный флаг про лицензию, могу написать робота который бы выбрал книги у которых указан переводчик и год публикации до 19хх,
Пройтись по всему глазами не смогу. Но думаю что тут мне помогут.
Вопрос в том, надо ли это кому-то кроме меня... :-)))

Отдельная библиотека не обязательна

Ну... отдельная библиотека нужна для того чтобы во-первых стояла и не падала. Во-вторых для того чтобы было пространство которое чисто перед законом, что-бы во-первых не говорили, что в вас в интернетах все книжки пирацкие, а во-вторых чтобы у авторов которые желают на правовых основах что-то безвозмездно выложить в интернете, было пространство где это можно было сделать... Чтобы наконец ссылку на эту библиотеку никакой литрес ни из какой читалки вычистить не мог бы.

Date: 2013-02-28 05:25 pm (UTC)
ext_613079: Default userpic (Бритый небритый)
From: [identity profile] shaplov.livejournal.com
Так что, делать, или ну его нафиг?

В том смысле, если будет сделано, в продакшн выкатите?

Date: 2013-02-23 08:27 am (UTC)
vitus_wagner: My photo 2005 (white)
From: [personal profile] vitus_wagner
Мне - надо. Но я ресурсов ещё меньше могу выделить.

Date: 2013-02-23 08:57 am (UTC)
ext_613079: Default userpic (Бритый небритый)
From: [identity profile] shaplov.livejournal.com
Зато твои ресурсы далеко не везде пересекается с моими. :-)

Profile

nataraj: (Default)
Swami Dhyan Nataraj

July 2024

S M T W T F S
 123456
789 10111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 19th, 2026 08:30 pm
Powered by Dreamwidth Studios