Вопос про XML и джабберы...
Nov. 5th, 2007 02:00 pmИ в Симе и в Пси, запросы, посылаемые серверу, конструируются спецуевым XML-конструктором (типа XML-парсер, только наоборот, не знаю какое правильное слово для него есть). Последовательно вызываются функции, вида "начался элемент", "в начавшийся элемент добавили атрибут", "внутрь элемента добавить текст или другой элемент", закрыть открытый элемент...
При этом не знаю как в Пси, я глубоко не смотрел, но в Симе эти функции в процессе конструирования запихивают полученную конструкцию в сокет.
В результате сам метод send() фактически ничего не посылает, а просто дозакрывает незакрытые теги...
Внимание вопрос: А зачем городить такой огород? Что мешает при отправке запроса руками вставить нужные заискейпленные и заамперсаженные значения в собранную руками XML'ку?
И потом просто запихнуть ее в сокет...
Оно возможно не столь эстетично... Но во-первых мозг съедает меньше... А во-вторых позволяет отделить код конструирования запроса от кода посылки, чего тоже очень хочется...
И в каком-то смысле более удовлетворяет принципу KISS(Keep It Simple Stupid)
Очень хочется понять какие бонусы дает тот вариант, который применен сейчас в симе и пси... Ведь зачем-то это делалось!
ЗЫ. Я просто сейчас подошел к переписыванию этого куска, и хочу понять, следовать ли традиции, или же выпендрится...
При этом не знаю как в Пси, я глубоко не смотрел, но в Симе эти функции в процессе конструирования запихивают полученную конструкцию в сокет.
В результате сам метод send() фактически ничего не посылает, а просто дозакрывает незакрытые теги...
Внимание вопрос: А зачем городить такой огород? Что мешает при отправке запроса руками вставить нужные заискейпленные и заамперсаженные значения в собранную руками XML'ку?
s="<iq"+
"type='result'"+
"to='"+to_address+"''+
"from='"+from_address+"'"+
"id='"+id+"'>"+
"<query xmlns='jabber:iq:version'>"+
" <name>"+client_name+"</name>"+
" <version>"+client_version+"</version>"+
" <os>"+os+"</os>"+
"</query>"
"</iq>"И потом просто запихнуть ее в сокет...
Оно возможно не столь эстетично... Но во-первых мозг съедает меньше... А во-вторых позволяет отделить код конструирования запроса от кода посылки, чего тоже очень хочется...
И в каком-то смысле более удовлетворяет принципу KISS(Keep It Simple Stupid)
Очень хочется понять какие бонусы дает тот вариант, который применен сейчас в симе и пси... Ведь зачем-то это делалось!
ЗЫ. Я просто сейчас подошел к переписыванию этого куска, и хочу понять, следовать ли традиции, или же выпендрится...
no subject
Date: 2007-11-05 01:52 pm (UTC)То что ты написал выше - код, подходящий для Perl (c точностью до замены + на .). python, ruby и т.д. Но не для плюсового stdstring.
В общем, если данный код переписывать нахрен, то рекомендую взять libxml с какой-нибудь плюсовой оберткой, конструировать её средствами нужное DOM-дерево, а потом сериализовывать его в буфер и буфер кидать в сокет. Буфер тебе еще пригодится, если ты его захочешь, скажем, подписать.
no subject
Date: 2007-11-05 02:05 pm (UTC)... Это неправильные молнии - они делают неправильный гром ...
no subject
Date: 2007-11-05 02:59 pm (UTC)Ну еще бы... последние пять лет дают о себе знать...
то рекомендую взять libxml с какой-нибудь плюсовой оберткой,
Вот чего я боюсь, так это сколько оно будет жрать памяти и процессора... У некоторых пользователей, судя по слухам, в контак листе записи меряются тысячами... И мы при выходе в онлайн каждому из них шлем jabber:iq:version запрос... Структура от которого весит в памяти до тех пор пока не придет ответ...
Но вот чего точно хочется, так это абстрагировать процесс генерения xml'ки, от процесса ее отправки... А там сейчас оно объединено в одно большое [censured]...
Видимо разнесу процесс генерации и отправки, и пусть пока генерация будет в perl-way... Ее отдельно будет проще переписать, чем распутывать этот комок змей монолитный...
no subject
Date: 2007-11-05 03:11 pm (UTC)Зачем? Если одно никогда не встречается без другого, то вполне естественно объединить эти две процесса и рассматривать как одну операцию.
no subject
Date: 2007-11-05 03:20 pm (UTC)Видишь ли, код -- живой организм, который изменяется и трансформируется в процессе жизни...
И такую трансвормацию удобно проводить, когда точно знаешь, что getXML выдает текст XML'ки, и к черту подробности, каким именно способом... Тогда можно спокойно рефакторить ту часть, которая отправляет это все в сокет...
А если оно содержит кучу завязок друг на друга, то это надо еще хитро изворачиваться, чтобы изменить ту часть которую надо, так, чтобы не порушить остальное... Если это вообще возможно...
no subject
Date: 2007-11-05 03:08 pm (UTC)Если имеется в виду инкрементальная сборка строки, то для этого есть std::ostringstream. Или какая-то специально написанная обёртка, учитывающая специфику задачи, как в данном случае и есть похоже.
На самом деле причина, почему этот подход применяется в C++ и не применяется (или редко применяется) в Perl, Python, Ruby проста — в C++ это возможно сделать, а в Perl, Python, Ruby — или невозможно или не так удобно. Ну и выигрыш байтов/тактов съестся языком.
no subject
Date: 2007-11-05 09:22 pm (UTC)"Потому что оно на С++ написано." Всё языки делятся на две большие группы -- лисп и все остальные. Вряд ли моя реплика поможет хозяину журнала, но удержаться не смог -- the LISP way:
(load "sxml2xml.lsp") (setq to_address "a&b" from_address {"cd"} id 456 client_name "<clmn>" client_version "per'ver" os "os/2") (setq pattern '(iq (@ (type "result") (to to_address) (from from_address) (id id)) (query (@ (xmlns "jabber:iq:version")) (name client_name) (version client_version) (os os)))) (sxml2xml print pattern 2)Результат:
<iq type="result" to="a&b" from=""cd"" id="456"> <query xmlns="jabber:iq:version"> <name> <clmn> </name> <version> per'ver </version> <os> os/2 </os> </query> </iq>Правда, в этой реализации лиспа есть из коробки XML-парсер, но почему-то нет XML-эмиттера. Ну то есть я знаю, почему: потому что при его написании я уложился в 999 символов. ;-) Спасибо хозяину журнала и автору предыдущей реплики за задачку на потренироваться. (Примечание: предыдущую версию этого комментария я удалил -- там была небольшая ошибка (я невнимательно прочитал исходный сишный текст и запутался в кавычках и апострофах)).
... Удивительное - рядом, но оно запрещено ...
no subject
Date: 2007-11-06 06:33 am (UTC)<iq type="result" to="a&b" from=""cd"" id="31415"> <query xmlns="jabber:iq:version"> <name><clmn></name> <version>per'ver</version> <os>os/2</os> </query> </iq>Интеллект обошёлся ещё в 118 символов. ;-)... Знаменитая писательница на заборе ...
no subject
Date: 2007-11-05 02:00 pm (UTC)no subject
Date: 2007-11-05 02:56 pm (UTC)no subject
Date: 2007-11-05 03:12 pm (UTC)no subject
Date: 2007-11-05 03:01 pm (UTC)Это — главная и единственно важная причина. Можно конечно и все параметры отдельно эскейпить и перекодировать, и за балансировкой тегов следить (особенно когда структура XML статическая). Но... неэстетично.
no subject
Date: 2007-11-06 10:50 am (UTC)Но проблему не понял.
no subject
Date: 2007-11-06 11:03 am (UTC)Из исходного текста не вполне очевидно, почему был сделан выбор в пользу эмиттера. Посему опрашиваю старших товарищей... Может я каких-то граблей не вижу...