nataraj: (Default)
[personal profile] nataraj
Разбирался с XML модулями перла
(XML - язык разметки типа HTML, а модули программульки позв. с ним работать из перла)
Так вот, все эти XML модули необычайно похожи на наших отечественных ментов. Одни умеют читать, другие писать... а вот так чтобы и читать и писать - то это наверное целый полковник.

Полковником к стати оказался XML::Mini - наредкость приятным на вид...

Date: 2004-06-01 08:05 am (UTC)
From: [identity profile] alexkuklin.livejournal.com
А еще товарищ [livejournal.com profile] beldmit в приватной беседе высказал следующее:

[кутхере]
BelDmit:
Кстати, идея DOM-дерева тоже не фонтан.
AlexKuklin:
почему? в случае маленьких и среднего объема xml-документов - вполне
BelDmit:
Вот-вот. Где оценка сверху - первые мегабайты.
AlexKuklin:
Ага, а в этой задаче таких объемов не возникает
BelDmit:
Я, кстати, в какой-то момент написал парсер на регекспах. Закладываясь на формат. Летало. В отличие от что DOM, что SAX.
[/кутхере]

Угу...

Date: 2004-06-01 10:37 am (UTC)
From: [identity profile] beldmit.livejournal.com
Так вот. Так делать можно. Если ты на 200% уверен в том, что эти регекспы будут пригодны всегда. В смысле, во всех случаях.

Кажется, близкий к оптимуму по памяти - это XML::Twig, который, построив минимальное деревце, позволяет выкинуть его нафиг и не жрать тем самым память.

DOM-модель - память жрет как свинья помои. SAX - намного лучше в этом плане. Правда, DOM-парсер пишется проще.

Date: 2004-06-01 11:05 am (UTC)
From: [identity profile] alexkuklin.livejournal.com
SAX хуже обрабатывать

Profile

nataraj: (Default)
Swami Dhyan Nataraj

July 2024

S M T W T F S
 123456
789 10111213
14151617181920
21222324252627
28293031   

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 23rd, 2026 03:40 am
Powered by Dreamwidth Studios