Benchmark для http://perl.org/ страницы.
Извлекаем текс и ссылки.
где:
Обнако обнаружил, что HTML::Gumbo with tree output format на некоторых HTML страничах течет.
https://rt.cpan.org/Public/Bug/Display.html?id=128667
HTML::Gumbo строит DOM при помощи HTML::Elements со стороны XSUB.
Поэтому решил попробовал строить DOM при помощи HTML::Elements с стороны pure perl, а не XSUB.
Это вариант обозначен как "Gumbo pure" в таблице результата Benchmark.
Извлекаем текс и ссылки.
Rate Tree Gumbo pure Gumbo Gumbo cb SAX Tree 46/s -- -63% -72% -80% -87% Gumbo pure 122/s 167% -- -24% -47% -64% Gumbo 161/s 252% 32% -- -30% -53% Gumbo cb 230/s 403% 89% 43% -- -32% SAX 339/s 642% 178% 111% 47% --
где:
SAX - это HTML::Parser Tree - HTML::TreeBuilder Gumbo - HTML::Gumbo with tree output format Gumbo cb - HTML::Gumbo with callback output format
Обнако обнаружил, что HTML::Gumbo with tree output format на некоторых HTML страничах течет.
https://rt.cpan.org/Public/Bug/Display.html?id=128667
HTML::Gumbo строит DOM при помощи HTML::Elements со стороны XSUB.
Поэтому решил попробовал строить DOM при помощи HTML::Elements с стороны pure perl, а не XSUB.
Это вариант обозначен как "Gumbo pure" в таблице результата Benchmark.