Revision f85be296
Von Moritz Bunkus vor etwa 3 Jahren hinzugefügt
SL/HTML/Util.pm | ||
---|---|---|
27 | 27 |
if (!%stripper) { |
28 | 28 |
%stripper = ( parser => HTML::Parser->new ); |
29 | 29 |
|
30 |
$stripper{parser}->handler(text => sub { $stripper{text} .= $_[1]; }); |
|
30 |
$stripper{parser}->handler(text => sub { $stripper{text} .= ' ' . $_[1]; });
|
|
31 | 31 |
} |
32 | 32 |
|
33 | 33 |
$stripper{text} = ''; |
... | ... | |
35 | 35 |
$stripper{parser}->eof; |
36 | 36 |
|
37 | 37 |
$stripper{text} =~ s{\&([^;]+);}{ $entities{$1} || "\&$1;" }eg; |
38 |
$stripper{text} =~ s{^ +| +$}{}g; |
|
39 |
$stripper{text} =~ s{ {2,}}{ }g; |
|
38 | 40 |
|
39 | 41 |
return delete $stripper{text}; |
40 | 42 |
} |
Auch abrufbar als: Unified diff
SL::HTML::Strip: immer Leerzeichen zwischen Textenteilen lassen