Regex og HTML

Der findes en regel inden for regular expressions: Man må ikke bruge regex til at finde data i HTML.

Regular expressions er programmelle udtryk der kan bruges til at søge efter mønstre i data, f.eks. en bestemt sætning i en tekst. Men datastrukturer som HTML er enormt vanskelige at beskrive på en regulær måde og alle forsøg jeg hidtil har set – og selv udført – tager udgangspunkt i nogle forudsætninger vi reelt ikke kan tage.

Og alligevel bliver vi ved med at bruge regex til at finde og erstatte data i HTML. Fordi det er bare så meget nemmere end alternativet. Da jeg i dag sad med sådan en opgave faldt jeg over denne kommentar til os der bliver ved med at gøre det forkerte.

Dette indlæg blev udgivet i Udvikling og tagget , , . Bogmærk permalinket.

Skriv et svar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out / Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out / Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out / Skift )

Google+ photo

Du kommenterer med din Google+ konto. Log Out / Skift )

Connecting to %s