Синтаксический анализ определенных HTML-тегов в Javascript

Question

Синтаксический анализ определенных HTML-тегов в Javascript

Я ищу Javascript для разбора следующего HTML:

<p>random text random text random text random text</p>
<kbd><h2>Heading One</h2>Body text Body text Body text Body text</kbd>
<p>random text random text random text random text</p>

... и возвращаемся просто:

Heading One

Другими словами, Я хотел бы удалить все теги и основной текст из тегов <kbd>.

Любые идеи будут высоко оценены!

3 2

javascript parsing tags html-parsing

3 ответа:

Регулярное выражение?
var s = "<p>random text</p>\n" +
  "<kbd><h2>Heading One</h2>Body text</kbd>\n" +
  "<p>random text</p>";

s.match(/<h2>(.*?)<\/h2>/)[1] // == "Heading One"
Это соответствует первой группе как самой короткой возможной (.*?) строке между <h2>...</h2>.

Вы можете найти все совпадения, используя опцию g.
s.match(/<h2>(.*?)<\/h2>/g) // == ["<h2>Heading One</h2>"]
Обратите внимание, что группы недоступны.
Для многострочного содержимого между тегами используйте
s.match(/<tag>[\s\S]*?<\/tag>/ig)

2

Если включить jQuery (jquery.com) можно сделать так:
var heading=$("h2").html();

0

Matt Ball · Accepted Answer · 2011-10-24 00:45:30

var input = /* that HTML string here */;
var div = document.createElement('div');

div.innerHTML = input;

var h2 = div.getElementsByTagName('h2')[0];
var text = h2.innerText || h2.textContent;

alert(text); // alerts "Heading One"
Ссылка:

document.createElement

innerHTML

element.getElementsByTagName

Node.textContent (Таблица совместимости Quirksmode )

Демо:

http://jsfiddle.net/mattball/vaVPF/