ItextSharp ошибка при попытке проанализировать html для преобразования pdf

Я использовал модуль ItextSharp для преобразования нижеприведенного html в страницу pdf.

        <div style="font-size: 18pt; font-weight: bold;">
    mma<br>mmar</div><br> <br>
    <div style="font-size: 14pt;">Click to View Pricing
    <tr><td> <a href="" style="color: Blue; font-size: 10pt; text-decoration: underline;"> FCI</a>:</td> 
<td><a href="" style="color: Blue; font-size: 10pt; text-decoration: underline;"> 78211-014</a></td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-009</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-006</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-007</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-003</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-005</td></tr><tr><td></td> <td>
<a href=""
 style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-008</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-004</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-012</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-007LF</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-015LF</td></tr><tr><td></td> <td>
<a href=""
 style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-003LF</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration:
underline;">78211-009LF</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-005LF</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-010LF</td></tr><tr><td></td> <td>
<a href=""
 style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-006LF</td></tr><tr><td></td> <td>
<a href=""
 style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-014LF</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-004LF</td></tr><tr><td></td> <td>
<a href=""
 style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-012LF</td></tr><tr><td></td> <td>
<a href=""
 style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-008LF</td></tr><tr><td></td> <td>
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-011LF</td></tr><tr><td></td> <td><a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-013LF</td></tr><tr><td></td> <td><a href="" style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-010</td></tr><tr><td></td>
<td><a href=""
 style="color: Blue; font-size: 10pt; text-decoration: underline;">78211-015</td></tr><tr><td> 
<a href="" 
style="color: Blue; font-size: 10pt; text-decoration: underline;"> Souriau</a>:</td>
 <td><a href="" style="color: Blue; font-size: 10pt; text-decoration: underline;"> 24JR124-3</a></td></tr></table></div>

C# код для генерации html выше :

 var html = new StringBuilder(@"<div style=""font-size: 18pt; font-weight: bold;"">Authorized Distributor</div><br> <br><div style=""font-size: 14pt;"">Click to View Pricing, Inventory, Delivery & Lifecycle Information:</div><br>");
            List<MfrBrandView> mfrBrands = MfrBrandView.Load(fileId);
            var uniquesuppliers = mfrBrands.GroupBy(t => new {t.Manufacturer,t.SupplierVirtualDirectory}).Select(g => g.First());
            foreach (var uniquesupplier in uniquesuppliers)
                var mfrPartNums =
                    mfrBrands.Where(t => t.ManufacturerId == uniquesupplier.ManufacturerId).Select(
                        t => t.ManufacturerPartNumber).ToList();
                html.AppendFormat(@"<tr><td> <a href=""{0}"" style=""color: Blue; font-size: 10pt; text-decoration: underline;""> {1}</a>:</td> <td><a href=""{2}"" style=""color: Blue; font-size: 10pt; text-decoration: underline;""> {2}</a></td></tr>", uniquesupplier.SupplierVirtualDirectory, uniquesupplier.MouserizationLabel, mfrPartNums[0]);

                for (int i = 1; i < mfrPartNums.Count(); i++)
                        @"<tr><td></td> <td><a href=""{0}"" style=""color: Blue; font-size: 10pt; text-decoration: underline;"">{0}</td></tr>",
            return html.ToString();

Код для генерации страницы после формирования html:

PdfWriter writer = null;
            PdfDocument doc = null;
            //PdfReader reader = new PdfReader(content);
           // reader.Info["Title"]

                doc = new PdfDocument();
                writer = PdfWriter.GetInstance(doc, content);
                writer.CloseStream = false;

                foreach (IElement element in iTextSharp.text.html.simpleparser.HTMLWorker.ParseToList(new StringReader(html), null))

Ниже я получаю исключение, говорящее:" невозможно привести объект типа 'итекстшарп.текст.формат html.simpleparser.CellWrapper в iTextSharp тип '.текст.Абзац'." iTextSharp.text.html.simpleparser.HTMLWorker.ParseToList(new StringReader(html), null)

С тобой что-то не так? html, который я пытаюсь разобрать? Есть ли лучший способ сделать это? Заранее большое спасибо за вашу помощь. Это очень ценится.

3 12

3 ответа:

`HTMLWorker' был отвергнут в пользу XMLWorker. Вот рабочий пример, проверенный с помощью фрагмента HTML, как вы использовали выше:

StringReader html = new StringReader(@"
<div style='font-size: 18pt; font-weight: bold;'>
Mouser Electronics <br />Authorized Distributor</div><br /> <br />
<div style='font-size: 14pt;'>Click to View Pricing, Inventory, Delivery & Lifecycle Information:
<br />
<a href='' 
style='color: Blue; font-size: 10pt; text-decoration: underline;'>78211-009</a></td></tr>
using (Document document = new Document()) {
  PdfWriter writer = PdfWriter.GetInstance(document, STREAM);
    writer, document, html

При использовании XMLWorker вам нужно использовать хорошо сформированный HTML-это синтаксический анализатор XML, в конце концов. Пример HTML из вашего вопроса выше не имеет закрывающих тегов <a> или <br>. Синтаксический анализатор HTML, подобный HtmlAgilityPack , исправит эти проблемы и превратит это:

<div><img src='a.gif'><br><hr></div>

В это:

<div><img src='a.gif' /><br /><hr /></div>

С всего несколько строк кода:

var hDocument = new HtmlDocument()
    OptionWriteEmptyNodes = true,
    OptionAutoCloseOnEnd = true
hDocument.LoadHtml("<div><img src='a.gif'><br><hr></div>");
var closedTags  = hDocument.DocumentNode.WriteTo();

XMLWorker доступен ли в виде пакета nuget , или в виде отдельной загрузки на sourceforge.

Смотрите здесь для более продвинутого использования XMLWorker.

Попробуйте выполнить следующий код

    &lt;a href=""&gt;&lt;/a&gt;

Здесь мы заменяем &lt; и > на &gt; таким образом, мое становится &lt;a&gt; и становится &lt;/a&gt;.

Вот шаг, который вам нужно сделать

1-Установите itext sharp и XMLWorker из Itextsharp из nuget

2-затем поместите ur design в html (здесь счет-фактура.html) с встроенным CSS

3-убедитесь, что все теги завершены правильно, как точка останова или td(здесь я получил ошибку ранее)

4-здесь изображение не будет отображаться локально, поэтому, не теряя времени, я загрузил изображение на сервер и дал путь к серверу для доступа к изображению.Вы можете исследовать больше, чтобы запустить его локально.

Document doc = new Document();

PdfPTable tableLayout = new PdfPTable(4);

PdfWriter writer= PdfWriter.GetInstance(doc, new FileStream(Server.MapPath("~/Admin/T13.pdf"), FileMode.Create));                 


string contents = File.ReadAllText(Server.MapPath("~/Admin/invoice.html"));

StringReader sr = new StringReader(contents);

XMLWorkerHelper.GetInstance().ParseXHtml(writer, doc, sr);  
