XML에서 PDF 생성

XML 문서에서 PDF 문서를 생성하는 것은 간단한 작업이 아닙니다. XML 문서는 다양한 내용을 설명할 수 있습니다. Aspose.PDF for Java는 XML 문서를 기반으로 PDF를 생성하는 여러 가지 방법을 제공합니다:

  • XSLT 변환 사용
  • XSL-FO (XSL Formatting Objects) 마크업 사용
  • 자체 Aspose.PDF XML 스키마 사용

XSLT 변환을 사용하여 PDF 문서 생성

XSL (eXtensible Stylesheet Language)은 XML 문서를 다른 XML 문서나 HTML로 변환하기 위한 스타일링 언어입니다. 우리 경우에는 XML을 HTML로 변환한 후 HTML 데이터를 기반으로 PDF를 생성할 수 있습니다.

다음과 같이 간단한 CD 카탈로그가 있는 XML 파일이 있다고 가정합니다.

<?xml version="1.0" encoding="utf-8" ?>
    <title>Empire Burlesque</title>
    <artist>Bob Dylan</artist>
    <title>Hide your heart</title>
    <artist>Bonnie Tyler</artist>
    <company>CBS Records</company>
    <title>Greatest Hits</title>
    <artist>Dolly Parton</artist>
    <title>Still got the blues</title>
    <artist>Gary Moore</artist>
    <company>Virgin records</company>
    <artist>Eros Ramazzotti</artist>
    <title>One night only</title>
    <artist>Bee Gees</artist>
    <title>Sylvias Mother</title>
    <title>Maggie May</title>
    <artist>Rod Stewart</artist>
    <artist>Andrea Bocelli</artist>
    <title>When a man loves a woman</title>
    <artist>Percy Sledge</artist>
    <title>Black angel</title>
    <artist>Savage Rose</artist>
    <title>1999 Grammy Nominees</title>
    <title>For the good times</title>
    <artist>Kenny Rogers</artist>
    <company>Mucik Master</company>
    <title>Big Willie style</title>
    <artist>Will Smith</artist>
    <title>Tupelo Honey</title>
    <artist>Van Morrison</artist>
    <artist>Jorn Hoel</artist>
    <title>The very best of</title>
    <artist>Cat Stevens</artist>
    <artist>Sam Brown</artist>
    <company>A and M</company>
    <title>Bridge of Spies</title>
    <title>Private Dancer</title>
    <artist>Tina Turner</artist>
    <title>Midt om natten</title>
    <artist>Kim Larsen</artist>
    <title>Pavarotti Gala Concert</title>
    <artist>Luciano Pavarotti</artist>
    <title>The dock of the bay</title>
    <artist>Otis Redding</artist>
    <company>Stax Records</company>
    <title>Picture book</title>
    <artist>Simply Red</artist>
    <artist>The Communards</artist>
    <title>Unchain my heart</title>
    <artist>Joe Cocker</artist>

이 파일을 PDF로 변환하려면 HTML 레이아웃을 가진 XSL을 만들어야 합니다. 데이터를 표로 렌더링해 봅시다. 이를 도와줄 XSL 파일은 다음과 같을 것입니다:

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" 
  <xsl:template match="/">
        <h2>나의 CD 컬렉션</h2>
        <table border="1">
          <tr bgcolor="#9acd32">
            <th style="text-align:left">제목</th>
            <th style="text-align:left">아티스트</th>
          <xsl:for-each select="catalog/cd">
                <xsl:value-of select="title"/>
                <xsl:value-of select="artist"/>

따라서, XML을 변환하여 PDF 문서로 로드해야 합니다. 다음 예제는 이 방법을 보여줍니다:

package com.aspose.pdf.examples;

import javax.xml.transform.*;

import javax.xml.transform.stream.StreamResult;
import javax.xml.transform.stream.StreamSource;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;

public class WorkingWithXML {

  private static String _dataDir = "/home/admin1/pdf-examples/Samples/";
  public static void ExampleXSLTtoPDF() throws TransformerException {
        String xslFile = _dataDir + "XMLFile1.xml", xmlFile = _dataDir +  "XSLTFile1.xslt";  
        TransformerFactory factory = TransformerFactory.newInstance();
        Transformer transformer = 
            factory.newTransformer( new StreamSource( xslFile ) );
        StreamSource xmlsource = new StreamSource( xmlFile );
        ByteArrayOutputStream baos = new ByteArrayOutputStream();
        StreamResult output = new StreamResult( baos );
        transformer.transform( xmlsource, output );
        com.aspose.pdf.HtmlLoadOptions options = new com.aspose.pdf.HtmlLoadOptions();
        ByteArrayInputStream bais = new ByteArrayInputStream(baos.toByteArray());
        com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(bais, options);        
        pdfDocument.save(_dataDir + "data_xml.pdf");

XSL-FO 마크업을 사용하여 PDF 문서 생성

XSL-FO는 화면, 종이 또는 기타 미디어로 출력하기 위해 XML 데이터를 포맷하는 XML 기반 마크업 언어입니다. Aspose.PDF는 XSL-FO 마크업을 적용하고 PDF 문서를 얻을 수 있는 특별한 클래스를 제공합니다.

예제를 살펴보겠습니다. 다음은 직원의 샘플 데이터를 포함한 XML 파일입니다.

<?xml version="1.0" encoding="utf-8" ?>
    <companyname>ABC Inc.</companyname>



직원의 데이터를 테이블로 변환하기 위한 또 다른 파일, XSL-FO 마크업 파일을 만들어 보겠습니다.

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.1" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:fo="http://www.w3.org/1999/XSL/Format" exclude-result-prefixes="fo">
    <xsl:template match="employees">
        <fo:root xmlns:fo="http://www.w3.org/1999/XSL/Format">
                <fo:simple-page-master master-name="simpleA4" page-height="29.7cm" page-width="21cm" margin-top="2cm" margin-bottom="2cm" margin-left="2cm" margin-right="2cm">
            <fo:page-sequence master-reference="simpleA4">
                <fo:flow flow-name="xsl-region-body">
                    <fo:block font-size="16pt" font-weight="bold" space-after="5mm">
                        Company Name: <xsl:value-of select="companyname"/>
                    <fo:block font-size="10pt">
                        <fo:table table-layout="fixed" width="100%" border-collapse="separate">
                            <fo:table-column column-width="4cm"/>
                            <fo:table-column column-width="4cm"/>
                            <fo:table-column column-width="5cm"/>
                                <xsl:apply-templates select="employee"/>
    <xsl:template match="employee">
            <xsl:if test="designation = 'Manager'">
                <xsl:attribute name="font-weight">bold</xsl:attribute>
                    <xsl:value-of select="id"/>

                    <xsl:value-of select="name"/>
                    <xsl:value-of select="designation"/>

Aspose.PDF에는 XSL-FO 변환을 적용할 수 있는 특별한 XslFoLoadOptions 클래스가 있습니다. 아래 코드 조각은 위에서 설명한 샘플 파일과 함께 이 클래스를 사용하는 방법을 보여줍니다.

public static void Example_XSLFO_to_PDF() {
    // XslFoLoadOption 객체를 인스턴스화합니다.
    com.aspose.pdf.XslFoLoadOptions options = new com.aspose.pdf.XslFoLoadOptions(_dataDir+"employees.xslt");
    // Document 객체를 생성합니다.
    com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document(_dataDir+"employees.xml", options);
    pdfDocument.save(_dataDir + "data_xml.pdf");

Aspose.PDF XML 스키마 기반 PDF 문서 생성

XML에서 PDF 문서를 생성하는 또 다른 방법은 Aspose.PDF XML 스키마를 사용하는 것입니다. 이 다이어그램을 사용하면 HTML에서 테이블 레이아웃을 사용하는 것과 동일한 방식으로 페이지 레이아웃을 설명할 수 있습니다. 이 방법의 작동 방식을 좀 더 자세히 살펴보겠습니다.

페이지 정의

기본 매개변수로 페이지를 정의해 봅시다. 우리 페이지는 A4 페이지 크기를 가지며 하나의 텍스트만 포함할 것입니다.

<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
      <TextSegment>로렘 입숨 돌로르 시트 아메트, 콘섹테투어 아디피싱 엘리트. 눌라 오디오 로렘, 룩투스 인 로렘 비타이, 아쿰산 셈페르 렉투스. 크라스 어 아우크토르 레오, 에트 틴시던트 라쿠스.</TextSegment>

PDF 문서를 생성하기 위해 우리는 bindXml 메소드를 사용할 것입니다.

public static void Example_XML_to_PDF() {
    com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document();
    pdfDocument.bindXml(_dataDir + "aspose_pdf_demo.xml");
    pdfDocument.save(_dataDir + "data_xml.pdf");

새로운 페이지 크기를 정의하기 위해 우리는 PageInfo 요소를 추가해야 합니다. 다음 예제에서는 A5 페이지 크기와 25mm, 10mm 여백을 설정했습니다.

<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
    <PageInfo IsLandscape="true" Height="595" Width="420">
      <Margin Top="70.8661" Bottom="70.8661" Left="28.3465" Right="28.3465" />           
      <TextSegment>로렘 입숨 돌로르 시트 아메트, 콘섹테투어 아디피싱 엘리트. 눌라 오디오 로렘, 룩투스 인 로렘 비타이, 아쿰산 셈페르 렉투스. 크라스 어 아우크토르 레오, 에트 틴시던트 라쿠스.</TextSegment>

XML 파일에 HtmlFragment 요소 추가하기

HTML은 XML과 유사한 태그를 포함하고 있기 때문에 XML 태그 내에 HTML을 작성할 때 파서가 이를 XML 마크업으로 처리하여 XML 태그로 인식할 수 없습니다. 이 문제는 XML에서 “CDATA” 섹션을 사용하여 해결할 수 있습니다. CDATA 섹션은 파서에 의해 구문 분석되지 않는 텍스트를 포함하며, 다시 말해 XML 마크업으로 처리되지 않습니다. 다음 XML 템플릿 샘플은 CDATA를 사용하여 XML 마크업 내에 HtmlFragment를 추가하는 방법을 보여줍니다.

<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
  <Page id="mainSection">
        <font style="font-family:Tahoma; font-size:40px;">This is Html String.</font>

XML 파일에 Table 요소 추가하기

요소 Table, Row, Cell은 테이블을 설명하는 데 사용됩니다. 다음 코드 스니펫은 간단한 테이블을 사용하는 방법을 보여줍니다. 이 예제에서는 일부 셀이 Alignment 속성을 가지며 이 속성은 숫자 값을 가집니다:

  1. 왼쪽 정렬
  2. 가운데 정렬
  3. 오른쪽 정렬
  4. 양쪽 정렬. 텍스트는 좌우 여백에 맞춰 정렬됩니다.
  5. 전체 양쪽 정렬. ‘양쪽 정렬’과 유사하지만, ‘전체 양쪽 정렬’ 모드에서는 마지막 줄도 좌우 정렬됩니다.
<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
    <PageInfo IsLandscape="false" Height="595" Width="420">
      <Margin Top="71" Bottom="71" Left="28" Right="28" />
        <h1 style="font-family:Tahoma; font-size:16pt;">그린타운-블루버그 노선 시간표</h1>
      <TextSegment>4.1.-28.3.2021 | 그린타운 → 블루버그</TextSegment>
    <Table ColumnAdjustment="AutoFitToWindow" ColumnWidths ="10 10 10 10">
      <DefaultCellPadding Top="5" Left="0" Right="0" Bottom="5" />
        <Top Color="Black"></Top>
        <Bottom Color="Black"></Bottom>
        <Left Color="Black"></Left>
        <Right Color="Black"></Right>
      <Margin Top="15" />
      <Row BackgroundColor="LightGray" MinRowHeight="20">
          <Bottom Color="Black"></Bottom>
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
            <TextSegment>월-금, 일</TextSegment>

문서는 레이아웃을 위해 표를 사용합니다. 예를 들어, 페이지 헤더를 사용자 지정할 수 있습니다. 이 경우, 표는 헤더를 2개의 열로 나누는 데 사용되었습니다.

<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
    <PageInfo IsLandscape="false" Height="595" Width="420">
      <Margin Top="71" Bottom="71" Left="28" Right="28" />
        <Margin Top="20" />
        <Table ColumnAdjustment="AutoFitToWindow">
                <Cell Alignment="1">
                        <TextSegment>날짜: 01/01/2021</TextSegment>
                <Cell Alignment="3">
                        <TextSegment>페이지 $p / $P</TextSegment>
        <h1 style="font-family:Tahoma; font-size:16pt;">그린타운-블루버그 노선 시간표</h1>
      <TextSegment>4.1.-28.3.2021 | 그린타운 → 블루버그</TextSegment>
    <Table ColumnAdjustment="AutoFitToWindow" ColumnWidths ="10 10 10 10">
      <DefaultCellPadding Top="5" Left="0" Right="0" Bottom="5" />
        <Top Color="Black"></Top>
        <Bottom Color="Black"></Bottom>
        <Left Color="Black"></Left>
        <Right Color="Black"></Right>
      <Margin Top="15" />
      <Row BackgroundColor="LightGray" MinRowHeight="20">
          <Bottom Color="Black"></Bottom>
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
        <Cell Alignment="2">
            <TextSegment>월-금, 일</TextSegment>

콘텐츠 동적 업데이트

BindXML() 메서드는 XML 파일 내용을 로드하는 기능을 제공하며, Document.save() 메서드는 출력을 PDF 형식으로 저장하는 데 사용할 수 있습니다. 그러나 변환 중에 XML 내부의 개별 요소에 접근하고 XML을 템플릿으로 사용할 수도 있습니다. 다음 코드 스니펫은 XML 파일에서 TextSegments에 접근하는 단계를 보여줍니다.

<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
  <Page id="mainSection">
      <TextSegment id="boldHtml">segment1</TextSegment>
      <TextSegment id="strongHtml">segment2</TextSegment>
public static void UpdatingContentDynamically() {
    // Document 객체 인스턴스화
    com.aspose.pdf.Document pdfDocument = new com.aspose.pdf.Document();
    // 소스 XML 파일 바인딩
    pdfDocument.bindXml(_dataDir + "log.xml");
    // ID가 boldHtml인 첫 번째 TextSegment의 참조 가져오기
    TextSegment segment = (TextSegment)pdfDocument.getObjectById("boldHtml");
    segment.setText("Demo 1");
    // ID가 strongHtml인 두 번째 TextSegment의 참조 가져오기
    segment = (TextSegment)pdfDocument.getObjectById("strongHtml");
    segment.setText("Demo 2");
    // 결과 PDF 파일 저장
    pdfDocument.save(_dataDir + "XMLToPDF_out.pdf");

페이지에 그래픽 요소 추가하기

우리는 XML 문서에 추가적인 요소를 추가할 수 있습니다: 이미지 또는 그래프 객체. 다음 코드는 문서에 이러한 요소를 추가하는 방법을 보여줍니다.

<Graph Width="20" Height="20">    
  <Circle PosX="30" PosY="30" Radius="10">
    <GraphInfo Color="Red" FillColor="Blue"></GraphInfo>

<Image File="logo.png" Id = "testImg"></Image>

XML을 PDF로 변환할 때 이미지 경로 설정하기

다음 XML 템플릿에는 “testImg"라는 ID를 가진 <Image> 태그가 포함되어 있습니다. 코드에서 이미지 경로를 설정하려는 경우 변환 과정에서 XML 템플릿의 이미지 요소에 접근하여 원하는 위치로 이미지 경로를 설정할 수 있습니다.

<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
 <Page id="mainSection">
    <PageInfo IsLandscape="true">
        <Margin Left="20" Right="20" Top="10" Bottom="30" />
        <Margin Top="20" />
        <Table ColumnAdjustment="AutoFitToWindow">
                <Cell Alignment="1">
                    <Image File="logo.png" Id = "testImg"></Image>
                <Cell Alignment="3">
                        <TextSegment>Page $p / $P</TextSegment>
    <Table ColumnAdjustment="AutoFitToWindow" ColumnWidths="8 10">
    <DefaultCellPadding Top="0" Left="0" Right="0" Bottom="0" />
    <Margin Top="15" />
        <Cell Alignment="1">
                <TextSegment> Request ID</TextSegment>
                <TextState FontSize="14" ForegroundColor="#0e4f9c" FontStyle="1" /> 
                <TextSegment id="boldtext">Some Bold Text</TextSegment>
                <TextState FontSize="14" FontStyle="1"></TextState>

Code to set image path in XML template is as follows:

public static void Example_XML_to_PDF_01(){
    String inXml = _dataDir + "input.xml";
    String inFile = _dataDir + "aspose-logo.jpg";
    String outFile = _dataDir + "output_out.pdf";
    com.aspose.pdf.Document doc = new com.aspose.pdf.Document();
    com.aspose.pdf.Image image = (com.aspose.pdf.Image)doc.getObjectById("testImg");