Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
У форматі PDF/A та PDF/UA передбачено декілька вимог, пов’язаних із змістом документа, які не можуть виконуватися під час автоматичного перетворення з документа у форматі Word у PDF. Ці вимоги повинні бути перевірені та виправлені або у документі Word перед перетворенням або у документі PDF після перетворення, щоб зробити повністю PDF/A та PDF/UA сумісний документ.
Основні вимоги до структури або шрифтів документа PDF/A та PDF/UA, які ми розглянемо в наступних розділах.
Поточні вимоги до PDF/A-1a, PDF/A-2a, PDF/A-4 та PDF/UA-1.
Є деякі нюанси того, як Aspose.Words працює при конвертуванні різних стандартів формату PDF. Вони повинні бути враховані, якщо ви хочете отримати очікуваний результат.
Для створення структурної або семантичної інформації з використанням автоматизованих процесів без відповідної перевірки.
ISO 19005-2, 6.7.1
Підрозділи нижче описують нюанси як Aspose.Words працює при перетворенні в різні стандарти формату PDF і варіанти їх вирішення.
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-2а |
|
| PDF/UA-1 |
|
Документ PDF є послідовністю блоків, таких як заголовки, абзаци, таблиці та інші. Ці блоки формують структуру документа – сильно або слабкі.
Обидві сильні та слабкі структури діють для PDF/A. Microsoft Word документи мають слабку структуру за допомогою дизайну і Aspose.Words створює PDF зі слабкою структурою відповідно, а також генерує заголовки відповідно до рівнів абзаців у початковому документі.
Для документу PDF/UA-1 зі слабкою структурою необхідно додатково, щоб заголовки залишалися без проміжків.
Структура блоку може слідувати одному з двох основних парадигм:
ISO-32000-1, 14.8.4.3.5
Якщо документ сеймантика вимагає спадаючої послідовності заголовків, така послідовність продовжиться в строгому чисельному порядку і не пропускає домокання рівня заголовка. H1 H2 H3 допустимо, в той час як H1 H3 не є.
ISO-14289-1, 7.4.2
Щоб забезпечити правильний вихід, користувачі повинні переконатися, що вміст початкового документа належним чином організований і окреслювати рівні правильно вказані для абзаців. В іншому випадку користувач повинен перевірити і виправити структуру вихідного документа PDF.
У Microsoft Word За замовчуванням "Heading X" можна використовувати для встановлення рівня контуру:
Крім того, рівень контуру можна перевірити або змінити у вікні "Параграф":
У випадку, якщо структура документа може бути зареєстрована або змінена в панелі "Таги":
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-2а |
|
| PDF/UA-1 |
|
На даний момент Aspose.Words розмітки сторінок заголовків і нижніх колонок, замітки сепараторів, повторних клітин заголовка столу, декоративних зображень як артефакти. Зверніть увагу, що цей список може бути оновлено в майбутньому.
Графічні об'єкти в документі можна розділити на два класи:
ISO-32000-1, 14.8.2.2.1
Якщо документ містить будь-який інший зміст, який повинен бути позначений як артефакт, або якщо будь-який з записаного контенту є справжнім змістом, клієнти повинні виправити це у вихідному PDF.
Наприклад, форми можуть бути позначені як декоративними Microsoft Word, щоб вони будуть експортовані в PDF як артефакт:
Ви можете відмітити форму як артефакт у виході PDF:
Також ви можете переключати текст у заголовку з артефакту до реального вмісту у вихідному PDF:
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-2а |
|
| PDF/UA-1 |
|
Текстова мова вказана в Microsoft Word документи. Aspose.Words експорт вказаної мови до виходу PDF з Lang атрибут, прикріплений до послідовності позначеного вмісту або тегу Span - він керується export_language_to_span_tag майно. Зазвичай не існує мовних питань, коли текст вводиться користувачем через Microsoft Wordй Якщо текст автоматично генерується.
За замовчуванням природна мова для всіх текстів у файлі повинна бути вказана записом Lang у словнику каталогу документа.
Весь текстовий вміст у файлі, який відрізняється від мови за замовчуванням, необхідно вказати за допомогою використання файлу `Lang` майно, прикріплене до послідовності позначеного вмісту, або шляхом входу Lang в структурний елемент словника ...
ISO-19005-2, 6.7.4
Природна мова повинна бути заявлена... Зміни у природній мові будуть оголошені.
ISO-14289-1, 7.2
Користувачі повинні переконатися, що мова вказана належним чином в або вихідному документі Word:
Або вихід документа PDF:
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-2а |
|
| PDF/UA-1 |
|
Microsoft Word документи дозволяють користувачам додати альтернативний текст на зображення, форми та таблиці. Aspose.Words експортує такий альтернативний текст до виходу PDF.
Всі елементи структури, вміст яких не має природного заданого текстового аналога, наприклад зображення, формула і т.д., повинні поставляти альтернативний текст опису за допомогою Alt запис в структурі елемент словника...
ЗАМОВИТИ Визначені описи дають текстові описи, які допомагають у належному перекладі іншого непрозорого нетекстового вмісту.
ISO-19005-2, 6.7.5
Користувачі повинні переконатися, що всі елементи мають альтернативний текст або джерело документ Word:
Або вихід документа PDF:
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-2а |
|
| PDF/UA-1 |
Специфікація розповідає нам про наступне:
Всі елементи текстури, які представлені в нестандартному порядку, наприклад, користувацьких символів або вбудованої графіки, повинні поставляти заміну тексту за допомогою параметра `ActualText` запис в структурний елемент словника ...
ISO-19005-2, 6.7.7
Microsoft Word документ не дозволяє користувачам встановлювати заміну тексту. Отже, це потрібно перевірити і зафіксувати у вихідному форматі PDF:
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-2а |
|
| PDF/UA-1 |
Всі екземпляри аббревіатури та акронімів у текстовому вмісті повинні бути розміщені в позначеному послідовності вмісту з тегом Span, властивість якого E забезпечує текстове розширення аббревіатури або акроніму ...
ISO-19005-2, 6.7.8
Microsoft Word документ не дозволяє користувачам встановлювати скорочення та розширення акронімів. Отже, це потрібно перевірити і зафіксувати у вихідному форматі PDF:
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-1b |
|
| PDF/A-2а |
|
| PDF/A-2б |
|
| PDF/А-4 |
|
| PDF/UA-1 |
|
Також є ряд нюансів роботи з шрифтами при перетворенні в PDF/A-1, PDF/A-2, PDF/A-4 або PDF/UA-1 з використанням Aspose.Wordsй Вони повинні бути враховані, якщо ви хочете уникнути можливих проблем з вихідним документом.
Зрізи нижче описують такі нюанси і варіанти їх вирішення.
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a |
|
| PDF/A-1b |
|
| PDF/A-2а |
|
| PDF/A-2б |
|
| PDF/А-4 |
|
| PDF/UA-1 |
|
Aspose.Words не перевіряє правові обмеження використовуваних шрифтів – це до користувачів. Іншими словами, користувач не повинен надавати недорогі шрифти для перетворення PDF Aspose.Wordsй
Для необмеженого, універсального рендерингу використовуються тільки програми шрифту, які є юридично зібраними у файлі.
ISO-19005-2, 6.2.11.4.1; ISO-14289-1, 7.21.4.1 (зазвичай однакові лапки в двох специфікаціях)
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a | |
| PDF/A-1b | |
| PDF/A-2а |
|
| PDF/A-2б |
|
| PDF/А-4 |
|
| PDF/UA-1 |
|
Використання .notdef glyph забороняється. Про нас .notdef glyph з’явиться, якщо документ містить символи, які не присутні в вибраному шрифті, і які також не можуть бути вирішені за допомогою механізму “Фонс-Фонс”.
Не містить посилання на .notdef glyph від будь-яких операторів текстового показу, незалежно від способу відображення тексту, в будь-якому потоковому режимі.
ISO-19005-2, 6.2.11.8; ISO-14289-1, 7.21.8 (зазвичай однакові лапки в двох специфікаціях)
Користувачі повинні видалити або замінити ці символи в документі Word:
Або вихід документа PDF за допомогою інструмента "Редагувати PDF":
| Рівень відповідності стандарту PDF в межах Aspose.Words | Наявність вимог |
|---|---|
| PDF/A-1a | |
| PDF/A-1b | |
| PDF/A-2а |
|
| PDF/A-2б |
|
| PDF/А-4 |
|
| PDF/UA-1 |
Приватні символи використання (PUA) з’являються переважно для Windows символічні шрифти, такі як “Symbol”, “Wingdings”, “Webdings”, та інші. Microsoft Word Формати не дають можливості зберігати фактичний текст для символів.
Для рівня Єдиний, для будь-якого персонажа ... який наклеєний кодом або кодами в зоні Private Use (PUA), Актуальний запис тексту ... буде присутній для цього персонажа або послідовності символів, які такий символ є частиною.
ISO-19005-2, 6.2.11.7.3
“Segoe UI Символ” Windows Унікод шрифт, який можна використовувати як альтернативу символічним шрифтам.
Замініть символічний шрифт з унікодом один у початковому документі Word:
Або додайте актуальний запис тексту до проблемних символів у форматі PDF:
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.