Поддерживаемые функции – Aspose.HTML for Java
В следующей таблице приведены функции, доступные в Aspose.HTML for Java API.
Функции Aspose.HTML for Java
Aspose.HTML – это программный API, который позволяет разработчикам создавать HTML-документы, открывать существующие, манипулировать ими, перемещаться по ним и преобразовывать документы HTML, XHTML, SVG, EPUB, MHTML и MD в различные поддерживаемые выходные форматы. Aspose.HTML реализует спецификацию W3C HTML, поэтому его классы и свойства имеют похожие имена, взятые из спецификаций.
Этот API имитирует поведение headless browser и предлагает следующие функции:
- Создание или открытие существующего HTML-документа из разных источников.
- Управление HTML: создание, редактирование, удаление и замена узлов HTML через API.
- Сохранение HTML-документа.
- Извлечение стилей CSS для определенного узла HTML.
- Настройка изолированной программной среды для документов, которая влияет на обработку HTML-документов, т. е. стили CSS в некоторых случаях зависят от размера экрана, и мы разрешаем настраивать среду независимо от исполняющей машины.
- Навигация по HTML-документу различными способами:
- с помощью обхода элементов (Element Traversal)
- с помощью обхода документа (Document Traversal)
- с помощью запросов XPath (XPath queries)
- с помощью CSS селекторов (CSS Selector queries)
- Скрипты, позволяющие управлять HTML DOM через JavaScript.
- Конвертация документа HTML в различные поддерживаемые форматы: PDF, XPS, DOCX, JPG, PNG, BMP, TIFF, GIF, MD и MHTML.
- Конвертация XHTML и подобных форматов, таких как EPUB и MHTML, в форматы PDF, XPS, DOCX, JPG, PNG, BMP, TIFF и GIF.
Примечание
- Строковое представление
Значение цвета CSS зависит от контекста, который может находиться либо в
Specified
, либо вComputed
состоянии.- В
Computed
состоянии CSS Color представлен как функция rgb/rgba. - В состоянии
Specified
цвет CSS представлен как исходная строка, указанная автором.
- В
Объект URL основан на реализации Java Framework в соответствии со спецификацией URL w3c. Разница между Framework и w3c в порядке constructor parameters
Общие характеристики
- Полностью написан на Java и работает с JRE.
- Требуется среда JDK.
- Справочник по API в формате справки HTML.
- Поддерживается JDK 1.6 или выше.
Поддерживаемые версии HTML
Aspose.HTML for Java поддерживает HTML и XHTML.
Структура пространств имен в API
Функции обработки текста
Aspose.HTML for Java предоставляет надежные возможности обработки текста для HTML-документов:
- Вы можете легко извлекать текст из определенных страниц HTML-документа, обеспечивая бесперебойное извлечение контента.
- API поддерживает поиск определенного текста в документе, что делает его мощным инструментом для поиска и анализа данных.
- Для изменения контента вы можете программно добавлять текст непосредственно в HTML-файл, обеспечивая гибкость в настройке документа.
Функции обработки документа
Aspose.HTML for Java предлагает обширные инструменты для обработки и преобразования HTML-документов. Вы можете создавать, редактировать, удалять и заменять узлы HTML, что дает вам полный контроль над структурой документа. API также позволяет извлекать стили CSS, связанные с определенными узлами HTML, что позволяет проводить подробный анализ стиля.
Библиотека поддерживает преобразование HTML в широкий спектр форматов, включая:
- Форматы изображений: JPEG, PNG, BMP, TIFF и GIF.
- Форматы фиксированной разметки: PDF и XPS.
- Microsoft Word формат: DOCX.
- Веб-форматы: Markdown (MD) и MHTML.