Удалить таблицы из существующего PDF
Чтобы удалить таблицы, нам необходимо использовать класс TableAbsorber, чтобы получить доступ к таблицам в существующем PDF, а затем вызвать метод remove().
Удаление таблицы из PDF-документа
Мы добавили новую функцию, т.е. remove() к существующему классу TableAbsorber для удаления таблицы из PDF-документа. Как только абсорбер успешно находит таблицы на странице, он становится способен их удалять. Пожалуйста, ознакомьтесь с следующим фрагментом кода, показывающим, как удалить таблицу из PDF-документа:
import aspose.pdf as ap
# Загрузить существующий PDF документ
pdf_document = ap.Document(input_file)
# Создать объект TableAbsorber для поиска таблиц
absorber = ap.text.TableAbsorber()
# Посетить первую страницу с абсорбером
absorber.visit(pdf_document.pages[1])
# Получить первую таблицу на странице
table = absorber.table_list[0]
# Удалить таблицу
absorber.remove(table)
# Сохранить PDF
pdf_document.save(output_file)
Удаление нескольких таблиц из PDF-документа
Иногда PDF-документ может содержать более одной таблицы, и может возникнуть необходимость удалить из него несколько таблиц. Для удаления нескольких таблиц из PDF-документа, используйте следующий фрагмент кода:
import aspose.pdf as ap
# Загрузить существующий PDF-документ
pdf_document = ap.Document(input_file)
# Создать объект TableAbsorber для поиска таблиц
absorber = ap.text.TableAbsorber()
# Посетить вторую страницу с поглотителем
absorber.visit(pdf_document.pages[1])
# Получить копию коллекции таблиц
tables = absorber.table_list
# Перебирать копию коллекции и удалять таблицы
for table in tables:
absorber.remove(table)
# Сохранить документ
pdf_document.save(output_file)