DOC Converter
Эта статья руководит вас через использование Aspose.Pdf DOC Converter для .NET для конвертации PDF документа в формат Microsoft Word (.doc / .docx).
Предварительные требования
Вам потребуется следующее:
- Visual Studio 2019 или новее
- Aspose.PDF для .NET 24.1 или новее
- Образец PDF файла, содержащий некоторые поля форм
Вы можете скачать библиотеку Aspose.PDF для .NET с официального сайта или установить её с помощью менеджера пакетов NuGet в Visual Studio.
Шаги
1. Настройка вашего преобразования (скриншот класса FileDataSource)
Процесс конвертации включает в себя три основных этапа: определение входных и выходных файлов, создание объекта PdfDoc
, и указание опций конвертации.
1.1. Определение источников данных
- Входной файл: Мы будем использовать класс
FileDataSource
для указания местоположения PDF файла, который вы хотите конвертировать. - Входной файл: Мы будем использовать класс
FileDataSource
, чтобы указать расположение PDF-файла, который вы хотите конвертировать.
FileDataSource inputDataSource = new(Path.Combine(@"C:\Samples\", "sample.pdf"));
-
Замените
"C:\Samples\sample.pdf"
на фактический путь к вашему PDF-файлу. -
Выходной файл: Аналогично, используйте другой объект
FileDataSource
, чтобы определить расположение и имя файла для результирующего документа Word.
FileDataSource outputDataSource = new(Path.Combine(@"C:\Samples\", "sample.docx"));
- Замените
"C:\Samples\sample.docx"
на желаемый выходной путь и имя файла.
2. Создание объекта плагина PdfDoc (скриншот класса PdfDoc)
Затем мы создаем экземпляр класса PdfDoc
для выполнения конвертации.
var plugin = new PdfDoc();
Этот объект служит двигателем для процесса конвертации.
3. Настройка параметров конвертации
Класс PdfToDocOptions
позволяет вам тонко настраивать процесс конвертации.
Класс PdfToDocOptions
позволяет точно настроить процесс конвертации.
-
Формат сохранения: Укажите желаемый выходной формат для документа Word. В этом случае мы используем
SaveFormat.DocX
для создания документа, совместимого с Microsoft Word 2007 или более поздней версии (.docx). -
Режим конвертации: Определите, как плагин интерпретирует структуру PDF при конвертации. Мы будем использовать
ConversionMode.EnhancedFlow
для оптимизации результирующего документа Word с точки зрения макета и форматирования.
Вот фрагмент кода для настройки опций:
PdfToDocOptions options = new()
{
SaveFormat = SaveFormat.DocX,
ConversionMode = ConversionMode.EnhancedFlow
};
Добавление входных и выходных данных:
Наконец, мы связываем ранее определенные источники данных с опциями конвертации с помощью методов AddInput
и AddOutput
:
options.AddInput(inputDataSource);
options.AddOutput(outputDataSource);
Это соединяет входной PDF и желаемый выходной документ Word с процессом конвертации.
4.
4.
Теперь, когда все настроено, давайте начнем конвертацию, вызвав метод Process
плагина PdfDoc
и передав сконфигурированные опции:
var resultContainer = plugin.Process(options);
Этот метод выполняет конвертацию и возвращает объект ResultContainer
, содержащий детали процесса.
Получение результатов:
Хотя это и не обязательно для базовой конвертации, вы можете получить доступ к результатам через свойство ResultCollection
объекта ResultContainer
. Это может быть полезно для отладки или отслеживания конкретных деталей конвертации.
var result = resultContainer.ResultCollection[0];
// Вывод результата (необязательно для демонстрационных целей)
Console.WriteLine(result);
С этим последним шагом ваш PDF-документ будет конвертирован в указанный формат Word и сохранен в заданное место вывода.