DOC Converter

Эта статья руководит вас через использование Aspose.Pdf DOC Converter для .NET для конвертации PDF документа в формат Microsoft Word (.doc / .docx).

Предварительные требования

Вам потребуется следующее:

  • Visual Studio 2019 или новее
  • Aspose.PDF для .NET 24.1 или новее
  • Образец PDF файла, содержащий некоторые поля форм

Вы можете скачать библиотеку Aspose.PDF для .NET с официального сайта или установить её с помощью менеджера пакетов NuGet в Visual Studio.

Шаги

1. Настройка вашего преобразования (скриншот класса FileDataSource)

Процесс конвертации включает в себя три основных этапа: определение входных и выходных файлов, создание объекта PdfDoc, и указание опций конвертации.

1.1. Определение источников данных

  • Входной файл: Мы будем использовать класс FileDataSource для указания местоположения PDF файла, который вы хотите конвертировать.
  • Входной файл: Мы будем использовать класс FileDataSource, чтобы указать расположение PDF-файла, который вы хотите конвертировать.
  FileDataSource inputDataSource = new(Path.Combine(@"C:\Samples\", "sample.pdf"));
  • Замените "C:\Samples\sample.pdf" на фактический путь к вашему PDF-файлу.

  • Выходной файл: Аналогично, используйте другой объект FileDataSource, чтобы определить расположение и имя файла для результирующего документа Word.

  FileDataSource outputDataSource = new(Path.Combine(@"C:\Samples\", "sample.docx"));
  • Замените "C:\Samples\sample.docx" на желаемый выходной путь и имя файла.

2. Создание объекта плагина PdfDoc (скриншот класса PdfDoc)

Затем мы создаем экземпляр класса PdfDoc для выполнения конвертации.

  var plugin = new PdfDoc();

Этот объект служит двигателем для процесса конвертации.

3. Настройка параметров конвертации

Класс PdfToDocOptions позволяет вам тонко настраивать процесс конвертации. Класс PdfToDocOptions позволяет точно настроить процесс конвертации.

  • Формат сохранения: Укажите желаемый выходной формат для документа Word. В этом случае мы используем SaveFormat.DocX для создания документа, совместимого с Microsoft Word 2007 или более поздней версии (.docx).

  • Режим конвертации: Определите, как плагин интерпретирует структуру PDF при конвертации. Мы будем использовать ConversionMode.EnhancedFlow для оптимизации результирующего документа Word с точки зрения макета и форматирования.

Вот фрагмент кода для настройки опций:

  PdfToDocOptions options = new()
  {
      SaveFormat = SaveFormat.DocX,
      ConversionMode = ConversionMode.EnhancedFlow
  };

Добавление входных и выходных данных:

Наконец, мы связываем ранее определенные источники данных с опциями конвертации с помощью методов AddInput и AddOutput:

  options.AddInput(inputDataSource);
  options.AddOutput(outputDataSource);

Это соединяет входной PDF и желаемый выходной документ Word с процессом конвертации.

4.

4.

Теперь, когда все настроено, давайте начнем конвертацию, вызвав метод Process плагина PdfDoc и передав сконфигурированные опции:

  var resultContainer = plugin.Process(options);

Этот метод выполняет конвертацию и возвращает объект ResultContainer, содержащий детали процесса.

Получение результатов:

Хотя это и не обязательно для базовой конвертации, вы можете получить доступ к результатам через свойство ResultCollection объекта ResultContainer. Это может быть полезно для отладки или отслеживания конкретных деталей конвертации.

  var result = resultContainer.ResultCollection[0];

  // Вывод результата (необязательно для демонстрационных целей)
  Console.WriteLine(result);

С этим последним шагом ваш PDF-документ будет конвертирован в указанный формат Word и сохранен в заданное место вывода.