Yapay Zeka Eklenti Entegrasyonu
Yapay Zeka Eklenti Entegrasyonu
Bu belge, üç Yapay Zeka destekli belge işleme aracını—MarkItDown, Marker, ve Docling—özetler ve bunların ortak Yapay Zeka özelliklerini ve Aspose.Cells for Python via .NET ile eklentiler aracılığıyla entegrasyonunu vurgular.
1. Common AI Features
1.1 Multi-format Document Parsing and Structured Representation
All three projects support parsing multiple document formats, including PDF, DOCX, PPTX, XLSX, HTML, etc., and converting them into structured formats (Markdown, JSON, or HTML) suitable for AI processing.
- MarkItDown: Converts documents into Markdown format, easily integrated with LLMs and text analysis pipelines.
- Marker: Supports Markdown, JSON, and HTML output while preserving tables, formulas, and other content.
- Docling: Provides a unified
DoclingDocumentrepresentation, supporting multi-format document parsing and structured export.
1.2 Integration with Generative AI Frameworks
All three tools support integration with generative AI frameworks to enhance document processing capabilities:
- MarkItDown: Integrates with Azure OpenAI to improve document and image processing.
- Marker: Supports leveraging large language model (LLM) technology to improve the accuracy of document processing.
- Docling: Compatible with frameworks like LangChain, LlamaIndex, and Haystack for agentic AI applications.
2. Aspose.Cells for Python via .NET Eklenti Entegrasyonu
Excel verilerini bu Yapay Zeka belge işleme araçlarıyla birleştirmek için her araç için özel eklentiler geliştirdik:
| Eklenti | Depo | İşlevsellik |
|---|---|---|
| MarkItDown Eklentisi | markitdown-aspose-cells-eklenti | Excel dosyalarını Markdown formatına dönüştürür. |
| Marker Eklentisi | marker eklentisi | Excel dosyalarını Marker destekli formatlara (Markdown, JSON veya HTML) dönüştürür, Marker’in LLM modunu kullanarak daha gelişmiş tablo sağlar. |
| Docling Eklentisi | docling eklentisi | Excel dosyalarını DoclingDocument nesnelerine dönüştürür, ardından Markdown, JSON veya HTML olarak dışa aktarır, çok modlu analiz için. |
2.1 Eklenti Avantajları
- Hızlı Excel Dönüşümü: Excel içeriğini hızla Markdown, JSON veya HTML’e dönüştürerek Yapay Zeka işlemleri için hazır hale getirir.
- Tablo ve Biçim Bilgisini Koruma: Temelde orijinal tablo verilerini koruyarak veri bütünlüğünü sağlar.
- Yapay Zeka Araçlarıyla Uyumluluk: MarkItDown, Marker veya Docling’e doğrudan giriş olarak kullanılabilir, gelişmiş çözümleme özelliklerinden yararlanır.
- Kolay Kurulum: Ek olarak, Aspose.Cells for Python via .NET(aspose-cells-python) kurulumu ve eklenti dizinlerindeki README talimatlarının izlenmesi yeterlidir.
3. Installation and Usage
3.1 MarkItDown Plugin
Install the plugin from the current directory:
pip install -e .
Kurulumu doğrula:
markitdown --list-plugins
Bir XLSX dosyasını eklenti kullanarak dönüştürün:
markitdown --use-plugins test.xlsx
3.2 Marker Eklentisi
Python 3.10+ ve PyTorch gerekebilir.
pip install marker-pdf
PDF olmayan belgeler için tam bağımlılıkları yükleyin:
pip install marker-pdf[full]
Tek bir dosya dönüştür:
marker_single /path/to/test.xlsx
marker_single /path/to/test.xlsx --output_format html
3.3 Docling Eklentisi
Docling’i yükleyin:
pip install -e .
Excel dosyalarını farklı formatlara dönüştürün:
docling /path/test.xlsx --to html
docling /path/test.xlsx --to md
docling /path/test.xlsx --to json
Daha fazla ayrıntılı yükleme talimatları belgelerde bulunmaktadır.
3.4 Aspose Lisansını Ayarla
Herhangi bir eklentide Aspose.Cells kullanmadan önce lisansı ayarlayın:
Windows (PowerShell):
$env:ASPOSE_LICENSE_PATH = "C:\path\to\license"
Windows (CMD):
set ASPOSE_LICENSE_PATH=C:\path\to\license
Unix tabanlı sistemler:
export ASPOSE_LICENSE_PATH="/path/to/license"
4. Özet
Yapay Zeka Özellikleri:
Üç araç, yapay zeka belge ayrıştırma, yapılandırılmış çıktı, çok modlu destek ve üretici yapay zeka çerçeveleriyle entegrasyonda ortak avantajlar paylaşır.
Aspose.Cells Eklentileri:
Excel verilerinin Markdown, JSON veya HTML’ye sorunsuz dönüştürülmesini sağlar, tabloları, formülleri koruyarak ve doğrudan MarkItDown, Marker veya Docling ile entegre edilir.
Kullanım Durumları:
Akıllı belge işleme, bilgi tabanı oluşturma, RAG sistemleri, rapor çözümleme, akademik belge dönüştürme ve diğer AI güdümlü iş akışları için idealdir.