v0.6.0

V6: Lokale KI, Bildgenerierung und Texterkennung

Lokale KI. Bildgenerierung. OCR. Diagrammbearbeitung. Und eine VS Code-ähnliche Benutzeroberfläche. V6 ist da.

Vysakh Sreenivasan

Sehen Sie Diwadi V6 in Aktion

Vor sechs Wochen haben wir V1 veröffentlicht. Jetzt sind wir bei V6—und dieses Release hebt Diwadi auf ein völlig neues Level. Führen Sie KI komplett offline mit lokalen LLMs aus, generieren Sie Bilder mit Stable Diffusion, extrahieren Sie Text aus Bildern und bearbeiten Sie Diagramme—alles ohne die App zu verlassen.

Was ist neu in V6

Unterstützung für lokale LLM

Führen Sie AI-Modelle vollständig offline mit llama.cpp aus. Vollständige Unterstützung für Tool-Aufrufe, damit die KI mit Ihren Dateien interagieren kann. Automatische Bereinigung bei Untätigkeit zur Ressourceneinsparung. Ihre Daten verlassen Ihren Rechner niemals – echte datenschutzorientierte KI.

KI-Bildgenerierung

Generieren Sie Bilder aus Textaufforderungen mit Stable Diffusion. Wählen Sie aus verfügbaren Modellen, passen Sie die Einstellungen an und erstellen Sie sofort Bilder. Die automatische Prozessverwaltung kümmert sich um alles im Hintergrund.

OCR und Diagrammbearbeitung

Text aus beliebigen Bildern mit integriertem OCR extrahieren. D2-Diagramme mit Live-Rendering bearbeiten. Mermaid-Diagramme in Echtzeit in der Vorschau anzeigen. Typst-Dokumente als PDF exportieren. Unterstützung für Intel Macs inklusive.

VS Code-ähnliche Titelleiste

Eine vollständig neu gestaltete Titelleiste inspiriert von VS Code. Verbesserte geteilte Ansichten für besseres Multitasking. Neues Benachrichtigungssystem, das weniger aufdringlich ist. Die App wirkt professioneller denn je.

Noch mehr Funktionen

7-Zip-Komprimierungsunterstützung. Apple Sign-In für nahtlose Authentifizierung. Untertitel suchen und ersetzen. Verbesserte PPTX- und DOCX-Verarbeitung. Einheitliches drag and drop in der gesamten App.

Windows-Ready Builds

V6 bringt verbesserte Windows-Unterstützung mit einsatzbereiten Builds. Die plattformübergreifende Kompatibilität ist besser denn je—das gleiche großartige Erlebnis auf macOS, Windows und Linux.

Die technischen Details

Vollständige llama.cpp-Integration mit Tool-Calling. Stable Diffusion-Pipeline mit automatischer Modellverwaltung. OCR angetrieben durch effiziente lokale Verarbeitung. D2- und Mermaid-Diagramm-Rendering. Typst zu PDF Export. Einheitliches Drag-Drop-System über alle Ansichten.

Die Zahlen

120+ Commits seit V5. 20+ Fehlerbehebungen. Drei KI-Engines (Cloud, lokales LLM, Bildgenerierung). Alles während die App leicht und schnell bleibt.

120+
Commits
6
Versionen
3
KI-Engines
20+
Fehlerbehebungen

Sechs Wochen Veröffentlichungen

V1 am 31. Oktober. V2 am 7. November. V3 am 14. November. V4 am 21. November. V5 am 28. November. V6 heute. Wir bauen öffentlich und veröffentlichen jede Woche. So baut man Software, die Menschen wirklich wollen.

Vollständiges Änderungsprotokoll anzeigen →

Sechs Versionen. Sechs Wochen. Lokale KI. Bildgenerierung. Laden Sie V6 jetzt herunter und erleben Sie die Zukunft der Desktop-Produktivität.

Diwadi V6 herunterladen

Vollständiges Änderungsprotokoll

Hauptfunktionen

  • Local LLM support with llama.cpp—run AI models completely offline
  • Full tool calling support for local LLMs
  • Auto cleanup when LLM is idle to save resources
  • AI image generation with Stable Diffusion integration
  • Multiple model support for image generation
  • OCR text extraction from images
  • D2 diagram rendering and editing
  • Mermaid diagram live preview
  • Typst preview and PDF export
  • 7-Zip compression support
  • Apple Sign-In authentication

Technische Verbesserungen

  • llama.cpp integration with proper process management
  • Stable Diffusion pipeline with automatic model downloads
  • OCR with auto compression for better performance
  • Intel Mac support for OCR features
  • Windows-ready builds with improved compatibility
  • Unified drag-drop system across all views
  • Improved PPTX and DOCX handling

Verbesserungen der Benutzeroberfläche

  • VS Code-style title bar design
  • Revamped split views for better multitasking
  • New notification system
  • Subtitle search and replace functionality
  • Improved drag-and-drop feedback
  • Better loading states throughout the app